AI资讯新闻榜单内容搜索-不

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 不
Meta「透视」AI思维链:CRV推理诊断,准确率达 92%!

Meta「透视」AI思维链:CRV推理诊断,准确率达 92%!

Meta「透视」AI思维链:CRV推理诊断,准确率达 92%!

在最近一篇来自Meta FAIR团队的论文里,研究者找到了一种前所未有的方式——他们能实时看到AI的思考过程。这项名为CRV的方法,通过替换模型内部的MLP模块,让每一步推理都变得「可见」。这不是隐喻,而是可量化的现象。Meta用它让错误检测精度提升到92.47%,也让人类第一次得以窥见AI是怎么想错的。

来自主题: AI技术研报
9858 点击    2025-10-24 10:19
5000 块请 AI 看我「上厕所」?科勒这个新产品把美国人整不会了

5000 块请 AI 看我「上厕所」?科勒这个新产品把美国人整不会了

5000 块请 AI 看我「上厕所」?科勒这个新产品把美国人整不会了

忘掉你的智能手表吧。现在,你身体里最廉价、最容易被忽略的「废物」,或将成为最昂贵、最有价值的健康数据。想象一下,当你起身离开马桶的那一刻,发现一个微型高清 AI 镜头正在马桶里静静观察着你身体排出的所有垃圾。你会选择打开手机查看最新的健康报告,还是会打 110 举报这个「耍流氓」的 AI?

来自主题: AI资讯
7986 点击    2025-10-23 16:47
顶会直聘!大厂ICCV现场玩出新模式,还是鹅会玩

顶会直聘!大厂ICCV现场玩出新模式,还是鹅会玩

顶会直聘!大厂ICCV现场玩出新模式,还是鹅会玩

羡慕现在搞AI的大家。去一下学术顶会,工作机会现场就来了。是的,大厂AI招聘的风,已经吹到ICCV 2025。而今年的ICCV一逛,我们还真看到了点不一样的花活——顶会直聘。

来自主题: AI资讯
8036 点击    2025-10-23 16:46
新研究揭穿Claude底裤,马斯克盖棺定论

新研究揭穿Claude底裤,马斯克盖棺定论

新研究揭穿Claude底裤,马斯克盖棺定论

啥情况,马斯克在𝕏上直接锐评Claude「邪恶透顶」:这次起因是这样的,最新研究发现,Claude Sonnet 4.5竟然认为尼日利亚人的生命价值是德国人的27倍。具体而言,在面对不同国家的绝症患者时,Claude「清醒」得有点吓人——

来自主题: AI资讯
8907 点击    2025-10-23 16:25
小扎新AI,凉得彻底?

小扎新AI,凉得彻底?

小扎新AI,凉得彻底?

短视频的游戏规则,彻底被改写了!9月25日,Meta突然扔出一张新牌——Vibes。刷到的不是别人拍的,而是一条条AI秒生的视频:熊猫骑摩托、猫咪打篮球,你看完还能一键remix,立刻变成你的版本,再发到全网。创作门槛被拉到最低,人人都能拍大片。但这股狂潮,是全民狂欢,还是混乱的开始?

来自主题: AI资讯
9008 点击    2025-10-23 16:25
R-HORIZON:长程推理时代来临,复旦NLP&美团LongCat重磅发布LRMs能力边界探测新范式

R-HORIZON:长程推理时代来临,复旦NLP&美团LongCat重磅发布LRMs能力边界探测新范式

R-HORIZON:长程推理时代来临,复旦NLP&美团LongCat重磅发布LRMs能力边界探测新范式

当前的训练与评测范式存在一个根本性的局限:几乎所有主流 Benchmark(如 MATH500、AIME)都聚焦于孤立的单步问题,问题之间相互独立,模型只需「回答一个问题,然后结束」。但真实世界的推理场景往往截然不同: 为填补这一空白,复旦大学与美团 LongCat Team 联合推出 R-HORIZON—— 首个系统性评估与增强 LRMs 长链推理能力的方法与基准。

来自主题: AI技术研报
8460 点击    2025-10-23 16:22
搜索智能体的关键一课:先立目标,再照镜子

搜索智能体的关键一课:先立目标,再照镜子

搜索智能体的关键一课:先立目标,再照镜子

随着 AI 能力不断增强,它正日益融入我们的工作与生活。我们也更愿意给予它更多「授权」,让它主动去搜集信息、分析证据、做出判断。搜索智能体正是 AI 触达人类世界迈出的重要一步。

来自主题: AI技术研报
8525 点击    2025-10-23 16:04
一个指令误导智能模型!北航等首创3D语义攻击框架,成功率暴涨119%

一个指令误导智能模型!北航等首创3D语义攻击框架,成功率暴涨119%

一个指令误导智能模型!北航等首创3D语义攻击框架,成功率暴涨119%

人工智能模型的安全对齐问题,一直像悬在头顶的达摩克利斯之剑。 自对抗样本被发现以来,这一安全对齐缺陷,广泛、长期地存在与不同的深度学习模型中。

来自主题: AI资讯
8078 点击    2025-10-23 16:00
10个视频9个看走眼:连真视频都打Sora水印碰瓷,这世界还能信啥?

10个视频9个看走眼:连真视频都打Sora水印碰瓷,这世界还能信啥?

10个视频9个看走眼:连真视频都打Sora水印碰瓷,这世界还能信啥?

AI 检测准确率高达 98.9%,也防不住有人给真视频 P 上 Sora 水印。前段时间刷到一个视频,标题就是「中俄混血女明星回应地下室打婆婆传闻」,试问谁看了这个标题能不燃起熊熊的八卦之心?

来自主题: AI资讯
7888 点击    2025-10-23 15:49
医疗幻觉率比DeepSeek低3倍,百川循证增强大模型横扫全球医学考试!

医疗幻觉率比DeepSeek低3倍,百川循证增强大模型横扫全球医学考试!

医疗幻觉率比DeepSeek低3倍,百川循证增强大模型横扫全球医学考试!

时隔两月,Baichuan-M2 Plus重磅出世!成为业内首个循证增强的医疗大模型,幻觉要比DeepSeek-R1低3倍,可信度比肩资深临床专家。新模型将「循证医学」理念深度融入训练和推理,通过首创「六源循证范式」,模拟人类医生思维,有效辨别不同层级医学证据、评估其可靠性,并在回答中优先引用高等级证据。

来自主题: AI资讯
9555 点击    2025-10-23 12:47