AI资讯新闻榜单内容搜索-斯坦福

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 斯坦福
推理正确率下降65.5%!斯坦福、MIT等用「不等式」拷问AI逻辑极限

推理正确率下降65.5%!斯坦福、MIT等用「不等式」拷问AI逻辑极限

推理正确率下降65.5%!斯坦福、MIT等用「不等式」拷问AI逻辑极限

大语言模型在数学证明中常出现推理漏洞,如跳步或依赖特殊值。斯坦福等高校团队提出IneqMath基准,将不等式证明拆解为可验证的子任务。结果显示,模型的推理正确率远低于答案正确率,暴露出其在数学推理上的缺陷。

来自主题: AI技术研报
8073 点击    2025-06-23 14:41
对谈斯坦福 Biomni 作者黄柯鑫:AI Scientist 领域将出现 Cursor 级别的机会|Best Minds

对谈斯坦福 Biomni 作者黄柯鑫:AI Scientist 领域将出现 Cursor 级别的机会|Best Minds

对谈斯坦福 Biomni 作者黄柯鑫:AI Scientist 领域将出现 Cursor 级别的机会|Best Minds

随着语言模型在强化学习和 agentic 领域的进步,agent 正在从通用领域快速渗透到垂直领域,科学和生物医药这类高价值领域尤其受到关注。

来自主题: AI资讯
6538 点击    2025-06-21 18:43
AI哪怕答案正确,逻辑链却惨不忍睹,奥数级不等式证明成功率不到50%| 斯坦福&伯克利&MIT

AI哪怕答案正确,逻辑链却惨不忍睹,奥数级不等式证明成功率不到50%| 斯坦福&伯克利&MIT

AI哪怕答案正确,逻辑链却惨不忍睹,奥数级不等式证明成功率不到50%| 斯坦福&伯克利&MIT

大语言模型解决不等式证明问题时,可以给出正确答案,但大多数时候是靠猜。推理过程经不起推敲,逻辑完全崩溃。

来自主题: AI技术研报
5871 点击    2025-06-20 09:48
斯坦福最新研究:硅谷的AI创业潮,其实是一场大型的资源错配

斯坦福最新研究:硅谷的AI创业潮,其实是一场大型的资源错配

斯坦福最新研究:硅谷的AI创业潮,其实是一场大型的资源错配

2025年1月到5月间,斯坦福大学的研究团队完成了一项本应在AI热潮开始时就进行的调查。他们采访了1500名美国员工和52名AI专家,评估了104个职业中的844项具体任务。

来自主题: AI技术研报
6832 点击    2025-06-19 11:40
字节Seed提出序贯策略优化方法,突破同传“质量-延迟”权衡问题

字节Seed提出序贯策略优化方法,突破同传“质量-延迟”权衡问题

字节Seed提出序贯策略优化方法,突破同传“质量-延迟”权衡问题

为此,香港中文大学、字节跳动Seed和斯坦福大学研究团队出手,提出了一种面向同声传译的序贯策略优化框架 (Sequential Policy Optimization for Simultaneous Machine Translation, SeqPO-SiMT)。

来自主题: AI技术研报
6094 点击    2025-06-19 11:31
未来「含人量」多少,决定这工作值多少钱?斯坦福发布2025年重磅AI「工作内参」【附原版PDF】

未来「含人量」多少,决定这工作值多少钱?斯坦福发布2025年重磅AI「工作内参」【附原版PDF】

未来「含人量」多少,决定这工作值多少钱?斯坦福发布2025年重磅AI「工作内参」【附原版PDF】

你敢想象吗?你的工作“含人量”多少,决定你值多少钱?“含人量”是我首次创造的一个中文通俗词汇,用来转译论文核心概念“Human Agency Scale”,以后谁要引用,请注明出处是这里哈~

来自主题: AI技术研报
8174 点击    2025-06-19 10:31
98%医生点赞的AI队友,斯坦福实验揭秘:诊断准确率飙升10%!

98%医生点赞的AI队友,斯坦福实验揭秘:诊断准确率飙升10%!

98%医生点赞的AI队友,斯坦福实验揭秘:诊断准确率飙升10%!

AI从医疗工具变身为协作队友,斯坦福大学研究揭示:医生诊断准确率竟飙升10%!70名美国执业医生参与的真实测试,AI-first、AI-second与传统诊断,谁能更精准破解临床谜题?

来自主题: AI技术研报
5822 点击    2025-06-16 10:11
CVPR2025视频生成统一评估架构,上交x斯坦福联合提出让MLLM像人类一样打分

CVPR2025视频生成统一评估架构,上交x斯坦福联合提出让MLLM像人类一样打分

CVPR2025视频生成统一评估架构,上交x斯坦福联合提出让MLLM像人类一样打分

视频生成技术正以前所未有的速度革新着当前的视觉内容创作方式,从电影制作到广告设计,从虚拟现实到社交媒体,高质量且符合人类期望的视频生成模型正变得越来越重要。

来自主题: AI技术研报
5465 点击    2025-06-13 11:46