AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
GPT-5惨遭零分打脸,顶级AI全军覆没!奥特曼AI博士级能力神话破灭

GPT-5惨遭零分打脸,顶级AI全军覆没!奥特曼AI博士级能力神话破灭

GPT-5惨遭零分打脸,顶级AI全军覆没!奥特曼AI博士级能力神话破灭

顶级大模型在AAI提出的FormulaOne基准集体翻车:三层难度递进,GPT-5进阶题仅约4%正确,最深层零分;Grok 4、o3 Pro全部失手。该基准以图上MSO逻辑与动态规划生成问题,贴近路径规划等现实优化,旨在衡量超越竞赛编程的算法推理深度。

来自主题: AI技术研报
5681 点击    2025-09-17 09:30
1个 AI Agent=4个工厂老师傅?|和王筱圃聊时序大模型和 toB Agent 这门生意

1个 AI Agent=4个工厂老师傅?|和王筱圃聊时序大模型和 toB Agent 这门生意

1个 AI Agent=4个工厂老师傅?|和王筱圃聊时序大模型和 toB Agent 这门生意

本周,我们关注 Agent 与工业结合正在发生的变化,我们邀请研发时序大模型 Geegobyte-g1 以及工业智能体平台「河谷」的初创企业极峰科技的创始人王筱圃,和我们聊一聊什么是时序大模型,和大语言模型的区别和具体的案例,他们如何训练一个 Agent 并把它卖给企业投入到生产流程中。希望能对大家了解 AI Agent 如何应用于工业生产有所帮助。

来自主题: AI资讯
6283 点击    2025-09-17 09:29
只要科学任务能打分,AI就能实现SOTA结果 | 谷歌最新论文

只要科学任务能打分,AI就能实现SOTA结果 | 谷歌最新论文

只要科学任务能打分,AI就能实现SOTA结果 | 谷歌最新论文

只要科学任务可以评分,AI就能找到超越人类专家的方法,实现SOTA结果? 这是谷歌一篇最新论文里的内容: 使用大模型+树搜索,让AI大海捞针就行。

来自主题: AI技术研报
6642 点击    2025-09-17 09:29
反转!LeCun刚转发「全球最快开源推理模型」,ETH苏黎世就直接打假

反转!LeCun刚转发「全球最快开源推理模型」,ETH苏黎世就直接打假

反转!LeCun刚转发「全球最快开源推理模型」,ETH苏黎世就直接打假

上周,福布斯、Wired等争相报道「全球最快开源推理模型」K2-Think,,甚至图灵奖得主Yann LeCun转发推文。但仅三天后,ETH五位研究员的博客如晴天霹雳:87数学评估题竟藏在训练集中!这不仅仅是技术突破,更是行业诚信的警钟。

来自主题: AI资讯
6367 点击    2025-09-16 16:16
宇树:开源机器人世界大模型!

宇树:开源机器人世界大模型!

宇树:开源机器人世界大模型!

一觉醒来,宇树带着最新开源模型来了!这次开源的是一个世界模型-动作架构,名叫UnifoLM-WMA-0。它的核心之处在于拥有一个世界模型能够理解机器人和环境相互作用时的物理规律。

来自主题: AI技术研报
6178 点击    2025-09-16 16:07
马斯克周末血裁xAI 500人

马斯克周末血裁xAI 500人

马斯克周末血裁xAI 500人

什么情况,帮马斯克训练大模型的人说失业就失业了?上周四晚,xAI内部上演了一场突袭测试,还要求员工必须在第二天早上之前完成并提交。这可不是一次简单的随堂测试——截至目前,本次xAI内部测试的淘汰率高达33%,已有超过500名员工被通知卷铺盖走人。

来自主题: AI资讯
5588 点击    2025-09-16 16:02
LLM会梦到AI智能体吗?不,是睡着了也要加班

LLM会梦到AI智能体吗?不,是睡着了也要加班

LLM会梦到AI智能体吗?不,是睡着了也要加班

人类的大脑,会在梦里筛选记忆。如今,AI也开始学会在「睡眠」中整理、保存,甚至遗忘。Bilt部署数百万智能体,让科幻小说里的设问——「仿生人会梦见电子羊吗?」——逐步成真。那么,当AI也能选择忘记时,它会变得更像人,还是更陌生?

来自主题: AI资讯
6599 点击    2025-09-16 15:55
Z Potentials|对话质变科技CEO离哲:大模型决定上半场,数据和工程能力决定下半场

Z Potentials|对话质变科技CEO离哲:大模型决定上半场,数据和工程能力决定下半场

Z Potentials|对话质变科技CEO离哲:大模型决定上半场,数据和工程能力决定下半场

在大厂内部“从0到1”推动并构建数据基础设施十余年之后,离哲选择走向台前,开启一场真正意义上的“从技术到产品、从产品到服务闭环”的创业实验。

来自主题: AI资讯
5791 点击    2025-09-16 15:48
谁说Scaling Law到头了?新研究:每一步的微小提升会带来指数级增长

谁说Scaling Law到头了?新研究:每一步的微小提升会带来指数级增长

谁说Scaling Law到头了?新研究:每一步的微小提升会带来指数级增长

很多人认为,Scaling Law 正在面临收益递减,因此继续扩大计算规模训练模型的做法正在被质疑。最近的观察给出了不一样的结论。研究发现,哪怕模型在「单步任务」上的准确率提升越来越慢,这些小小的进步叠加起来,也能让模型完成的任务长度实现「指数级增长」,而这一点可能在现实中更有经济价值。

来自主题: AI技术研报
5573 点击    2025-09-16 15:15
GPT-5-Codex 一手实测

GPT-5-Codex 一手实测

GPT-5-Codex 一手实测

OpenAI 刚刚推出了新的编程模型 GPT-5 Codex,见前文:刚刚,OpenAI 发布 GPT‑5-Codex 新模型,专为编程而生

来自主题: AI产品测评
5951 点击    2025-09-16 12:30