AITNT-让一部分人先用AI实现商业化

赚钱，DeepSeek果然第一！全球六大顶级AI实盘厮杀，人手1万刀开局

给全球六大LLM各发1万美金，丢进同一真实市场实盘厮杀，会发生什么？这场大战从18日开始，截止目前，DeepSeek V3.1盈利超3500美元，Grok 4实力次之。不堪一提的是，Gemini 2.5 Pro成为赔得最惨的模型。

来自主题: AI资讯

10005 点击 2025-10-20 14:04

大模型 “准确率悬崖” 被证实，科学家发现模型单次处理容量上限，多智能体成破局关键

近日，来自阿联酋穆罕默德·本·扎耶德人工智能大学 MBZUAI 和保加利亚 INSAIT 研究所的研究人员发现一个针对大模型单次推理的“法诺式准确率上限”，借此不仅揭示了单次生成范式的根本性脆弱点，也揭示了“准确率悬崖”这一现象。

来自主题: AI技术研报

8469 点击 2025-10-20 14:02

谷歌新版Gemini马甲被扒! LMArena实测：唯一能看懂表的AI, GPT-5乱答

谷歌的Gemini 3.0疑似上线LMArena！众多实测提前曝光，但效果嘛，很难评。Gemini 3.0传了这么久，终于还是露出「马脚」了。依然还是LMAreana竞技场，Gemini 3.0的两个「马甲」被扒了出来。

来自主题: AI资讯

9180 点击 2025-10-20 12:40

AI打通第一/第三人称视觉，跨视角视觉理解新SOTA｜ICCV 2025 Highlight

具身智能落地迈出关键一步，AI拥有第一人称与第三人称的“通感”了！

来自主题: AI技术研报

9871 点击 2025-10-20 12:33

深度｜a16z合伙人：Agent 接管流量后，支撑大厂数万亿美元市值的广告商业模式正在崩坏，Costco的会员信任逻辑才是未来

搜索在变，交易在变，归因在变——AI 正在重写电商的底层逻辑。从“人找货”到“智能体替你理解、推荐、比价、下单”，消费者与平台之间的关系被彻底改写。过去二十年，互联网商业的三大支柱是：广告、订阅与电商。

来自主题: AI资讯

10041 点击 2025-10-20 12:26

超越纯视觉模型！不改VLM标准架构，实现像素级深度预测

Meta开源DepthLM，首证视觉语言模型无需改架构即可媲美纯视觉模型的3D理解能力。通过视觉提示、稀疏标注等创新策略，DepthLM精准完成像素级深度估计等任务，解锁VLM多任务处理潜力，为自动驾驶、机器人等领域带来巨大前景。

来自主题: AI技术研报

7848 点击 2025-10-20 12:19

教多模态大模型学会“反思”和“复盘”，上交&上海AI Lab重磅发布MM-HELIX&AHPO，破解多模态复杂推理难题

多模态大模型表现越来越惊艳，但人们也时常困于它的“耿直”。

来自主题: AI技术研报

8716 点击 2025-10-20 12:13

是RAG已死，还是RAG Anything，All in RAG？

每隔一阵子，总有人宣告“RAG已死”：上下文越来越长、端到端多模态模型越来越强，好像不再需要检索与证据拼装。但真正落地到复杂文档与可溯源场景，你会发现死掉的只是“只切文本的旧RAG”。

来自主题: AI技术研报

7395 点击 2025-10-20 12:08

有些时候真觉得，AI总结和“三分钟看电影”没啥区别。

我好像有点，越来越不喜欢AI总结这件事了。

来自主题: AI资讯

6933 点击 2025-10-20 11:59

无奖励也能把Agent练硬，Meta发布早期经验学习，隐式建模+反思（附提示词）

Meta提出早期经验（Early Experience）让代理在无奖励下从自身经验中学习：在专家状态上采样替代动作、执行并收集未来状态，将这些真实后果当作监督信号。核心是把“自己造成的未来状态”转为可规模化的监督。

来自主题: AI技术研报

9269 点击 2025-10-20 11:54

百度文心助手都成这样了

国庆不放假，国内AI厂商都在干嘛？百度：卷！

来自主题: AI资讯

8116 点击 2025-10-20 11:43

小红书又在消费类AI硬件出手了，这次押宝“AI+健康”

近日，云望创新智能（深圳）有限责任公司（简称：云望创新）宣布完成了A轮融资，投资方名单中，小红书旗下的薯能生巧科技（上海）有限公司与真格基金共同押注这家专注“AI+运动康复”的消费级硬件公司。

来自主题: AI资讯

10869 点击 2025-10-20 10:30

AI点外卖哪家强，美团LongCat团队做了个全面评测

美团LongCat团队发布了当前高度贴近真实生活场景、面向复杂问题的大模型智能体评测基准——VitaBench（Versatile Interactive Tasks Benchmark）。VitaBench以外卖点餐、餐厅就餐、旅游出行三大高频生活场景为典型载体，构建了一个包含66个工具的交互式评测环境，并设计了跨场景综合任务。

来自主题: AI技术研报

8015 点击 2025-10-20 10:13

英伟达4段简短提示词，IOI夺金！开源模型也能征服最难编程竞赛

OpenAI的封闭模型在IOI 2025竞赛夺金的同时，英伟达团队交出了一份同样令人振奋的答卷——他们利用完全开源的大模型和全新的GenCluster策略，在IOI 2025竞赛中跑出了媲美金牌选手的成绩！开源模型首次达到了IOI金牌水准。这究竟是怎样实现的？

来自主题: AI技术研报

8586 点击 2025-10-20 10:13

我在 iPhone 17 Pro Max 上跑 AI 模型，体验了一把十年前「越狱」的快乐

在 iPhone 上部署端侧 AI 模型，成了互联网的新显学。在 iPhone 上体验端侧模型，门槛其实不算高。打开 App Store，搜索 PocketPal AI，下载安装。如果不习惯英文界面，可以在设置 (Setting) 里找到语言 (Language) 选项，切换成中文。

来自主题: AI资讯

9520 点击 2025-10-19 22:11

Meta用40万个GPU小时做了一个实验，只为弄清强化学习Scaling Law

在 LLM 领域，扩大强化学习算力规模正在成为一个关键的研究范式。但要想弄清楚 RL 的 Scaling Law 具体是什么样子，还有几个关键问题悬而未决：如何 scale？scale 什么是有价值的？RL 真的能如预期般 scale 吗？

来自主题: AI技术研报

9672 点击 2025-10-19 17:54

GPT-5破解世纪难题，竟是上网抄来的！哈萨比斯：太尴尬了

GPT-5一场闹剧，让OpenAI出大糗了！让所有人都以为GPT-5破解了十道Erdos难题，没想到竟是查文献给出了答案。Hassabis点评，这太尴尬了。

来自主题: AI资讯

8798 点击 2025-10-19 16:13

马斯克发起编程人机大战！卡帕西说了不

拒绝世界首富是什么体验？卡帕西：这事我熟！刚刚，马斯克高调邀请卡帕西，与Grok 5来一场编程对决——就像当年的“卡斯帕罗夫大战深蓝”。

来自主题: AI资讯

9157 点击 2025-10-19 16:12

Lilian Weng最新对话：首谈离开OpenAI创业，以及AI研究的现实扭曲场

10月18日，在离开OpenAI，联合创办Thinking Machines后，Lilian Weng在硅谷难得地参加了一场公开对话。在这场华源Hysta2025年年会的炉边对谈里，她和主持人、硅谷知名投资人Connie Chan聊了聊她自己的研究经历、研究习惯、在OpenAI的研究思考和Thinking Machines 的发展方向。

来自主题: AI资讯

9080 点击 2025-10-19 16:11