AI资讯新闻榜单内容搜索-训练

斯坦福实测GPT-5与Claude 4.5“双盲实验。AI编程，没有协作类产品的原因找到了

为什么在LLM推理能力大幅跃升的2026，我们依然只有AI Copilot而没有AI Teammate？尽管AI编程工具遍地开花，但不管是Claude Code还是Codex，本质上仍是“单Agent开发”或“主从控制”架构。而“AI结对编程”迟迟无法落地？

来自主题: AI技术研报

7856 点击 2026-01-29 10:10

RAG优化不抓瞎！Milvus检索可视化，帮你快速定位嵌入、切块、索引哪有问题

最近，在GitHub上发现一个宝藏项目Project_Golem 。

来自主题: AI技术研报

9755 点击 2026-01-29 10:08

字节跳动李航博士新作：AI智能体的通用框架

AI 智能体是人工智能领域的重要研究方向之一。近期，字节跳动的李航博士在我国计算机科学领域顶级期刊 Journal of Computer Science and Technology（JCST）上发表了一篇题为《General Framework of AI Agents》的观点论文（将收录于 JCST 创刊 40 周年专辑），提出了一个涵盖软件智能体和硬件智能体的通用框架。

来自主题: AI技术研报

8125 点击 2026-01-29 10:07

AAAI 2026 Oral | SplatSSC：解耦深度引导的高斯泼溅，开启单目语义场景补全高效新范式

单目 3D 语义场景补全 (Semantic Scene Completion, SSC) 是具身智能与自动驾驶领域的一项核心技术，其目标是仅通过单幅图像预测出场景的密集几何结构与语义标签。

来自主题: AI技术研报

9214 点击 2026-01-28 14:58

比人类专家快2倍，斯坦福联合英伟达发布TTT-Discover：用「测试时强化学习」攻克科学难题

在技术如火如荼发展的当下，业界常常在思考一个问题：如何利用 AI 发现科学问题的新最优解？

来自主题: AI技术研报

10233 点击 2026-01-28 14:55

曾在一线手搓材料，如今他要为每家企业配一位AI CTO | 专访律动造物谢童

在 AI 浪潮席卷全球的今天，大模型在写诗、作画、敲代码上已经展现出惊人的天赋。然而，在面对严谨、硬核的物质科学（物理、化学、材料）时，却常常表现得像个“偏科生”：它们能侃侃而谈化学理论，却在最基础的分子式、晶体结构书写和反应推理上频繁出现不稳定输出：说的像那么回事，写出来却漏洞百出。

来自主题: AI技术研报

6165 点击 2026-01-28 14:54

Agent 真正的护城河，正在从工具转向记忆资产

2026 刚开年，Anthropic 就用 Claude Cowork 开启了 AI 行业新的创业热点。

来自主题: AI资讯

6342 点击 2026-01-28 10:16

「熟悉的陌生人」才是「好老师」？复旦提出简单指标，找出推理蒸馏中真正有教学价值的数据

什么样的思维链，能「教会」学生更好地推理？

来自主题: AI技术研报

9560 点击 2026-01-28 10:15

You are a helpful assistant只是高维空间中的一个脆弱坐标。牛津Anthropic联合发布

我们都在System Prompt里写过无数次 You are a helpful assistant，但你是否想过：这行文字在模型的残差流（Residual Stream）中究竟对应着怎样的几何结构？

来自主题: AI技术研报

6893 点击 2026-01-28 10:15

大模型哪里出问题、怎么修，这篇可解释性综述一次讲清

过去几年，机制可解释性（Mechanistic Interpretability）让研究者得以在 Transformer 这一 “黑盒” 里追踪信息如何流动、表征如何形成：从单个神经元到注意力头，再到跨层电路。但在很多场景里，研究者真正关心的不只是 “模型为什么这么答”，还包括 “能不能更稳、更准、更省，更安全”。

来自主题: AI技术研报

10487 点击 2026-01-28 10:13