AI技术研报-这里有最前沿的人工智能技术解读

大模型被确诊「视觉文盲」！多校联合提出MILO，为它植入空间想象力

大模型总是无法理解空间，就像我们难以想象四维世界。

来自主题: AI技术研报

8258 点击 2025-12-05 10:07

DeepSeek-V3.2巨「吃」Token，竟然是被GRPO背刺了

DeepSeek 一发布模型，总会引起业内的高度关注与广泛讨论，但也不可避免的暴露出一些小 Bug。

来自主题: AI技术研报

6649 点击 2025-12-05 10:05

超越π0.5，复旦团队首创「世界模型+具身训练+强化学习」闭环框架

Vision–Language–Action（VLA）策略正逐渐成为机器人迈向通用操作智能的重要技术路径：这类策略能够在统一模型内同时处理视觉感知、语言指令并生成连续控制信号。

来自主题: AI技术研报

9271 点击 2025-12-05 09:27

Code LLM全景综述，从LLM到Agent，全文长303页，北航阿里字节等12家机构联合撰写｜最新

这篇论文由北京航空航天大学、阿里巴巴、字节跳动、上海人工智能实验室等几十家顶尖机构联合撰写，全文长达303页，是对当前“代码大模型（Code LLMs）”领域最详尽的百科全书式指南。

来自主题: AI技术研报

11601 点击 2025-12-05 09:24

语义+R-Tree空间索引：Milvus如何帮外卖APP做3公里内美食推荐| Milvus Week

本文为Milvus Week系列第三篇，该系列旨在分享Milvus的创新与实践成果，以下是DAY3内容划重点： Milvus2.6中，Zilliz借助Geolocation Index for Milvus，首次将地理空间数据与向量检索融合，使 AI 可以在理解语义的同时，理解空间。

来自主题: AI技术研报

10574 点击 2025-12-05 09:22

首个英文原生「弱智吧」！逻辑谬误数据集与生成框架来了 | AAAI'26

最近研究发现，大模型在判断逻辑谬误时容易「想太多」，误报正常句子，但在确定有谬误后，其分类能力较强。研究人员构建了首个高质量英文逻辑谬误基准SMARTYPAT-BENCH，并开发了基于Prolog的逻辑谬误自动生成框架SMARTYPAT，为大模型逻辑能力评估提供新思路，可用于谬误识别、辩论教育等领域。

来自主题: AI技术研报

9627 点击 2025-12-05 09:19

从MiniMax到DeepSeek：为何头部大模型都在押注「交错思维」？

昨日，有位推特博主晒出了国内几大开源模型在轻量级软件工程 Agent 基准测试 mini-SWE-agent 上的成绩。该基准主要测试大模型在真实软件开发任务中的多步推理、环境交互和工程化能力。

来自主题: AI技术研报

9630 点击 2025-12-04 16:25

无需训练的3D生成加速新思路：西湖大学提出Fast3Dcache

在AIGC的浪潮中，3D生成模型（如TRELLIS）正以惊人的速度进化，生成的模型越来越精细。然而，“慢”与计算量大依然是制约其大规模应用的最大痛点。复杂的去噪过程、庞大的计算量，让生成一个高质量3D资产往往需要漫长的等待。

来自主题: AI技术研报

6875 点击 2025-12-04 15:02

挑战ReAct！MetaGPT团队提出ReCode智能体新范式

想象你在准备早餐：你不会先写一份详细到「左手抓鸡蛋、右手拿碗、手腕旋转 45 度敲击蛋壳」这样的清单，也不会只有一个笼统的计划叫「做个早餐」，然后不知所措。

来自主题: AI技术研报

7954 点击 2025-12-04 15:01

DeepSeek V3.2爆火，Agentic性能暴涨40%解密

DeepSeek V3.2的Agentic能力大增，离不开这项关键机制：Interleaved Thinking（交错思维链）。Interleaved Thinking风靡开源社区背后，离不开另一家中国公司的推动。

来自主题: AI技术研报

8453 点击 2025-12-04 14:58

老外傻眼！明用英文提问，DeepSeek依然坚持中文思考

就在前天，DeepSeek 一口气上新了两个新模型，DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。

来自主题: AI技术研报

8409 点击 2025-12-04 11:37

2027年，人类最后一次抉择！Anthropic发布内部深度调查《AI如何改变工作》

2027年将是人类命运的关键节点！Anthropic首席科学家Jared Kaplan预警，人类将在2027至2030年面临是否允许AI进行递归自我进化的终极抉择。Anthropic最新发布（12月3日）的内部深度调查《AI如何改变工作》，正在揭示这场宏大叙事下微观个体的命运——工程师的「空心化」和学徒制的崩溃。

来自主题: AI技术研报

9236 点击 2025-12-04 11:03

GPT-5-Thinking新训练方法公开：让AI学会忏悔

OpenAI搞了个新活：让ChatGPT自己“坦白从宽”。

来自主题: AI技术研报

8899 点击 2025-12-04 10:58

后生可畏！何恺明团队新成果发布，共一清华姚班大二在读

继今年5月提出MeanFlow (MF) 之后，何恺明团队于近日推出了最新的改进版本—— Improved MeanFlow (iMF)，iMF成功解决了原始MF在训练稳定性、指导灵活性和架构效率上的三大核心问题。

来自主题: AI技术研报

6202 点击 2025-12-04 10:30

突破具身智能任务规划边界，刷新具身大脑多榜单SOTA，中兴EmbodiedBrain模型让具身大脑学会「复杂规划」

在人工通用智能（AGI）的探索征程中，具身智能 Agents 作为连接数字认知与物理世界的关键载体，其核心价值在于能够在真实物理环境中实现稳健的空间感知、高效的任务规划与自适应的执行闭环。

来自主题: AI技术研报

9614 点击 2025-12-04 10:27

斯坦福用一句Prompt就结束了提示工程。。。

最近口述采样很火。如果您经常使用经过“对齐”训练（如RLHF）的LLM，您可能已经注意到一个现象：模型虽然变得听话、安全了，但也变得巨“无聊”。

来自主题: AI技术研报

6422 点击 2025-12-04 10:25

突破AI记忆瓶颈，耶鲁博士新成果破解阅读失忆难题

当你阅读《红楼梦》《哈利·波特》《百年孤独》等长篇小说时，读着读着可能就忘记前面讲了什么，有时还会搞混人物关系。AI 在阅读长文章的时候也存在类似问题，当文章太长时它也会卡主，要么读得特别慢，要么记不住前面的内容。

来自主题: AI技术研报

8558 点击 2025-12-04 10:23

人形机器人控制新突破！敏捷稳定两不误，一个策略让人形机器人完成叶问蹲和跳舞｜港大&英伟达&清华

叶问蹲、跳舞、跑步，一个策略全搞定！

来自主题: AI技术研报

7385 点击 2025-12-04 10:00

从 LLM 到 World Model：为什么我们需要能理解并操作世界的空间智能？

如今 LLM 的语言理解与生成能力已展现出惊人的广泛适用性，但随着 LLM 的发展，一个事实越发凸显：仅靠语言，仍不足以支撑真正的智能。

来自主题: AI技术研报

10302 点击 2025-12-04 09:57

当Gemini 3刷屏时，这款AI已开始救命了：原子级攻克「不可成药」靶点

医药圈彻底炸了！全网都在玩Gemini，却没看到生物学界再现「AlphaFold时刻」。

来自主题: AI技术研报

10927 点击 2025-12-03 16:08

为什么给机器人装上昂贵的触觉传感器，反而让它变笨了？

这项工作由伊利诺伊大学香槟分校 (UIUC)、哈佛大学、哥伦比亚大学和麻省理工学院 (MIT) 的合作完成。

来自主题: AI技术研报

10142 点击 2025-12-03 15:12

句子级溯源+生成式归因，C²-Cite重塑大模型可信度

在人工智能快速发展的今天,大语言模型已经深入到我们工作和生活的方方面面。然而,如何让AI生成的内容更加可信、可追溯, 一直是学术界和工业界关注的焦点问题。想象一下,当你向ChatGPT提问时,它不仅给出答案,还能像学术论文一样标注每句话的信息来源——这就是"溯源大语言模型"要解决的核心问题。

来自主题: AI技术研报

6246 点击 2025-12-03 10:44

Struct Array 如何让多向量检索返回完整实体？知识库、电商、视频通用|Milvus Week

本文为Milvus Week系列第二篇，该系列旨在分享Zilliz、Milvus在系统性能、索引算法和云原生架构上的创新与实践，以下是DAY2内容划重点： Struct Array + MAX_SIM ，能够让数据库看懂 “多向量组成一个实体” 的逻辑，进而原生返回业务要的完整结果

来自主题: AI技术研报

9508 点击 2025-12-03 10:43

AI 社交增长范式重构：“价值重估”与市场分化

上周，X博士发布了《中国In-App AI生态演进》报告，揭示了国内移动互联网下半场关于“意图主权”的隐秘争夺。今天，X博士将目光投向更广阔的全球赛道——《ChatGPT“嵌入”社交链：AI社交从“

来自主题: AI技术研报

8619 点击 2025-12-03 10:15

迎接「万物皆可RAG」时代：最新综述展示50多种多模态组合的巨大待探索空间

大模型最广泛的应用如 ChatGPT、Deepseek、千问、豆包、Gemini 等通常会连接互联网进行检索增强生成（RAG）来产生用户问题的答案。随着多模态大模型（MLLMs）的崛起，大模型的主流技术之一 RAG 迅速向多模态发展，形成多模态检索增强生成（MM-RAG）这个新兴领域。ChatGPT、千问、豆包、Gemini 都开始允许用户提供文字、图片等多种模态的输入。

来自主题: AI技术研报

6941 点击 2025-12-03 09:54