AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
从MiniMax到DeepSeek:为何头部大模型都在押注「交错思维」?

从MiniMax到DeepSeek:为何头部大模型都在押注「交错思维」?

从MiniMax到DeepSeek:为何头部大模型都在押注「交错思维」?

昨日,有位推特博主晒出了国内几大开源模型在轻量级软件工程 Agent 基准测试 mini-SWE-agent 上的成绩。该基准主要测试大模型在真实软件开发任务中的多步推理、环境交互和工程化能力。

来自主题: AI技术研报
8501 点击    2025-12-04 16:25
无需训练的3D生成加速新思路:西湖大学提出Fast3Dcache

无需训练的3D生成加速新思路:西湖大学提出Fast3Dcache

无需训练的3D生成加速新思路:西湖大学提出Fast3Dcache

在AIGC的浪潮中,3D生成模型(如TRELLIS)正以惊人的速度进化,生成的模型越来越精细。然而,“慢”与计算量大依然是制约其大规模应用的最大痛点。复杂的去噪过程、庞大的计算量,让生成一个高质量3D资产往往需要漫长的等待。

来自主题: AI技术研报
5928 点击    2025-12-04 15:02
挑战ReAct!MetaGPT团队提出ReCode智能体新范式

挑战ReAct!MetaGPT团队提出ReCode智能体新范式

挑战ReAct!MetaGPT团队提出ReCode智能体新范式

想象你在准备早餐:你不会先写一份详细到「左手抓鸡蛋、右手拿碗、手腕旋转 45 度敲击蛋壳」这样的清单,也不会只有一个笼统的计划叫「做个早餐」,然后不知所措。

来自主题: AI技术研报
7079 点击    2025-12-04 15:01
DeepSeek V3.2爆火,Agentic性能暴涨40%解密

DeepSeek V3.2爆火,Agentic性能暴涨40%解密

DeepSeek V3.2爆火,Agentic性能暴涨40%解密

DeepSeek V3.2的Agentic能力大增,离不开这项关键机制:Interleaved Thinking(交错思维链)。Interleaved Thinking风靡开源社区背后,离不开另一家中国公司的推动。

来自主题: AI技术研报
7589 点击    2025-12-04 14:58
老外傻眼!明用英文提问,DeepSeek依然坚持中文思考

老外傻眼!明用英文提问,DeepSeek依然坚持中文思考

老外傻眼!明用英文提问,DeepSeek依然坚持中文思考

就在前天,DeepSeek 一口气上新了两个新模型,DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。

来自主题: AI技术研报
7594 点击    2025-12-04 11:37
2027年,人类最后一次抉择!Anthropic发布内部深度调查《AI如何改变工作》

2027年,人类最后一次抉择!Anthropic发布内部深度调查《AI如何改变工作》

2027年,人类最后一次抉择!Anthropic发布内部深度调查《AI如何改变工作》

2027年将是人类命运的关键节点!Anthropic首席科学家Jared Kaplan预警,人类将在2027至2030年面临是否允许AI进行递归自我进化的终极抉择。Anthropic最新发布(12月3日)的内部深度调查《AI如何改变工作》,正在揭示这场宏大叙事下微观个体的命运——工程师的「空心化」和学徒制的崩溃。

来自主题: AI技术研报
7978 点击    2025-12-04 11:03
GPT-5-Thinking新训练方法公开:让AI学会忏悔

GPT-5-Thinking新训练方法公开:让AI学会忏悔

GPT-5-Thinking新训练方法公开:让AI学会忏悔

OpenAI搞了个新活:让ChatGPT自己“坦白从宽”。

来自主题: AI技术研报
8219 点击    2025-12-04 10:58
后生可畏!何恺明团队新成果发布,共一清华姚班大二在读

后生可畏!何恺明团队新成果发布,共一清华姚班大二在读

后生可畏!何恺明团队新成果发布,共一清华姚班大二在读

继今年5月提出MeanFlow (MF) 之后,何恺明团队于近日推出了最新的改进版本—— Improved MeanFlow (iMF),iMF成功解决了原始MF在训练稳定性、指导灵活性和架构效率上的三大核心问题。

来自主题: AI技术研报
5354 点击    2025-12-04 10:30
突破具身智能任务规划边界,刷新具身大脑多榜单SOTA,中兴EmbodiedBrain模型让具身大脑学会「复杂规划」

突破具身智能任务规划边界,刷新具身大脑多榜单SOTA,中兴EmbodiedBrain模型让具身大脑学会「复杂规划」

突破具身智能任务规划边界,刷新具身大脑多榜单SOTA,中兴EmbodiedBrain模型让具身大脑学会「复杂规划」

在人工通用智能(AGI)的探索征程中,具身智能 Agents 作为连接数字认知与物理世界的关键载体,其核心价值在于能够在真实物理环境中实现稳健的空间感知、高效的任务规划与自适应的执行闭环。

来自主题: AI技术研报
8809 点击    2025-12-04 10:27
斯坦福用一句Prompt就结束了提示工程。。。

斯坦福用一句Prompt就结束了提示工程。。。

斯坦福用一句Prompt就结束了提示工程。。。

最近口述采样很火。如果您经常使用经过“对齐”训练(如RLHF)的LLM,您可能已经注意到一个现象:模型虽然变得听话、安全了,但也变得巨“无聊”。

来自主题: AI技术研报
5489 点击    2025-12-04 10:25
突破AI记忆瓶颈,耶鲁博士新成果破解阅读失忆难题

突破AI记忆瓶颈,耶鲁博士新成果破解阅读失忆难题

突破AI记忆瓶颈,耶鲁博士新成果破解阅读失忆难题

当你阅读《红楼梦》《哈利·波特》《百年孤独》等长篇小说时,读着读着可能就忘记前面讲了什么,有时还会搞混人物关系。AI 在阅读长文章的时候也存在类似问题,当文章太长时它也会卡主,要么读得特别慢,要么记不住前面的内容。

来自主题: AI技术研报
7737 点击    2025-12-04 10:23
从 LLM 到 World Model:为什么我们需要能理解并操作世界的空间智能?

从 LLM 到 World Model:为什么我们需要能理解并操作世界的空间智能?

从 LLM 到 World Model:为什么我们需要能理解并操作世界的空间智能?

如今 LLM 的语言理解与生成能力已展现出惊人的广泛适用性,但随着 LLM 的发展,一个事实越发凸显:仅靠语言,仍不足以支撑真正的智能。

来自主题: AI技术研报
9091 点击    2025-12-04 09:57
为什么给机器人装上昂贵的触觉传感器,反而让它变笨了?

为什么给机器人装上昂贵的触觉传感器,反而让它变笨了?

为什么给机器人装上昂贵的触觉传感器,反而让它变笨了?

这项工作由伊利诺伊大学香槟分校 (UIUC)、哈佛大学、哥伦比亚大学和麻省理工学院 (MIT) 的合作完成 。

来自主题: AI技术研报
9395 点击    2025-12-03 15:12
句子级溯源+生成式归因,C²-Cite重塑大模型可信度

句子级溯源+生成式归因,C²-Cite重塑大模型可信度

句子级溯源+生成式归因,C²-Cite重塑大模型可信度

在人工智能快速发展的今天,大语言模型已经深入到我们工作和生活的方方面面。然而,如何让AI生成的内容更加可信、可追溯, 一直是学术界和工业界关注的焦点问题。想象一下,当你向ChatGPT提问时,它不仅给出答案,还能像学术论文一样标注每句话的信息来源——这就是"溯源大语言模型"要解决的核心问题。

来自主题: AI技术研报
5442 点击    2025-12-03 10:44
Struct Array 如何让多向量检索返回完整实体?知识库、电商、视频通用|Milvus Week

Struct Array 如何让多向量检索返回完整实体?知识库、电商、视频通用|Milvus Week

Struct Array 如何让多向量检索返回完整实体?知识库、电商、视频通用|Milvus Week

本文为Milvus Week系列第二篇,该系列旨在分享Zilliz、Milvus在系统性能、索引算法和云原生架构上的创新与实践,以下是DAY2内容划重点: Struct Array + MAX_SIM ,能够让数据库看懂 “多向量组成一个实体” 的逻辑,进而原生返回业务要的完整结果

来自主题: AI技术研报
8649 点击    2025-12-03 10:43
AI 社交增长范式重构:“价值重估”与市场分化

AI 社交增长范式重构:“价值重估”与市场分化

AI 社交增长范式重构:“价值重估”与市场分化

上周,X博士发布了《中国In-App AI生态演进》报告,揭示了国内移动互联网下半场关于“意图主权”的隐秘争夺。 今天,X博士将目光投向更广阔的全球赛道——《ChatGPT“嵌入”社交链:AI社交从“

来自主题: AI技术研报
7671 点击    2025-12-03 10:15
迎接「万物皆可RAG」时代:最新综述展示50多种多模态组合的巨大待探索空间

迎接「万物皆可RAG」时代:最新综述展示50多种多模态组合的巨大待探索空间

迎接「万物皆可RAG」时代:最新综述展示50多种多模态组合的巨大待探索空间

大模型最广泛的应用如 ChatGPT、Deepseek、千问、豆包、Gemini 等通常会连接互联网进行检索增强生成(RAG)来产生用户问题的答案。随着多模态大模型(MLLMs)的崛起,大模型的主流技术之一 RAG 迅速向多模态发展,形成多模态检索增强生成(MM-RAG)这个新兴领域。ChatGPT、千问、豆包、Gemini 都开始允许用户提供文字、图片等多种模态的输入。

来自主题: AI技术研报
5928 点击    2025-12-03 09:54
解读CUDA

解读CUDA

解读CUDA

“既然我可以直接使用 PyTorch,为什么还要费心使用 CUDA 呢?”

来自主题: AI技术研报
8754 点击    2025-12-03 09:51
arXiv禁用AI,糊涂!18所高校联合发布首个AI科研评审平台

arXiv禁用AI,糊涂!18所高校联合发布首个AI科研评审平台

arXiv禁用AI,糊涂!18所高校联合发布首个AI科研评审平台

arXiv最新政策禁止直接接收未经同行评审的综述和立场论文,以应对AI生成论文的泛滥,但堵不如疏。多伦多大学、清华、北大等18所国内外顶尖高校联合发布新平台aiXiv,支持AI和人类共同撰写、评审和迭代科研成果,采用多阶段AI同行评审机制,提升效率和质量。

来自主题: AI技术研报
7462 点击    2025-12-02 16:34
进化Dify!还支持MCP,这款开源AI数据库绝了~【附喂饭级教程】

进化Dify!还支持MCP,这款开源AI数据库绝了~【附喂饭级教程】

进化Dify!还支持MCP,这款开源AI数据库绝了~【附喂饭级教程】

大家好,我是袋鼠帝。 最近我在折腾本地AI知识库的时候,在Github发现了一个特别有意思的新项目,叫seekdb。

来自主题: AI技术研报
7492 点击    2025-12-02 16:27
全面战胜ReAct!斯坦福全新智能体推理框架,性能提升112.5%

全面战胜ReAct!斯坦福全新智能体推理框架,性能提升112.5%

全面战胜ReAct!斯坦福全新智能体推理框架,性能提升112.5%

斯坦福和MIT的研究团队推出了一种新的AI智能体推理框架ReCAP,在长上下文任务中全面超越了现有的主流框架ReAct,性能提升显著。ReCAP通过独特的递归树结构和三大机制,解决了大语言模型在复杂任务中常见的目标漂移、上下文断层和成本爆炸等问题。

来自主题: AI技术研报
9600 点击    2025-12-02 15:20
架构解耦是统一多模态模型所必须的吗?全新AIA损失:No

架构解耦是统一多模态模型所必须的吗?全新AIA损失:No

架构解耦是统一多模态模型所必须的吗?全新AIA损失:No

近一年以来,统一理解与生成模型发展十分迅速,该任务的主要挑战在于视觉理解和生成任务本身在网络层间会产生冲突。早期的完全统一模型(如 Emu3)与单任务的方法差距巨大,Janus-Pro、BAGEL 通过一步一步解耦模型架构,极大地减小了与单任务模型的性能差距,后续方法甚至通过直接拼接现有理解和生成模型以达到极致的性能。

来自主题: AI技术研报
8054 点击    2025-12-02 15:17
DeepSeek-V3.2|技术报告解读

DeepSeek-V3.2|技术报告解读

DeepSeek-V3.2|技术报告解读

这是一篇报告解读,原文是《DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models》

来自主题: AI技术研报
7024 点击    2025-12-02 10:46
AAAI 2026 | 首个抗端到端攻击的大模型加密指纹 / 水印方案

AAAI 2026 | 首个抗端到端攻击的大模型加密指纹 / 水印方案

AAAI 2026 | 首个抗端到端攻击的大模型加密指纹 / 水印方案

随着大语言模型(LLM)的商业价值快速提升,其昂贵的训练成本使得模型版权保护(IP Protection)成为业界关注的焦点。然而,现有模型版权验证手段(如模型指纹)往往忽略一个关键威胁:攻击者一旦直接窃取模型权重,即拥有对模型的完全控制权,能够逆向指纹 / 水印,或通过修改输出内容绕过指纹验证。

来自主题: AI技术研报
7859 点击    2025-12-02 10:20
88.9 倍性能飙升!JSON Shredding 让 JSON 查询告别全表扫描| Milvus Week

88.9 倍性能飙升!JSON Shredding 让 JSON 查询告别全表扫描| Milvus Week

88.9 倍性能飙升!JSON Shredding 让 JSON 查询告别全表扫描| Milvus Week

本文为Milvus Week系列第一篇,该系列旨在分享Zilliz、Milvus在系统性能、索引算法和云原生架构上的创新与实践,以下是DAY1内容划重点:

来自主题: AI技术研报
6552 点击    2025-12-02 10:17