AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
登顶权威榜单!无界动力发布全球首个「长时序双向物理因果链」隐空间世界模型 MWA™

登顶权威榜单!无界动力发布全球首个「长时序双向物理因果链」隐空间世界模型 MWA™

登顶权威榜单!无界动力发布全球首个「长时序双向物理因果链」隐空间世界模型 MWA™

当前,物理 AI 正面临着关于泛化能力的普遍质疑。当模型缺乏对真实物理规律的深度认知、难以跨越复杂多变的开放场景时,如何让机器人真正理解物理世界并精准规划决策,已成为具身智能破局的关键。

来自主题: AI技术研报
7329 点击    2026-06-30 10:48
AI当老板,快给10家公司干破产了…

AI当老板,快给10家公司干破产了…

AI当老板,快给10家公司干破产了…

AI当「老板」,快给10家公司干破产了……

来自主题: AI技术研报
7757 点击    2026-06-30 10:47
给Transformer变个形,LLM竟能变得更聪明

给Transformer变个形,LLM竟能变得更聪明

给Transformer变个形,LLM竟能变得更聪明

2026 年 6 月,大模型行业正在经历一场前所未有的「开源海啸」:英伟达放出了 550B 参数的混合架构模型,谷歌送出多模态的 Gemma 新版本,智谱用最宽松的协议全量开源了自家旗舰模型。

来自主题: AI技术研报
7486 点击    2026-06-30 10:20
教程:如何用Hermes+Milvus,搭建GEO Pipeline,提升产品的AI引用率

教程:如何用Hermes+Milvus,搭建GEO Pipeline,提升产品的AI引用率

教程:如何用Hermes+Milvus,搭建GEO Pipeline,提升产品的AI引用率

最近,有很多朋友来请教我们一个问题,GEO到底要怎么做,才能让生成的内容质量更高。

来自主题: AI技术研报
5659 点击    2026-06-30 10:19
AI助手不该只等人提问:清华团队两项新研究,探索理解用户与适时互动

AI助手不该只等人提问:清华团队两项新研究,探索理解用户与适时互动

AI助手不该只等人提问:清华团队两项新研究,探索理解用户与适时互动

如今,大模型越来越擅长回答问题了,但当 AI 不再只停留在聊天窗口,而是走向智能眼镜、可穿戴设备乃至家庭机器人时,问题会随之改变。用户未必有时间把需求完整说出来,也未必希望助手随时插话。更理想的助手,应该能在现场真正理解人,在用户需要的时候出现,在不合适的时候保持安静。

来自主题: AI技术研报
5917 点击    2026-06-30 09:55
百亿真实数据,首个面向AI Infra的运维智能体评测基准正式开源

百亿真实数据,首个面向AI Infra的运维智能体评测基准正式开源

百亿真实数据,首个面向AI Infra的运维智能体评测基准正式开源

随着全球智能体加速落地,算力需求呈指数级爆发,以 GPU 为核心的 AI 基础设施正变得愈发关键。据摩根士丹利报告预测,2028 年全球 AI 基础设施累计总投资将达 2.9 万亿美元。

来自主题: AI技术研报
5475 点击    2026-06-30 09:53
全球首个:隐空间世界模型,打通长时序双向物理因果链了!

全球首个:隐空间世界模型,打通长时序双向物理因果链了!

全球首个:隐空间世界模型,打通长时序双向物理因果链了!

你从桌上端起一杯水,大脑用了不到一秒,同时完成三件事: 估算杯子的重量,预判水面晃动的幅度,顺便绕开了旁边那个玻璃杯。

来自主题: AI技术研报
8338 点击    2026-06-30 09:53
GPT-5.6 偷偷灰度?有人在 Codex 里提前用上了

GPT-5.6 偷偷灰度?有人在 Codex 里提前用上了

GPT-5.6 偷偷灰度?有人在 Codex 里提前用上了

你以为自己在用GPT-5.5,但OpenAI可能已经在后台,悄悄把你的底层模型换成了更先进的GPT-5.6 Sol。

来自主题: AI技术研报
8368 点击    2026-06-29 16:14
Nvidia都在点赞的LoopWM世界模型,竟然来自一家中国初创FaceMind?

Nvidia都在点赞的LoopWM世界模型,竟然来自一家中国初创FaceMind?

Nvidia都在点赞的LoopWM世界模型,竟然来自一家中国初创FaceMind?

在世界模型这条路上,行业一直卡在一个几乎无解的矛盾里:想要更真实的长程模拟,就必须给模型更深的计算;可一旦把模型做得更深,部署成本、参数规模和误差累积又会迅速抬头。结果就是,大家都知道世界模型要 “想得更久”,却很难让它在现实系统里 “算得起、跑得稳”。

来自主题: AI技术研报
5237 点击    2026-06-29 15:54
Nature: AI医生MIRA首次“全流程上岗”

Nature: AI医生MIRA首次“全流程上岗”

Nature: AI医生MIRA首次“全流程上岗”

2026年6月17日,Nature 刊登了一项里程碑式的研究,来自海德堡大学医院的研究团队开发了一个名为MIRA(Medical Intelligence for Reasoning and Action) 的自主医疗AI智能体。

来自主题: AI技术研报
7766 点击    2026-06-29 10:20
不再只是「会走路的双臂平台」:OpenHLM解放人形机器人的全身移动操作能力

不再只是「会走路的双臂平台」:OpenHLM解放人形机器人的全身移动操作能力

不再只是「会走路的双臂平台」:OpenHLM解放人形机器人的全身移动操作能力

人类在日常生活中协调全身来完成移动操作任务:打开垃圾桶时会踩下踏板,从低处拿东西时需要下蹲,推车时需要同步协调手臂抓握和腿部移动。对试图复刻人类能力的人形机器人来说,身体不应只是「手臂 + 移动平台」,而应是一个能协调手、腰、腿、脚共同完成任务的运动整体。

来自主题: AI技术研报
5680 点击    2026-06-29 09:21
英伟达年度「最危险」论文!AI自繁衍代码,无限刷级进化

英伟达年度「最危险」论文!AI自繁衍代码,无限刷级进化

英伟达年度「最危险」论文!AI自繁衍代码,无限刷级进化

年度最危险论文发了!英伟达打破20年封印,让AI亲手造出更狠的「考官」淘汰自己。无休止的自我进化一旦开启,2028年ASI降临真不是玩笑。

来自主题: AI技术研报
5699 点击    2026-06-29 09:20
ICML 2026 Oral|大模型的能力从哪些训练数据来?北大&智源提出「机理数据归因」

ICML 2026 Oral|大模型的能力从哪些训练数据来?北大&智源提出「机理数据归因」

ICML 2026 Oral|大模型的能力从哪些训练数据来?北大&智源提出「机理数据归因」

近年来,大语言模型展现出了越来越强的能力,从上下文学习(In-Context Learning, ICL)到复杂推理、代码生成,这些能力不断刷新人们对模型能力边界的认知。

来自主题: AI技术研报
8881 点击    2026-06-29 09:19
从第一性原理看机器人AI:为什么它比大模型更难?

从第一性原理看机器人AI:为什么它比大模型更难?

从第一性原理看机器人AI:为什么它比大模型更难?

这篇来自 Interlatent(一家聚焦具身智能后训练与部署的早期创业公司) 的文章,试图从第一性原理出发,把现代 AI 机器人技术重新讲清楚:一个机器人到底如何理解世界,如何生成动作,又为什么会在数据、延迟和泛化上遇到如此多的困难。

来自主题: AI技术研报
7203 点击    2026-06-29 09:15
拆解梁文锋署名的DSpark,看懂这10个点就够了!

拆解梁文锋署名的DSpark,看懂这10个点就够了!

拆解梁文锋署名的DSpark,看懂这10个点就够了!

Fireworks AI的联合创始人兼CTO、PyTorch核心维护者Dmytro Dzhulgakov将整篇论文梳理成了10个概念,从最底层的GPU访存特性讲到最上层的在线自适应调度。DeepSeek这套方案真正的精髓在于系统工程和模型协同设计。

来自主题: AI技术研报
7568 点击    2026-06-28 17:34
陶哲轩参赛,在这项极其严格的数学测试中,人类表现优于AI

陶哲轩参赛,在这项极其严格的数学测试中,人类表现优于AI

陶哲轩参赛,在这项极其严格的数学测试中,人类表现优于AI

就在外界惊呼“AI快要接管纯数学研究”之际,一场限制条件极其严格、并由30位数学家以匿名方式进行评审的数学测试,却揭开了AI数学能力的另一面:AI不仅会幻觉、会跳步骤,甚至还把数学家论文里的关键论证几乎原样照搬,却忘了注明引用。

来自主题: AI技术研报
8706 点击    2026-06-28 11:35
CVPR 2026最热方向,被一家杭州团队率先跑进了端侧!

CVPR 2026最热方向,被一家杭州团队率先跑进了端侧!

CVPR 2026最热方向,被一家杭州团队率先跑进了端侧!

刚刚,Om AI发布全球首个面向物理世界的端侧流式多模态模型系列——VLX。VLX主打真实世界的端侧与具身场景,总共三款模型,三天连发:这三款模型连起来,不仅构成了多模态模型持续感知、精准定位、行动决策的能力闭环。

来自主题: AI技术研报
8836 点击    2026-06-28 11:14
单个tokenizer胜任图像视频理解生成!南大&腾讯混元HYDRA打通多模态统一难题

单个tokenizer胜任图像视频理解生成!南大&腾讯混元HYDRA打通多模态统一难题

单个tokenizer胜任图像视频理解生成!南大&腾讯混元HYDRA打通多模态统一难题

南大王利民团队&腾讯混元的HYDRA系列(HYDRA,HYDRA-X)工作挑战了这个惯例,用一个基于ViT的统一视觉Tokenizer,帮助原生多模态模型更好地“看懂”和“创作”。训练一个基于ViT的Unified Tokenizer,使其同时具有理解和生成的能力,进而同时作为理解和生成的Autoencoder,来支持原生多模态模型(Unified Multimodal Models)的训练。

来自主题: AI技术研报
8089 点击    2026-06-28 11:13
刚刚,DeepSeek V4更新DSpark,推理速度提升80%

刚刚,DeepSeek V4更新DSpark,推理速度提升80%

刚刚,DeepSeek V4更新DSpark,推理速度提升80%

刚刚,DeepSeek V4 进行了一次更新。新推出了投机解码(Speculative Decoding)框架 DSpark,并同步开源了支撑该版本的全栈推测性解码框架 DeepSpec。DeepSeek-V4-Pro-DSpark 并非全新架构模型,而是在 DeepSeek-V4-Pro 基础上引入了推测性解码模块。此次更新的重点在于工程落地,而非模型能力本身的迭代。

来自主题: AI技术研报
9000 点击    2026-06-27 18:55
微软年度AI职场报告:员工已经准备好了,公司还没有

微软年度AI职场报告:员工已经准备好了,公司还没有

微软年度AI职场报告:员工已经准备好了,公司还没有

Jay 发自 凹非寺 量子位 | 公众号 QbitAI AI能否真正产生价值?组织因素的权重是个人的两倍。 也就是说,你AI用得不好,三分之二的锅得公司背。 这个反直觉洞察,出自微软一年一度的《Wor

来自主题: AI技术研报
9244 点击    2026-06-27 11:28
大模型搜索总偷懒?IQuest等联合推出FORT,30B开源搜索Agent刷新同规模SOTA

大模型搜索总偷懒?IQuest等联合推出FORT,30B开源搜索Agent刷新同规模SOTA

大模型搜索总偷懒?IQuest等联合推出FORT,30B开源搜索Agent刷新同规模SOTA

来自至知创新研究院(IQuest Research)、中国人民大学高瓴人工智能学院、KAUST等机构的研究团队提出了FORT,一个面向Deep Search Agent的shortcut-resistant training-data synthesis framework。

来自主题: AI技术研报
8581 点击    2026-06-27 11:27
黄仁勋:Prompt正在过时,Loop才是新范式

黄仁勋:Prompt正在过时,Loop才是新范式

黄仁勋:Prompt正在过时,Loop才是新范式

这就是最近网上热传热议,然后老黄黄仁勋给AI新趋势画的新重点:Nobody writes prompts anymore. The new job is to write and handle loops.(现在根本没有人写Prompt了,新时代的核心工作是编写和管理loop。)

来自主题: AI技术研报
8063 点击    2026-06-27 10:55
刚刚,翁荔博客上新:谨慎对待Scaling Law

刚刚,翁荔博客上新:谨慎对待Scaling Law

刚刚,翁荔博客上新:谨慎对待Scaling Law

刚刚,翁荔(Lilian Weng)的博客 Lil'Log 终于更新了!要知道,自从她联合创立了 Thinking Machines Lab 之后,她那让许多人受益良多的博客就鲜少更新了——距离她上一次更新,已经过去了 13 个月。

来自主题: AI技术研报
9287 点击    2026-06-26 11:14
往 Codex 里塞块无限画布,AI 改图终于能指哪打哪了|附教程

往 Codex 里塞块无限画布,AI 改图终于能指哪打哪了|附教程

往 Codex 里塞块无限画布,AI 改图终于能指哪打哪了|附教程

和 Codex、Claude Code 等 Coding Agent 沟通,很多时候就像站在许愿池边,对着池子里的王八扔硬币,嘴里念念有词,关键它还真给你兑现愿望。

来自主题: AI技术研报
6766 点击    2026-06-25 15:26