AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一张图,开启四维时空:4DNeX让动态世界 「活」起来

一张图,开启四维时空:4DNeX让动态世界 「活」起来

一张图,开启四维时空:4DNeX让动态世界 「活」起来

仅凭一张照片,能否让行人继续行走、汽车继续飞驰、云朵继续流动,并让你从任意视角自由观赏?

来自主题: AI技术研报
7108 点击    2025-08-18 17:14
KDD 2025 | UoMo来了,首个无线网络流量预测模型,一个框架搞定三类任务

KDD 2025 | UoMo来了,首个无线网络流量预测模型,一个框架搞定三类任务

KDD 2025 | UoMo来了,首个无线网络流量预测模型,一个框架搞定三类任务

在今年的 ACM KDD 2025 大会上,清华大学电子系团队联合中国移动发布了 UoMo,全球首个面向移动网络的通用流量预测模型。UoMo 能同时胜任短期预测、长期预测,甚至在没有历史数据的情况下生成全新区域的流量分布。

来自主题: AI技术研报
5958 点击    2025-08-18 15:54
400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?

400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?

400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?

还记得分层推理模型(Hierarchical Reasoning Model,HRM)吗? 这项工作于 6 月份发布,当时引起了不小的轰动——X/Twitter 上的相关讨论获得了超过 400 万的浏览量和数万个点赞,剖析这项工作的 YouTube 视频观看量也超过了 47.5 万次。

来自主题: AI技术研报
6937 点击    2025-08-18 12:36
CoRL 2025|隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力

CoRL 2025|隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力

CoRL 2025|隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力

在机器人操作任务中,预测性策略近年来在具身人工智能领域引起了广泛关注,因为它能够利用预测状态来提升机器人的操作性能。然而,让世界模型预测机器人与物体交互的精确未来状态仍然是一个公认的挑战,尤其是生成高质量的像素级表示。

来自主题: AI技术研报
6139 点击    2025-08-18 11:53
AI产品们,有哪些“反常识”趋势?

AI产品们,有哪些“反常识”趋势?

AI产品们,有哪些“反常识”趋势?

数据显示,无论是国内还是海外,AI行业的发展,在经历了爆发式增长后,都开始出现部分下滑,行业正进入一个全新的阶段。真实的用户偏好开始显现,旧的增长逻辑正在失效。

来自主题: AI技术研报
7611 点击    2025-08-18 11:53
告别RAG延迟!LLM首个即插即用“记忆解码器”问世!

告别RAG延迟!LLM首个即插即用“记忆解码器”问世!

告别RAG延迟!LLM首个即插即用“记忆解码器”问世!

一句话概括,还在嫌弃RAG太慢?这帮研究员直接把检索数据库"蒸馏"成了一个小模型,实现了不检索的检索增强,堪称懒人福音。

来自主题: AI技术研报
6102 点击    2025-08-18 11:48
硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码

硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码

硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码

自GPT-2以来,大模型的整体架构虽然未有大的变化,但从未停止演化的脚步。借OpenAI开源gpt-oss(120B/20B),Sebastian Raschka博士将我们带回硬核拆机现场,回溯了从GPT-2到gpt-oss的大模型演进之路,并将gpt-oss与Qwen3进行了详细对比。

来自主题: AI技术研报
6630 点击    2025-08-18 11:13
SEAgent:开启从实战经验中自我进化的GUI智能体新纪元

SEAgent:开启从实战经验中自我进化的GUI智能体新纪元

SEAgent:开启从实战经验中自我进化的GUI智能体新纪元

当前计算机使用智能体(CUA)的发展,主要依赖于大量昂贵的人工标注数据 。这极大地限制了它们在缺少现成数据的新颖或专业软件中的应用能力 。为了打破这一瓶颈,来自上海交通大学和香港中文大学的学者们提出了 SEAgent,一个全新的、无需任何人类干预,即可通过与环境交互来自主学习和进化的智能体框架。

来自主题: AI技术研报
6435 点击    2025-08-18 10:58
当AI比我们更聪明:李飞飞和Hinton给出截然相反的生存指南

当AI比我们更聪明:李飞飞和Hinton给出截然相反的生存指南

当AI比我们更聪明:李飞飞和Hinton给出截然相反的生存指南

人类对 AI 安全的担忧由来已久。在图灵测试被提出以及达特茅斯会议正式定义「人工智能」之前,阿西莫夫就已经提出了「机器人学三定律」。

来自主题: AI技术研报
5440 点击    2025-08-17 14:14
大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大语言模型(LLM)正从工具进化为“裁判”(LLM-as-a-judge),开始大规模地评判由AI自己生成的内容。这种高效的评估范式,其可靠性与人类判断的一致性,却很少被深入验证。

来自主题: AI技术研报
5812 点击    2025-08-17 13:16
AI顶会反噬整个学术圈!「不发表就会死」,NeurIPS爆仓,博士年肝4.5篇大崩溃

AI顶会反噬整个学术圈!「不发表就会死」,NeurIPS爆仓,博士年肝4.5篇大崩溃

AI顶会反噬整个学术圈!「不发表就会死」,NeurIPS爆仓,博士年肝4.5篇大崩溃

就在刚刚,NUS研究者呼吁:NeurIPS、ICML、CVPR三大顶会,正在反噬整个AI学术圈!平均每个研究者每年被逼狂发4.5篇论文,已经身心俱疲。总之,顶会模型已经濒临崩溃,是时候踩刹车了!

来自主题: AI技术研报
5277 点击    2025-08-17 13:03
深度解读|10亿美元投后总结,海外顶级风投BVP发布2025年度AI报告(附PDF报告原文)

深度解读|10亿美元投后总结,海外顶级风投BVP发布2025年度AI报告(附PDF报告原文)

深度解读|10亿美元投后总结,海外顶级风投BVP发布2025年度AI报告(附PDF报告原文)

如果说 2023 年是 AI 的大爆炸时代,那么 2025 年就是 AI 宇宙中第一道光芒照亮黑暗的时刻。混沌初开的迷雾正在散去,基础性公司的星系开始成形,构建 AI 产品的最佳实践逐渐清晰,创业成功的模式也开始显现。

来自主题: AI技术研报
6744 点击    2025-08-16 16:52
混合数学编程逻辑数据,一次性提升AI多领域强化学习能力 | 上海AI Lab

混合数学编程逻辑数据,一次性提升AI多领域强化学习能力 | 上海AI Lab

混合数学编程逻辑数据,一次性提升AI多领域强化学习能力 | 上海AI Lab

近年来,AI大模型在数学计算、逻辑推理和代码生成领域的推理能力取得了显著突破。特别是DeepSeek-R1等先进模型的出现,可验证强化学习(RLVR)技术展现出强大的性能提升潜力。

来自主题: AI技术研报
5649 点击    2025-08-16 16:45
模仿人类推理修正过程,阶跃星辰提出形式化证明新范式 | 开源

模仿人类推理修正过程,阶跃星辰提出形式化证明新范式 | 开源

模仿人类推理修正过程,阶跃星辰提出形式化证明新范式 | 开源

形式化定理证明,又有新范式! 阶跃星辰正式发布并开源了形式化定理证明大模型:StepFun-Prover-Preview-7B和StepFun-Prover-Preview-32B。

来自主题: AI技术研报
7067 点击    2025-08-16 16:10
追剧不断网,可能背后有个AI在加班,故障诊断准度破91.79%

追剧不断网,可能背后有个AI在加班,故障诊断准度破91.79%

追剧不断网,可能背后有个AI在加班,故障诊断准度破91.79%

当你的手机突然没信号时,电信工程师在做什么? 想象一下这样的场景:某个周五晚上,你正在用手机追剧,突然网络断了。与此同时,成千上万的用户也遇到了同样的问题。电信运营商的监控中心瞬间被数百个告警信息淹没 —— 基站离线、信号中断、设备故障…

来自主题: AI技术研报
5535 点击    2025-08-16 15:57
AI 模特时代到来:字节x清华推出商用级视频换装模型DreamVVT,保真度显著领先SOTA

AI 模特时代到来:字节x清华推出商用级视频换装模型DreamVVT,保真度显著领先SOTA

AI 模特时代到来:字节x清华推出商用级视频换装模型DreamVVT,保真度显著领先SOTA

服装视频广告太烧钱?卡点变装太难拍? 字节跳动智能创作团队联合清华大学最新推出一款全能的视频换装模型 DreamVVT,为视频虚拟试穿领域带来了突破性进展。

来自主题: AI技术研报
6095 点击    2025-08-15 12:56
链式思维是幻象吗?从数据分布视角重新审视大模型推理,马斯克回复,Grok破防

链式思维是幻象吗?从数据分布视角重新审视大模型推理,马斯克回复,Grok破防

链式思维是幻象吗?从数据分布视角重新审视大模型推理,马斯克回复,Grok破防

思维链 (CoT) 提示技术常被认为是让大模型分步思考的关键手段,通过在输入中加入「Let’s think step by step」等提示,模型会生成类似人类的中间推理步骤,显著提升复杂任务的表现。然而,这些流畅的推理链条是否真的反映了模型的推理能力?

来自主题: AI技术研报
5296 点击    2025-08-15 12:38
冗长响应缩减80%,DeepSeek GRPO获得颠覆性改进,微软GFPO问世

冗长响应缩减80%,DeepSeek GRPO获得颠覆性改进,微软GFPO问世

冗长响应缩减80%,DeepSeek GRPO获得颠覆性改进,微软GFPO问世

用过 DeepSeek-R1 等推理模型的人,大概都遇到过这种情况:一个稍微棘手的问题,模型像陷入沉思一样长篇大论地推下去,耗时耗算力,结果却未必靠谱。现在,我们或许有了解决方案。

来自主题: AI技术研报
5283 点击    2025-08-15 11:26
ICCV 2025 | HERMES:首个统一3D场景理解与生成的世界模型

ICCV 2025 | HERMES:首个统一3D场景理解与生成的世界模型

ICCV 2025 | HERMES:首个统一3D场景理解与生成的世界模型

在复杂的城市场景中,HERMES 不仅能准确预测未来三秒的车辆与环境动态(如红圈中标注的货车),还能对当前场景进行深度理解和问答(如准确识别出 “星巴克” 并描述路况)。

来自主题: AI技术研报
6256 点击    2025-08-15 11:10
告别Transformer,重塑机器学习范式:上海交大首个「类人脑」大模型诞生

告别Transformer,重塑机器学习范式:上海交大首个「类人脑」大模型诞生

告别Transformer,重塑机器学习范式:上海交大首个「类人脑」大模型诞生

当前 GPT 类大语言模型的表征和处理机制,仅在输入和输出接口层面对语言元素保持可解释的语义映射。相比之下,人类大脑直接在分布式的皮层区域中编码语义,如果将其视为一个语言处理系统,它本身就是一个在全局上可解释的「超大模型」。

来自主题: AI技术研报
6220 点击    2025-08-14 11:11
港大联手月之暗面等开源OpenCUA:人人可造专属电脑智能体

港大联手月之暗面等开源OpenCUA:人人可造专属电脑智能体

港大联手月之暗面等开源OpenCUA:人人可造专属电脑智能体

刚刚,一篇来自香港大学 XLANG Lab 和月之暗面等多家机构的论文上线了 arXiv,其中提出了一个用于构建和扩展 CUA(使用计算机的智能体)的完全开源的框架。 使用该框架,他们还构建了一个旗舰模型 OpenCUA-32B,其在 OSWorld-Verified 上达到了 34.8% 的成功率,创下了新的开源 SOTA,甚至在这个基准测试中超越了 GPT-4o。

来自主题: AI技术研报
7666 点击    2025-08-14 09:39
AI顶会模式出了问题? 「不发表,就出局」的恶性循环,正在压垮整个AI学界

AI顶会模式出了问题? 「不发表,就出局」的恶性循环,正在压垮整个AI学界

AI顶会模式出了问题? 「不发表,就出局」的恶性循环,正在压垮整个AI学界

相信我们的读者都对 AI 顶会有非常大的关注和热情,有的读者最近可能刚从 NeurIPS rebuttal 脱身,又开始为下一篇做准备了。 作为推动技术革新与思想碰撞的核心引擎,顶级学术会议不仅是整个学界的生命线,更是我们洞察未来的前沿阵地。

来自主题: AI技术研报
5269 点击    2025-08-13 16:41
研究者警告:强化学习暗藏「策略悬崖」危机,AI对齐的根本性挑战浮现

研究者警告:强化学习暗藏「策略悬崖」危机,AI对齐的根本性挑战浮现

研究者警告:强化学习暗藏「策略悬崖」危机,AI对齐的根本性挑战浮现

强化学习(RL)是锻造当今顶尖大模型(如 OpenAI o 系列、DeepSeek-R1、Gemini 2.5、Grok 4、GPT-5)推理能力与对齐的核心 “武器”,但它也像一把双刃剑,常常导致模型行为脆弱、风格突变,甚至出现 “欺骗性对齐”、“失控” 等危险倾向。

来自主题: AI技术研报
6569 点击    2025-08-13 16:29
大型语言模型稳定强化学习的新路径:几何平均策略优化GMPO

大型语言模型稳定强化学习的新路径:几何平均策略优化GMPO

大型语言模型稳定强化学习的新路径:几何平均策略优化GMPO

近年来,强化学习(RL)在大型语言模型(LLM)的微调过程中,尤其是在推理能力提升方面,取得了显著的成效。传统的强化学习方法,如近端策略优化(Proximal Policy Optimization,PPO)及其变种,包括组相对策略优化(Group Relative Policy Optimization,GRPO),在处理复杂推理任务时表现出了强大的潜力。

来自主题: AI技术研报
5427 点击    2025-08-13 16:03
Artificial Analysis 重磅发布《2025年Q2中国AI现状报告》:中国与美国差距已从一年缩短至3个月

Artificial Analysis 重磅发布《2025年Q2中国AI现状报告》:中国与美国差距已从一年缩短至3个月

Artificial Analysis 重磅发布《2025年Q2中国AI现状报告》:中国与美国差距已从一年缩短至3个月

Artificial Analysis 最近发布了《State of AI: China Q2 2025 Highlights Report》(2025年Q2 中国人工智能现状分析报告),聚焦中国 AI 发展现状。

来自主题: AI技术研报
7935 点击    2025-08-13 15:57
从物竞天择到智能进化,首篇自进化智能体综述的ASI之路

从物竞天择到智能进化,首篇自进化智能体综述的ASI之路

从物竞天择到智能进化,首篇自进化智能体综述的ASI之路

近年来,大语言模型(LLM)已展现出卓越的通用能力,但其核心仍是静态的。面对日新月异的任务、知识领域和交互环境,模型无法实时调整其内部参数,这一根本性瓶颈日益凸显。

来自主题: AI技术研报
5817 点击    2025-08-13 11:32
让强化学习快如闪电:FlashRL一条命令实现极速Rollout,已全部开源

让强化学习快如闪电:FlashRL一条命令实现极速Rollout,已全部开源

让强化学习快如闪电:FlashRL一条命令实现极速Rollout,已全部开源

在今年三月份,清华 AIR 和字节联合 SIA Lab 发布了 DAPO,即 Decoupled Clip and Dynamic sAmpling Policy Optimization(解耦剪辑和动态采样策略优化)。

来自主题: AI技术研报
6074 点击    2025-08-13 11:27
具身智能体主动迎战对抗攻击,清华团队提出主动防御框架

具身智能体主动迎战对抗攻击,清华团队提出主动防御框架

具身智能体主动迎战对抗攻击,清华团队提出主动防御框架

面对对抗攻击,具身智能体除了被动防范,也能主动出击! 在人类视觉系统启发下,清华朱军团队在TPMAI 2025中提出了强化学习驱动的主动防御框架REIN-EAD。

来自主题: AI技术研报
6245 点击    2025-08-13 11:21
AI代码生成,上下文示例怎样写最有效?港科大最新

AI代码生成,上下文示例怎样写最有效?港科大最新

AI代码生成,上下文示例怎样写最有效?港科大最新

长久以来我们都知道在Prompt里塞几个好例子能让LLM表现得更好,这就像教小孩学东西前先给他做个示范。在Vibe coding爆火后,和各种代码生成模型打交道的人变得更多了,大家也一定用过上下文学习(In-Context Learning, ICL)或者检索增强生成(RAG)这类技术来提升它的表现。

来自主题: AI技术研报
7152 点击    2025-08-13 10:45