AI资讯新闻榜单内容搜索-腾讯混元

Loss收敛不代表学会：腾讯混元ACL 2026拆解SFT训练中15.3%的“假学会”样本

SFT是LLM从“通才”变成“专才”的关键步骤。业界默认做法是：准备标注数据（QA对、指令-回复对等）在基座模型上跑SFT训练。看loss曲线收敛了→认为训练完成。但问题在于：loss是全局平均，掩盖了样本间的差异。loss收敛只代表“大部分样本学会了”——那些始终学不会的样本被淹没了。

来自主题: AI技术研报

8378 点击 2026-07-26 11:25

独家｜混元多模态理解负责人胡瀚离职创业，原团队或将聚焦世界模型

独家获悉，近期，腾讯混元多模态理解负责人胡瀚提出了离职。此前，他曾担任微软亚洲研究院视觉计算组首席研究员。2025年初加入腾讯后，负责视觉大模型的研究。在后续的调整中，他加入大语言模型部旗下的“Frontier”前沿技术研究组，负责多模态理解的相关研究，汇报给姚顺雨。

来自主题: AI资讯

9611 点击 2026-07-23 16:56

腾讯混元发布科研智能体Hyra（Hunyuan Research Agent），刷新多项纪录，参与下一代Hy模型迭代

今天，腾讯正式发布了其首个研究智能体（Research Agent）——Hyra（Hunyuan Research Agent）。Hyra能够像科研人员一样，提出假设、完成实验、总结经验，再基于经验不断提出新的方案，最终实现递归自我改进（Recursive Self-Improvement，RSI）。

来自主题: AI资讯

9747 点击 2026-07-22 10:54

在数学上把稀疏注意力做对！腾讯Hy开源HiLS-Attention: 计算更少效果更好, 外推512倍

让大模型 "读得更长" 一直是 Agent、深度推理和海量资料整合等场景的刚需，但标准全注意力机制的计算量随序列长度呈平方级增长，始终是横亘在长上下文建模面前的三座大山。

来自主题: AI技术研报

9120 点击 2026-07-20 15:19

腾讯发布两大具身智能基座模型，VLM&RxBrain让机器人更懂现实世界

7 月 15 日，腾讯 Robotics X 实验室以及福田实验室联合腾讯混元推出两款具身智能基座模型 —— 具身 VLM 基座模型 Hy-Embodied-VLM-1.0 以及具身世界认知基座模型 Hy-Embodied-RxBrain-1.0，不仅让具身大脑能够 “看” 懂现实世界，还学会同时推理和想象。

来自主题: AI技术研报

10174 点击 2026-07-16 10:31

深度｜腾讯AI的双线战争：混元之外，微信WeLM用四年证明了另一种可能

7月6日，腾讯混元Hy3正式版发布。

来自主题: AI技术研报

8783 点击 2026-07-14 15:27

token羊毛｜微信小程序「成长计划」：价值2万多的token，1分钟到账

昨天，腾讯混元 Hy3 正式版上线，小程序更新了「成长计划」：小程序开发者的可以获得 10 亿的文本 Token，和 10 万张生图额度→ 10 亿 token 按官方 API 价折算，约 1000～4000 块

来自主题: AI资讯

9045 点击 2026-07-07 16:58

单个tokenizer胜任图像视频理解生成！南大&腾讯混元HYDRA打通多模态统一难题

南大王利民团队&腾讯混元的HYDRA系列（HYDRA，HYDRA-X）工作挑战了这个惯例，用一个基于ViT的统一视觉Tokenizer，帮助原生多模态模型更好地“看懂”和“创作”。训练一个基于ViT的Unified Tokenizer，使其同时具有理解和生成的能力，进而同时作为理解和生成的Autoencoder，来支持原生多模态模型（Unified Multimodal Models）的训练。

来自主题: AI技术研报

8753 点击 2026-06-28 11:13

混元开源PhoneBuddy-4B与5篇系列论文：多项手机Agent真机评测超过GPT-5.4

过去一年，Mobile/Phone-use Agent在各类评测榜单上进展很快。

来自主题: AI技术研报

8665 点击 2026-06-26 09:47

腾讯混元最新开源：一套RL框架打通多个模态，庞天宇团队新作

大语言模型的RL技术已日趋成熟，多模态生成模型的强化学习训练却仍在“各自为战”——图像扩散模型一套流程、视频生成另一套标准、VLM和LLM又有不同的技术栈。

来自主题: AI技术研报

7749 点击 2026-06-18 11:25