AI资讯新闻榜单内容搜索-io

谢赛宁新作：VAE退役，RAE当立

谢赛宁团队最新研究给出了答案——VAE的时代结束，RAE将接力前行。其中表征自编码器RAE（Representation Autoencoders）是一种用于扩散Transformer（DiT）训练的新型自动编码器，其核心设计是用预训练的表征编码器（如DINO、SigLIP、MAE 等）与训练后的轻量级解码器配对，从而替代传统扩散模型中依赖的VAE（变分自动编码器）。

来自主题: AI技术研报

9088 点击 2025-10-14 16:34

剑桥揭开大模型翻车黑箱！别再怪它不懂推理，是行动出错了

为什么大模型，在执行长时任务时容易翻车？这让一些专家，开始质疑大模型的推理能力，认为它们是否只是提供了「思考的幻觉」。近日，剑桥大学等机构的一项研究证明：问题不是出现在推理上，而是出在大模型的执行能力上。

来自主题: AI技术研报

8695 点击 2025-10-14 11:10

Being-VL的视觉BPE路线：把「看」和「说」真正统一起来

为此，北大、UC San Diego 和 BeingBeyond 联合提出一种新的方法——Being-VL 的视觉 BPE 路线。Being-VL 的出发点是把这一步后置：先在纯自监督、无 language condition 的设定下，把图像离散化并「分词」，再与文本在同一词表、同一序列中由同一 Transformer 统一建模，从源头缩短跨模态链路并保留视觉结构先验。

来自主题: AI技术研报

8757 点击 2025-10-14 09:58

腾讯开源强化学习新算法！让智能体无需专家示范就“自学成才”，还即插即用零成本接入

让智能体自己摸索新方法，还模仿自己的成功经验。腾讯优图实验室开源强化学习算法——SPEAR（Self-imitation with Progressive Exploration for Agentic Reinforcement Learning）。

来自主题: AI技术研报

8791 点击 2025-10-13 15:45

清华大学x生数科技：从波形到隐空间，AudioLBM引领音频超分新范式

在这一背景下，清华大学与生数科技（Shengshu AI）团队围绕桥类生成模型与音频超分任务展开系统研究，先后在语音领域顶级会议ICASSP 2025和机器学习顶级会议NeurIPS 2025发表了两项连续成果：

来自主题: AI技术研报

9734 点击 2025-10-13 10:30

通用模型无法完全理解用户，AI产品的下一站是上下文的战场｜对话AI知识助手remio

在量子位智库的观察中，AI知识助手remio正在尝试这一方向。remio主打无感和自动化，致力于变成记忆和用户同频的第二大脑。主打能够在用户无感知的情况下，实时、自动化地采集用户所需管理的信息，为用户创造更加轻松顺畅的使用体验。

来自主题: AI资讯

11627 点击 2025-10-12 15:48

永别了，人类冠军！AI横扫天文奥赛，GPT-5得分远超金牌选手2.7倍

国际奥赛又一块金牌，被AI夺下了！在国际天文与天体物理奥赛（IOAA）中，GPT-5和Gemini 2.5 Pro完胜人类选手，在理论和数据分析测试中，拿下了最高分。在理论考试上，Gemini 2.5 Pro总体得分85.6%，GPT-5总体得分84.2%；

来自主题: AI资讯

10189 点击 2025-10-12 15:04

首家AIOS落地来自vivo：个人化智能复刻人类思维，手机还能这样用

机器之心报道编辑：泽南真正实用化的生成式 AI，应该是这个样子 —— 作为助手可以帮你代打电话，根据你的选项进行应答，还能引导对方转人工：功能覆盖多个场景，连接大量第三方应用，实现多智能体的一键

来自主题: AI资讯

10056 点击 2025-10-11 12:37

李飞飞发起机器人家务挑战赛！老黄第一时间批钱赞助

李飞飞要用ImageNet的方式，推动具身智能了。就在最近，由李飞飞团队发起、英伟达赞助（其中之一）的首届BEHAVIOR家务挑战赛正式启动。这一次，他们下定决心凝聚学术界和产业界的力量，共同向机器人做家务这一高地发起冲击。

来自主题: AI资讯

7898 点击 2025-10-11 12:10

全球首个真实世界具身多模态数据集，它石智航交卷，比特斯拉还早6个月

全球首个真实世界具身多模态数据集，它来了！刚刚，它石智航发布全球首个大规模真实世界具身VLTA（Vision-Language-Tactile-Action）多模态数据集World In Your Hands（WIYH）。

来自主题: AI技术研报

11408 点击 2025-10-11 12:06