AI资讯新闻榜单内容搜索-训练

具身智能奇点已至！超越π*0.6，极佳视界自我进化VLA大模型拿下世界第一

极佳视界具身大模型 GigaBrain-0.5M*，以世界模型预测未来状态驱动机器人决策，并实现了持续自我进化，超越π*0.6 实现 SOTA！该模型在叠衣、冲咖啡、折纸盒等真实任务中实现接近 100% 成功率；相比主流基线方法任务成功率提升近 30%；基于超万小时数据训练，其中六成由自研世界模型高保真合成。

来自主题: AI资讯

8280 点击 2026-02-15 21:27

清华新框架让大模型学会「精读略读」！实现12倍端到端加速，基准评分翻倍

来自清华大学、鹏城实验室与阿里巴巴未来生活实验室的联合研究团队发现：现有任务相关的压缩方法不仅陷入效率瓶颈——要么一次性加载全文（效率低），要么自回归逐步压缩（速度慢），更难以兼顾“保留关键信息”与“保持自然语言可解释性”。

来自主题: AI技术研报

9564 点击 2026-02-15 21:25

训练加速40倍、打破“不可能三角”：MiniMax Agent RL 架构解密

随着 MiniMax M2.5 的发布并在社区引发热烈反响，很高兴能借此机会，分享在模型训练背后关于 Agent RL 系统的一些思考。在大规模、复杂的真实世界场景中跑 RL 时，始终面临一个核心难

来自主题: AI技术研报

7925 点击 2026-02-15 06:50

情人节最硬核“Kiss”！中国AI突破300年亲吻数难题，连刷多维度纪录

来自上海科学智能研究院（上智院）、北京大学、复旦大学的联合团队，提出了一套名为PackingStar的强化学习系统，一口气刷新了25-31连续7个维度的世界纪录。

来自主题: AI资讯

8120 点击 2026-02-14 22:20

国产医疗大模型登顶权威榜单！核心秘籍：PB级训练数据、模拟医生真实会诊过程

2月7日，中文医疗大模型评测平台MedBench公布最新多模态大模型评测榜单，数坤科技的数坤坤多模态医学大模型V3以63.6分拿下第一。在榜单中，V3的表现超过微医、云知声旗下医疗行业大模型，以及OpenAI、谷歌、阿里千问旗下通用大模型。

来自主题: AI资讯

7427 点击 2026-02-14 10:38

视听分离SOTA提速6倍！清华发布首个6M高性能模型｜ICLR'26

清华大学团队推出的Dolphin模型突破了「高性能必高能耗」的瓶颈：仅用6M参数（较主流模型减半），通过离散化视觉编码和物理启发的热扩散注意力机制，实现单次推理即可精准分离语音，速度提升6倍以上，在多项基准测试中刷新纪录，为智能助听器、手机等端侧设备部署高清语音分离开辟新路。

来自主题: AI技术研报

8840 点击 2026-02-14 10:28

开源：参考OpenClaw，我们给 Claude Code 加上了轻量化的永久透明记忆

但考虑到在代码领域，如何做好记忆与检索，相比其他场景又有所不同，因此，基于 memsearch CLI ，我们同时也为Claude Code 做了个永久记忆的 plugin——memsearch ccplugin（可适用所有AI coding软件）。

来自主题: AI技术研报

8380 点击 2026-02-14 10:11

ICLR 2026 | 异常需要定义！中传团队提出开放世界视频异常检测新范式

针对这一问题，中国传媒大学媒体融合与传播国家重点实验室的吴晓雨教授团队于 ICLR 2026 发表论文《Language-guided Open-world Video Anomaly Detection under Weak Supervision》，直面 VAD 领域的核心问题 —— 什么是异常？

来自主题: AI技术研报

8114 点击 2026-02-14 10:03

具身智能的「GPT时刻」？高德连发两个全面SOTA的ABot具身基座模型

过去几年，大模型把自然语言处理彻底重塑了。GPT 出来之前，NLP 领域的状态是：每个任务一套模型，每个场景一批数据，每个公司一条流水线，互不通用，边界清晰。GPT 之后，这套逻辑被一个预训练底座 + 任务微调的范式整个替换掉了。

来自主题: AI技术研报

6133 点击 2026-02-13 12:02

Loop-ViT：让AI学会「反复思考」，3.8M参数小模型追平人类平均水平

当我们解一道复杂的数学题或观察一幅抽象图案时，大脑往往需要反复思考、逐步推演。然而，当前主流的深度学习模型却走的是「一次通过」的路线——输入数据，经过固定层数的网络，直接输出答案。

来自主题: AI技术研报

9807 点击 2026-02-13 11:08