AI资讯新闻榜单内容搜索-框架

SVG性能比肩GPT/Claude，腾讯开源3B模型HiVG，让Token「懂几何」

HiVG是一个面向SVG生成的层次化分词框架，在减少63.8% token数量的同时，以仅3B参数在多项指标上超越所有开源SVG模型和GPT-5.2等闭源模型。仅3B参数的HiVG，在SVG生成任务中多项指标超越了GPT-5.2、Claude-4.5-Sonnet等闭源模型。

来自主题: AI资讯

8083 点击 2026-04-10 16:04

4步生图封神，GenEval从61%狂拉到92%，全面超越GPT-4o的TDM-R1模型来了

超快速 AI 生图领域再破性能天花板！香港科技大学唐靖团队、香港科技大学（深圳分校）胡天阳、小红书 hi-lab 罗维俭提出全新通用强化学习框架 TDM-R1，精准破解超快速扩散生成的核心痛点 —— 仅需 4 步采样（4 NFE），便将组合式生成指标 GenEval 从 61% 飙升至 92%，

来自主题: AI技术研报

10320 点击 2026-04-10 08:35

OpenClaw作者不想让你知道的3件事：Hermes Agent内置一键迁移命令，把35万Star对手的整套数据直接搬过来

我认真看 Hermes Agent，不是因为它2.9万Star，而是因为那条 hermes claw migrate。一个新框架敢把"把旧用户整套资产搬过来"做成默认入口，这事本身就很说明问题。

来自主题: AI技术研报

10879 点击 2026-04-09 10:18

小米AI语音新框架：人人都能当声音导演

语音合成大家都不陌生，这两年市面上各种AI配音也层出不穷。

来自主题: AI技术研报

10734 点击 2026-04-08 16:58

让大模型多模态检索全面超越SOTA！ReCALL框架化解生成式与判别式的范式冲突｜CVPR'26

生成式模型当检索器大材小用效果还不好？

来自主题: AI技术研报

9662 点击 2026-04-07 10:29

首个用户生活「长程模拟器」来了！LifeSim 重新定义大模型个性化评测

来自复旦大学、上海创智学院的研究人员提出 LifeSim，一个面向个性化助手评测的长程用户生活模拟框架。LifeSim 同时建模用户内部认知过程与外部物理环境，生成连贯的生活轨迹、事件序列与多轮交互行为；在此基础上，研究团队进一步构建了 LifeSim-Eval，用于系统评测模型在长期个性化交互中的能力边界。

来自主题: AI技术研报

8238 点击 2026-04-06 10:20

罗福莉：Claude订阅封杀龙虾背后，真正的出路不是更便宜的token

Agent 时代，我们需要正确的计费和工程设计哲学，这是 Xiaomi MiMo 大模型负责人罗福莉刚刚在 X 上发表的观点。前两天，我们报道了一则消息 ——Anthropic 宣布，即日起，Claude Pro 和 Max 订阅用户，不得再将订阅额度用于 OpenClaw 等第三方 Agent 框架。想继续用？那就必须切换到按用量付费的 API。

来自主题: AI资讯

8434 点击 2026-04-06 09:51

重构跨域RL框架！理论驱动「双重对齐」让跨域迁移「质变」

在现实世界中通过强化学习训练智能体，往往需要大量在线试错与环境探索，这不仅成本高昂，还可能带来显著安全风险：机器人可能因试错而损坏，自动驾驶的在线探索可能危及行车安全，而持续采集交互数据本身也代价巨大。

来自主题: AI技术研报

8646 点击 2026-04-03 09:25

ICLR 2026 | 中国联通提出扩散模型缓存框架MeanCache，刷新多模态生成模型推理加速新基准

FLUX 、Qwen-Image 等多模态生成模型的推理速度一直是工业级多模态模型落地的痛点。传统的特征缓存（Feature Caching）方案在追求高倍率加速时，常因瞬时速度的剧烈波动导致轨迹漂移。

来自主题: AI技术研报

8499 点击 2026-04-01 16:13

对标英伟达EgoScale数据路径，清华系孵化星忆科技拿到首轮融资

具身数据层的全球竞赛正在迅速升温。NVIDIA Research在2026年发布EgoScale数据与训练框架，在Ego-centric人类操作视频上训练VLA模型，用 20,854小时带动作标注的第一人称人类视频，观察到数据规模和验证损失之间接近对数线性的scaling law。1X收集人类第一视角及家庭行为数据，通过 Sunday项目采集百万小时级家庭场景视频。

来自主题: AI资讯

7748 点击 2026-03-31 15:03