AI资讯新闻榜单内容搜索-ROLL

OpenAI 和 Anthropic 共同看好的 FDE：AI 时代的新岗位出现，旧分工松动｜对谈 Rolling AI

本周「十字路口」，我们聊 FDE 这个正在被重新定义的岗位与分工：它究竟是在把“售前/交付”换个名字，还是代表 ToB AI 时代新的组织结构与商业边界？当模型越来越强，最后一公里为什么依然最难？企业真正缺的，到底是更强的模型，还是能把 AI 带进流程、接入系统、治理知识、持续迭代并对结果负责的人？

来自主题: AI资讯

9025 点击 2026-06-13 10:19

自学成才，3000 元成本，Yoroll 合作创作者做出"全球最佳 AI 短片"，好莱坞大佬全网寻人！

这几天，一部叫《丧尸清道夫》的 AI 短片，把国内外互联网都刷了一遍。没有大牌导演，没有传统动画公司的工业体系，也没有烧钱级别的制作预算。一个中国独立创作者，用十天时间、约 3000 元成本，做出了一部被网友称为"国产爱死机"的 AI 短片。

来自主题: AI资讯

9556 点击 2026-05-16 11:01

ACL 2026｜打破推理同质化！阿里达摩院新作让RLVR从重复采样走向有效探索

I²B-LPO 是一个面向 RLVR 后训练的探索增强框架，通过改进 rollout 策略引导模型生成更多样化的推理轨迹，将探索行为从 “重复采样” 推进到 “在关键节点生成更具区分度的推理轨迹”，在多个数学基准上同时提升准确率与语义多样性，最高分别达 5.3% 和 7.4%。该工作接收于 ACL 2026 Main，来自阿里达摩院 - 智能决策团队。

来自主题: AI技术研报

9580 点击 2026-05-14 14:24

从字节FunPlus出走，他决定押注AI游戏平台Yoroll

新的挑战者

来自主题: AI资讯

6176 点击 2026-05-12 15:19

训练提速4.6倍！FP4+BF16双轨并行，NVIDIA×港大×MIT联手重新定义扩散模型训练速度上限

当强化学习后训练的大规模 rollout 已经被证明能够提升图像生成模型的偏好对齐能力，推理负担就成了制约训练速度的核心瓶颈。来自 NVIDIA、港大和 MIT 的团队提出的 Sol-RL，通过「FP4 先探索、BF16 再训练」的后训练框架，将达到等效 reward 水平的收敛速度最高提升到 4.64x，在训练速度与对齐效果之间给出了一条更具工程可行性的解法。

来自主题: AI技术研报

9289 点击 2026-04-16 16:07

月之暗面公开强化学习训练加速方法：训练速度暴涨97%，长尾延迟狂降93%

u1s1，现在模型能力是Plus了，但Rollout阶段的速度却越来越慢……

来自主题: AI技术研报

8990 点击 2025-11-27 15:29

ROCK & ROLL！阿里给智能体造了个实战演练场 | 开源

智能体终于拥有了可以海量复制的“实战演练场”。阿里此次开源的新项目ROCK，解决了无法在真实环境中规模化训练的难题。有了ROCK，开发者想要训练AI执行复杂任务时可以不再“手搓”环境，直接进行标准化的一键部署。

来自主题: AI技术研报

8921 点击 2025-11-27 10:57

3A大作！阿里ROLL团队从基建->算法->机理，推动RL4LLM全栈协同优化

近期，阿里巴巴 ROLL 团队（淘天未来生活实验室与阿里巴巴智能引擎团队）联合上海交通大学、香港科技大学推出「3A」协同优化框架 ——Async 架构（Asynchronous Training）、Asymmetric PPO（AsyPPO）与 Attention 机制（Attention-based Reasoning Rhythm），

来自主题: AI技术研报

9679 点击 2025-11-11 10:24

让AI生成视频「又长又快」：Rolling Forcing实现分钟级实时生成

想象一下，你正在玩一款开放世界游戏，角色在无缝衔接的世界中自由漫游，游戏引擎必须实时生成一条无限长的视频流来呈现这个虚拟世界。或者，你戴着 AR 眼镜在街头行走，系统需要根据你的视线与动作，即时生成与你环境交互的画面。无论是哪种场景，都对 AI 提出了同样的要求：能实时生成高质量、长时间连贯的视频流。

来自主题: AI技术研报

7536 点击 2025-11-05 09:58

AEPO：智能体熵平衡策略优化，让探索更稳，推理更深！

AEPO 系统性揭示了「高熵 Rollout 采样坍缩」和「高熵梯度裁剪」问题，并设计了「动态熵平衡 Rollout 采样」与「熵平衡策略优化」两项核心机制。前者通过熵预监控与连续分支惩罚实现全局与局部探索预算的自适应分配，后者在策略更新阶段引入梯度停止与熵感知优势估计以保留高熵 token 的探索梯度。

来自主题: AI技术研报

8381 点击 2025-11-02 10:32