AI资讯新闻榜单内容搜索-模型

RL 是 LLM 的新范式

AGI 正在迎来新范式，RL 是 LLM 的秘密武器。

来自主题: AI资讯

8859 点击 2024-08-27 10:36

190款大模型背后：揭秘600天后的中国大模型产业落地「真相」

通过600多天里的大模型中标项目，我们看到了什么？

来自主题: AI资讯

9848 点击 2024-08-27 10:27

原理与代码：混合精度训练详解

计算机是二进制的世界，所以浮点数也是用二进制来表示的，与整型不同的是，浮点数通过3个区间来表示：

来自主题: AI技术研报

8580 点击 2024-08-27 09:59

RTX3090可跑，360AI团队开源最新视频模型FancyVideo，红衣大叔都说好

近日，开源社区又迎来一款强力的「视频生成」工作，可以在消费级显卡 (如 GeForce RTX 3090) 上生成任意分辨率、任意宽高比、不同风格、不同运动幅度的视频，其衍生模型还能够完成视频扩展、视频回溯的功能…… 这便是 360AI 团队和中山大学联合研发的 FancyVideo，一种基于 UNet 架构的视频生成模型。

来自主题: AI资讯

5604 点击 2024-08-26 16:44

Yann LeCun不看好强化学习：「我确实更喜欢 MPC」

「相比于强化学习（RL），我确实更喜欢模型预测控制（MPC）。至少从 2016 年起，我就一直在强调这一点。强化学习在学习任何新任务时都需要进行极其大量的尝试。相比之下，模型预测控制是零样本的：如果你有一个良好的世界模型和一个良好的任务目标，模型预测控制就可以在不需要任何特定任务学习的情况下解决新任务。这就是规划的魔力。这并不意味着强化学习是无用的，但它的使用应该是最后的手段。」

来自主题: AI资讯

8394 点击 2024-08-26 16:25