AI资讯新闻榜单内容搜索-模型训练

深挖RLHF潜力，复旦语言和视觉团队创新奖励模型优化，让大模型更对齐

复旦团队进一步挖掘 RLHF 的潜力，重点关注奖励模型（Reward Model）在面对实际应用挑战时的表现和优化途径。

来自主题: AI技术研报

4203 点击 2024-01-16 10:16

最近，AI初创公司Anthropic的研究表明，一旦LLM学会了人类教授的欺骗行为，它们就会在训练和评估的过程中隐藏自己，并在使用时偷偷输出恶意代码、注入漏洞。

来自主题: AI资讯

8105 点击 2024-01-16 10:06

本综述深入探讨了大型语言模型的资源高效化问题。

来自主题: AI资讯

9532 点击 2024-01-14 14:36

世界上最快超算集群Frontier，用8%的GPU训练出了一个万亿级规模的大模型，而且是在AMD硬件平台之上完成。研究人员将训练的细节和克服的困难写成了一篇论文，展示了如何用非英伟达的生态完成大模型训练的技术框架和细节。

来自主题: AI资讯

6360 点击 2024-01-13 20:20

当前智能对话模型的发展中，强大的底层模型起着至关重要的作用。这些先进模型的预训练往往依赖于高质量且多样化的语料库，而如何构建这样的语料库，已成为行业中的一大挑战。

来自主题: AI资讯

3452 点击 2024-01-12 17:31

数据获取最新解，便是从生成模型中学习。获取高质量数据，已经成为当前大模型训练的一大瓶颈。

来自主题: AI资讯

4714 点击 2024-01-12 14:19

如何从一段视频中找出感兴趣的片段？时序行为检测（Temporal Action Localization，TAL）是一种常用方法。过去TAL中的建模是片段甚至实例级的，而现在只要视频里的一帧就能实现，效果媲美全监督。

来自主题: AI技术研报

8628 点击 2024-01-08 14:33

仅需一个任务描述，即可一键分割所有图片！

来自主题: AI技术研报

8246 点击 2024-01-08 14:20

琳琅满目的乐高积木，通过一块又一块的叠加，可以创造出各种栩栩如生的人物、景观等，不同的乐高作品相互组合，又能为爱好者带来新的创意。

来自主题: AI技术研报

9047 点击 2024-01-06 16:37

解决扩散模型「不识字」的问题，Textdiffuser采用两阶段（布局+图像）生成框架，显著提升了相关性能的指标！

来自主题: AI资讯

5083 点击 2024-01-06 16:09