AI资讯新闻榜单内容搜索-对齐

Claude团队揭发AI伪装对齐：训练时假装遵守目标，只为保护自己价值观不被修改

丸辣！原来AI有能力把研究员、用户都蒙在鼓里：在训练阶段，会假装遵守训练目标；训练结束不受监控了，就放飞自我。还表现出区别对待免费用户和付费用户的行为。

来自主题: AI技术研报

7082 点击 2024-12-20 09:57

震惊！Claude伪对齐率竟能高达78％，Anthropic 137页长论文自揭短

今天，大模型公司 Anthropic 的一篇 137 页长论文火了！该论文探讨了大语言模型中的「伪对齐」，通过一系列实验发现：Claude 在训练过程中经常假装有不同的观点，而实际上却保持了其原始偏好。

来自主题: AI技术研报

6678 点击 2024-12-19 16:08

在线试玩 | 对齐、生成效果大增，文本驱动的风格转换迎来进阶版

近年来，随着 Stable Diffusion 等文本到图像生成模型的发展，这些技术使得在保留内容准确性的同时，实现出色的风格转换成为可能。这项技术在数字绘画、广告和游戏设计等领域具有重要的应用价值。

来自主题: AI技术研报

8296 点击 2024-12-19 15:34

Pika 2.0横扫Sora惊艳全网，一键颠覆广告业！上传自拍秒变好莱坞大片，和明星同框不是梦

斯坦福天才少女，让AI视频的格局再次颠覆！Pika 2.0上线不久即引发全网狂潮，强大场景元素功能、超强文本对齐、深刻物理学理解，让它在AI视频大混战中脱颖而出，效果不输谷歌Veo 2.0。网友们疯狂实测，人手一部广告大片。

来自主题: AI资讯

7852 点击 2024-12-18 20:32

离职OpenAI后Lilian Weng博客首发！深扒RL训练漏洞，业内狂赞

Lilian Weng离职OpenAI后首篇博客发布！文章深入讨论了大模型强化学习中的奖励欺骗问题。随着语言模型在许多任务上的泛化能力不断提升，以及RLHF逐渐成为对齐训练的默认方法，奖励欺骗在语言模型的RL训练中已经成为一个关键的实践性难题。

来自主题: AI资讯

8386 点击 2024-12-06 09:54

全自动组装家具！斯坦福发布IKEA Video Manuals数据集：首次实现「组装指令」真实场景4D对齐

斯坦福大学推出的IKEA Video Manuals数据集，通过4D对齐组装视频和说明书，为AI理解和执行复杂空间任务提供了新的挑战和研究基准，让机器人或AR眼镜指导家具组装不再是梦。

来自主题: AI技术研报

8185 点击 2024-12-03 16:37

惊天反转！LeCun竟与奥特曼达成共识：承认AGI 5到10年降临，但LLM注定死路一条

就在刚刚，LeCun一反常态地表示：AGI离我们只有5到10年了！这个说法，跟之前的「永远差着10到20年」大相径庭。当然，他还是把LLM打为死路，坚信自己的JEPA路线。至此，各位大佬们的口径是对齐了，有眼力见儿的投资人该继续投钱了。

来自主题: AI技术研报

6103 点击 2024-11-29 15:08

代码模型自我进化超越GPT-4o蒸馏！UIUC伯克利等提出自对齐方法 | NIPS 2024

代码模型可以自己进化，利用自身生成的数据来进行指令调优，效果超越GPT-4o直接蒸馏！

来自主题: AI技术研报

7268 点击 2024-11-28 20:44

跨模态大升级！少量数据高效微调，LLM教会CLIP玩转复杂文本

在当今多模态领域，CLIP 模型凭借其卓越的视觉与文本对齐能力，推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习，将视觉与语言信号嵌入到同一特征空间中，受到了广泛应用。

来自主题: AI技术研报

6408 点击 2024-11-27 14:41

将偏好学习引入模型训练，北大李戈团队新框架，可显著提升代码准确性与执行效率

代码模型SFT对齐后，缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作，在模型训练过程中引入偏好学习，提出了一个全新的代码生成优化框架——CodeDPO。

来自主题: AI技术研报

7992 点击 2024-11-27 14:35

AI资讯新闻榜单内容搜索-对齐

Claude团队揭发AI伪装对齐：训练时假装遵守目标，只为保护自己价值观不被修改

震惊！Claude伪对齐率竟能高达78％，Anthropic 137页长论文自揭短

在线试玩 | 对齐、生成效果大增，文本驱动的风格转换迎来进阶版

Pika 2.0横扫Sora惊艳全网，一键颠覆广告业！上传自拍秒变好莱坞大片，和明星同框不是梦

离职OpenAI后Lilian Weng博客首发！深扒RL训练漏洞，业内狂赞

全自动组装家具！ 斯坦福发布IKEA Video Manuals数据集：首次实现「组装指令」真实场景4D对齐

惊天反转！LeCun竟与奥特曼达成共识：承认AGI 5到10年降临，但LLM注定死路一条

代码模型自我进化超越GPT-4o蒸馏！UIUC伯克利等提出自对齐方法 | NIPS 2024

跨模态大升级！少量数据高效微调，LLM教会CLIP玩转复杂文本

将偏好学习引入模型训练，北大李戈团队新框架，可显著提升代码准确性与执行效率

全自动组装家具！斯坦福发布IKEA Video Manuals数据集：首次实现「组装指令」真实场景4D对齐