图灵奖颁给强化学习师徒,一个造船改行写代码,一个痛批AI投身AGI
图灵奖颁给强化学习师徒,一个造船改行写代码,一个痛批AI投身AGI他们为ChatGPT/AlphaGo奠定基石
他们为ChatGPT/AlphaGo奠定基石
AGI的成熟度是一步一步提升的。
周末读到一篇兼具现实和科幻色彩的雄文《The A.I. Monarchy》(AI 君主制),其作者 Mihnea Măruță 是罗马尼亚新闻和哲学领域的杰出人物,他最有名的著作《Identitatea virtuală》(虚拟身份),从社会哲学角度分析了社交媒体对身份的影响,
回顾 AGI 的爆发,从最初的 pre-training (model/data) scaling,到 post-training (SFT/RLHF) scaling,再到 reasoning (RL) scaling,找到正确的 scaling 维度始终是问题的本质。
与3D物理环境交互、适应不同机器人形态并执行复杂任务的通用操作策略,一直是机器人领域的长期追求。
o1/DeepSeek-R1背后秘诀也能扩展到多模态了!
去年,Sam Altman曾做过一个预测: 有了AI,我们很快就会看到第一家估值10亿美元,但只有一个人的AI公司。
通过针对视觉的细分类、目标检测等任务设计对应的规则奖励,Visual-RFT 打破了 DeepSeek-R1 方法局限于文本、数学推理、代码等少数领域的认知,为视觉语言模型的训练开辟了全新路径!
大模型的快速及持续发展,离不开对模型所有权及数据隐私的保护。
最近,谷歌与瑞士邮政下属的 Digitalidag 联合举办了一场提示词比赛,选手们的任务是编写提示词(指令),比如让 AI 助手制定一份详细的学习计划。Joakim Jardenberg 获得了本次比赛的亚军,Wrap News 对其进行了一场专访,就提示词的创作进行了交流。