中国出生的她,3个月做出一家独角兽,估值已超10亿美元,33岁成为斯坦福终身教授,曾为白宫提建议
中国出生的她,3个月做出一家独角兽,估值已超10亿美元,33岁成为斯坦福终身教授,曾为白宫提建议李飞飞创办World Labs,估值超10亿美元。
李飞飞创办World Labs,估值超10亿美元。
「AI教母」创业,3个月就干出了估值10亿的AI独角兽。
World Labs被曝已完成2轮融资,最新一轮融资金额约1亿美元。
从排名Top20的美国AI教育产品中,一窥 AI 战略背后的产品取胜关键。
在人工智能领域的发展过程中,对大语言模型(LLM)的控制与指导始终是核心挑战之一,旨在确保这些模型既强大又安全地服务于人类社会。早期的努力集中于通过人类反馈的强化学习方法(RLHF)来管理这些模型,成效显著,标志着向更加人性化 AI 迈出的关键一步。
最近两天,一篇入选 ACL 2024 的论文《Can Language Models Serve as Text-Based World Simulators?》在社交媒体 X 上引发了热议,就连图灵奖得主 Yann LeCun 也参与了进来。
人形机器人的「Hello World」。
随着大型语言模型(LLM)规模不断增大,其性能也在不断提升。尽管如此,LLM 依然面临着一个关键难题:与人类的价值和意图对齐。在解决这一难题方面,一种强大的技术是根据人类反馈的强化学习(RLHF)。
高质量图像编辑的方法有很多,但都很难准确表达出真实的物理世界。 那么,Edit the World试试。
比斯坦福DPO(直接偏好优化)更简单的RLHF平替来了,来自陈丹琦团队。 该方式在多项测试中性能都远超DPO,还能让8B模型战胜Claude 3的超大杯Opus。 而且与DPO相比,训练时间和GPU消耗也都大幅减少。