
LLM的范式转移:RL带来新的 Scaling Law
LLM的范式转移:RL带来新的 Scaling Law从几周前 Sam Altman 在 X 上发布草莓照片开始,整个行业都在期待 OpenAI 发布新模型。根据 The information 的报道,Strawberry 就是之前的 Q-star,其合成数据的方法会大幅提升 LLM 的智能推理能力,尤其体现在数学解题、解字谜、代码生成等复杂推理任务。这个方法也会用在 GPT 系列的提升上,帮助 OpenAI 新一代 Orion。
从几周前 Sam Altman 在 X 上发布草莓照片开始,整个行业都在期待 OpenAI 发布新模型。根据 The information 的报道,Strawberry 就是之前的 Q-star,其合成数据的方法会大幅提升 LLM 的智能推理能力,尤其体现在数学解题、解字谜、代码生成等复杂推理任务。这个方法也会用在 GPT 系列的提升上,帮助 OpenAI 新一代 Orion。
罗盟,本工作的第一作者。新加坡国立大学(NUS)人工智能专业准博士生,本科毕业于武汉大学。主要研究方向为多模态大语言模型和 Social AI、Human-eccentric AI。
现有的大模型已经能够创作令人惊叹画作,那鉴赏艺术画作岂不是信手拈来?
昆仑万维AI业务扩张未获预期效益,面临亏损挑战。
本文的主要作者来自香港大学的数据智能实验室 (Data Intelligence Lab@HKU)。
最近,又一款国产 AI 神器吸引了众网友和圈内研究人员的关注!它就是全新的图像和视频生成控制工具 —— ControlNeXt,由思谋科技创始人、港科大讲座教授贾佳亚团队开发。
智东西8月27日消息,据TechCrunch报道,AI动画黑马创企Viggle昨晚宣布已完成1900万美元的A轮融资。本轮融资由硅谷顶级风投Andreessen Horowitz(a16z)领投,Two Small Fish跟投。
在2024年AI Infra @Scale会议上发表开幕主旨演讲
性能不输Mistral与Llama,优化多语言支持,强化合规性。
在本次大会上,智平方搭建了“新质生产力”和“智能新生活”展区,在两个真实场景中展现了通用智能机器人Alpha Bot聪明实用、高度范化的能力。