2024的最后一天,由智谱AI新上线的o1为这一年划上句点。
2024的最后一天,由智谱AI新上线的o1为这一年划上句点。当你登录智谱清言的时候,就能看到他们上线了这个Zero推理模型,不过是以智能体的形式出现的。
当你登录智谱清言的时候,就能看到他们上线了这个Zero推理模型,不过是以智能体的形式出现的。
国产之光DeepSeek V3竞技场排名新鲜出炉—— 优于o1-mini(总榜第7),获最强开源模型认证(也是唯一闯入前10的开源模型)。
随着 o1、o1 Pro 和 o3 的成功发布,我们明显看到,推理所需的时间和计算资源逐步上升。可以说,o1 的最大贡献在于它揭示了提升模型效果的另一种途径:在推理过程中,通过优化计算资源的配置,可能比单纯扩展模型参数更为高效。
世界顶尖免疫学家Derya Unutmaz与o1 pro合作,让它帮忙评析自己的论文,发现它反馈的深度远超预期,令他感到震撼。此外,o1 pro还在解决人文研究问题上展现了卓越的能力。
近期NexusTrade的创始人Austin Starks撰文介绍了他使用OpenAI o1模型构建投资组合的一些经验。并展示如何使用OpenAI o1彻底改变金融市场的研究、分析和交易方式。
本月,OpenAI科学家就当前LLM的scaling方法论能否实现AGI话题展开深入辩论,认为将来AI至少与人类平分秋色;LLM scaling目前的问题可以通过后训练、强化学习、合成数据、智能体协作等方法得到解决;按现在的趋势估计,明年LLM就能赢得IMO金牌。
上线一周, gemini-2.0-flash-exp、gemini-2.0-flash-thinking-exp 已经成为了我日常对话频率最高的模型之一。
今天想跟大家聊一个科技圈和生物医学圈都值得关注的“炸裂”事件。一位顶尖的免疫学专家,Derya Unutmaz博士,刚刚分享了一段让他“震撼到情绪激动”的经历:他把自己和学生撰写的关于MAIT细胞的综述文章,交给o1-Pro进行评估,结果AI给出的评论和洞察碾压了他
在 2024 年底,探索通用人工智能(AGI)本质的 DeepSeek AI 公司开源了最新的混合专家(MoE)语言模型 DeepSeek-V3-Base。虽然,目前没有放出详细的模型卡,但官方开源了V3的技术文档PDF。
最近,类 o1 模型的出现,验证了长思维链 (CoT) 在数学和编码等推理任务中的有效性。在长思考(long thought)的帮助下,LLM 倾向于探索、反思和自我改进推理过程,以获得更准确的答案。