
只用图像也能思考,强化学习造就推理模型新范式!复杂场景规划能力Max
只用图像也能思考,强化学习造就推理模型新范式!复杂场景规划能力Max近年来,LLM 及其多模态扩展(MLLM)在多种任务上的推理能力不断提升。然而, 现有 MLLM 主要依赖文本作为表达和构建推理过程的媒介,即便是在处理视觉信息时也是如此 。
近年来,LLM 及其多模态扩展(MLLM)在多种任务上的推理能力不断提升。然而, 现有 MLLM 主要依赖文本作为表达和构建推理过程的媒介,即便是在处理视觉信息时也是如此 。
苹果AI、机器人业务传来新动向。据知情人士透露,苹果计划本月晚些时候调整人工智能业务负责人约翰·贾南德雷亚(John Giannandrea)的权限,他将不再负责苹果机器人部门的管理工作。转而由苹果高级副总裁约翰·特努斯(John Ternus)负责机器人项目的硬件开发工作。
故老相传:中国人擅长做应用,但在这次AI的应用上结果却大相径庭,美国人在AI应用上看起来跑得更快。Glean、Harvey等这类应用动辄ARR(Annual Recurring Revenue)过1亿美金,ARR过2500万美金的初创企业更是有相当大一批。
扩展无语言的视觉表征学习。
“尽管我希望在今年第一季度发货,但我的项目仍需要改进,只有当设计完成了95%时,才可以开始制造电子产品。”AI项链产品Friend的创始人Schiffmann给客户们发出一封邮件,将其产品的出货时间推到了第三季度,这件事引发了高度关注。
近日,Meta等机构发表的论文介绍了一种通过进化算法构造高质量数据集的方法:拒绝指令偏好(RIP),得到了Yann LeCun的转赞。相比未经过滤的数据,使用RIP构建的数据集让模型在多个基准测试中都实现了显著提升。
“放弃生成式模型,不研究LLM(大语言模型),我们没办法只通过文本训练让AI达到人类的智慧水平。”近日,Meta首席AI科学家杨立昆(Yann LeCun)在法国巴黎的2025年人工智能行动峰会上再一次炮轰了生成式AI。
在当今的 AI 领域,图灵奖得主 Yann LeCun 算是一个另类。即便眼见着自回归 LLM 的能力越来越强大,能解决的任务也越来越多,他也依然坚持自己的看法:自回归 LLM 没有光明的未来。
新年伊始,在估值攀上 3400 亿美元的新巅峰后,OpenAI 也辞旧迎新,更换了新字体、新标志、新配色方案,进行了一次全面的品牌重塑。Open AI 这次重塑的目的,一是为了摆脱设计总监 Shannon Jager 所说的「OpenAI 一直在用相当随意的方式,向世界展示自己。字体、Logo 和颜色的杂乱无章,只会彰显出公司缺乏明确的统一战略。」
1月23日,在第55届世界经济论坛(冬季达沃斯)上,“深度学习”三巨头之一、图灵奖得主、Meta AI首席科学家杨立昆(Yann LeCun),如此对腾讯新闻《一线》透露Meta2025年在AI领域的投资规模。