
首个多模态统一CoT奖励模型来了,模型、数据集、训练脚本全开源
首个多模态统一CoT奖励模型来了,模型、数据集、训练脚本全开源在多模态大模型快速发展的当下,如何精准评估其生成内容的质量,正成为多模态大模型与人类偏好对齐的核心挑战。然而,当前主流多模态奖励模型往往只能直接给出评分决策,或仅具备浅层推理能力,缺乏对复杂奖励任务的深入理解与解释能力,在高复杂度场景中常出现 “失真失准”。
在多模态大模型快速发展的当下,如何精准评估其生成内容的质量,正成为多模态大模型与人类偏好对齐的核心挑战。然而,当前主流多模态奖励模型往往只能直接给出评分决策,或仅具备浅层推理能力,缺乏对复杂奖励任务的深入理解与解释能力,在高复杂度场景中常出现 “失真失准”。
北美应届毕业的ML博士,方向为RL,读博期间跟的是大牛导师,5篇顶会一作,拿到的offer年薪却只有35万刀?他发帖质疑后,各位业内大佬们现身了。
「AI 的使用将成为我们招聘时考虑的一部分。」
近日,具身智能公司「星际光年」宣布连续完成数千万天使轮和天使+轮融资,天使轮由峰瑞资本领投,嘉程资本跟投,天使+轮由云时资本领投,水木清华校友种子基金跟投。据悉,本轮融资将用于加速产品研发升级,扩大团队规模,加速场景落地。
开发能在开放世界中完成多样任务的通用智能体,是AI领域的核心挑战。开放世界强调环境的动态性及任务的非预设性,智能体必须具备真正的泛化能力才能稳健应对。然而,现有评测体系多受限于任务多样化不足、任务数量有限以及环境单一等因素,难以准确衡量智能体是否真正「理解」任务,或仅是「记住」了特定解法。
流匹配模型因其坚实的理论基础和在生成高质量图像方面的优异性能,已成为图像生成(Stable Diffusion, Flux)和视频生成(可灵,WanX,Hunyuan)领域最先进模型的训练方法。然而,这些最先进的模型在处理包含多个物体、属性与关系的复杂场景,以及文本渲染任务时仍存在较大困难。
NeurIPS投稿数量破纪录了!Deadline还有不到一个月,如何让论文更容易中?
昨晚,美商务部正式废止《AI扩散规则》,同时加码全球半导体出口管制,精准打击中国AI发展。发布指导意见,在世界任何地方使用华为AI芯片,都违反美国出口管制。 警告公众当美国AI芯片被用于训练/推理中国AI模型时的潜在后果。向美国公司发布关于如何保护供应链免受转移策略影响的指导意见。
昨天看到了一个挺有意思的产品发布。是腾讯云自己家的代码助手,CodeBuddy,开了个直播,发了他们的3.0版本。
OpenAI发布新基准HealthBench,联手60个国家262名执业医生,树立新的「AGI标志性用例」。OpenAI o3碾压Grok 3和Gemini 2.5 Pro,成功登顶。而最强AI几乎达到了人类医生最佳水平!
AI大模型“六小虎”之一的月之暗面,近期对AI医疗产品进行了布局,用于提升旗下产品Kimi在专业领域的搜索质量,并且探索Agent等产品方向。针对上述信息,月之暗面回应《智能涌现》:Kimi近期持续在优化财经、法律、医学等专业领域的搜索信源质量,希望给用户提供更可信、可靠的高质量回答。
说个超级有意思的事。 今天凌晨,一个AI设计类的垂直Agent工具,在X上爆了。
世界模型的进度条,最近坐上了火箭。
AI搜索引擎公司Perplexity新融资消息曝光!
一夜之间,老黄天塌了(doge)。
还记得刘慈欣在《全频带阻塞干扰》中描绘的耀斑爆发吗?
近日,AI制药独角兽公司 insitro宣布,为了简化运营,公司裁员22%,将现金流延长到2027年。
出海产品Web和App普遍增长。
最近,Meta 公司首席 AI 科学家、图灵奖得主 LeCun 转发了他在纽约大学的同事 Kyunghyun Cho 的一篇帖子:内容是关于这位教授 2025 学年机器学习研究生课程的教学大纲和讲义。
“先推理、再作答”,语言大模型的Thinking模式,现在已经被拓展到了图片领域。
教宗良十四世取名的原因,居然和AI有关?他已经提前预见到AI将给人类尊严、正义和劳动带来颠覆性的剧变。而美国首任「AI和加密货币沙皇」David Sacks也做出了预测:在四年内,AI的发展将达到一百万倍!
当训练成本飙升、数据枯竭,如何继续激发大模型潜能?
80年代,当强化学习被冷落,这对师徒没有放弃;如今,重看来时路,他们给出的建议仍然是,「坚持」住自己的科研思想。
「矩阵」不再是科幻!Matrix-Game震撼来袭,突破边界带来交互式引擎。只需一句话,沙漠森林等任意场景可控生成,动作丝滑操控,360°视角自由切换,沉浸感爆棚。
Hi,我是银海。 你身边的AI产品经理,陪你解决每一个真实问题。 刚刚,前阵子很火的 AI Agent 概念工具 Manus,刚刚终于开放了全面注册。
近来,GPT-4.1关键人物揭秘了GPT-5进展,挑战在于平衡推理与聊天能力。与此同时,OpenAI首席研究官在新采访中,畅谈了通往AGI之路的关键要素。
各种AI模型在刚问世时,总有一个屡试不爽的“秀肌肉”手段,那就是让自家AI独立游玩某款游戏,用以检验模型的智能程度。
硬氪获悉,近日新加坡人工智能金融科技公司RockFlow宣布完成1000万美元A1轮融资,由头部互联网公司创始人领投,老股东持续加注。本轮资金将用于进一步提升其人工智能技术和即将推出的金融AI Agent —— Bobby。
电竞赛事是游戏直播的流量高峰,但流量高峰在当下并不易攀登。
AI下沉任重道远