RL新思路!复旦用游戏增强VLM通用推理,性能匹敌几何数据
RL新思路!复旦用游戏增强VLM通用推理,性能匹敌几何数据复旦大学NLP实验室研发Game-RL,利用游戏丰富视觉元素和明确规则生成多模态可验证推理数据,通过强化训练提升视觉语言模型的推理能力。创新性地提出Code2Logic方法,系统化合成游戏任务数据,构建GameQA数据集,验证了游戏数据在复杂推理训练中的优势。
复旦大学NLP实验室研发Game-RL,利用游戏丰富视觉元素和明确规则生成多模态可验证推理数据,通过强化训练提升视觉语言模型的推理能力。创新性地提出Code2Logic方法,系统化合成游戏任务数据,构建GameQA数据集,验证了游戏数据在复杂推理训练中的优势。
AI 会写字吗?在写字机器人衍生换代的今天,你或许并不觉得 AI 写字有多么困难。
AI视频领域杀疯了! 发布Vidu Q2图生视频不到2周,Vidu又又又更新了,而且直接甩出三张王牌。 首先是AI创作者们等待良久的Vidu Q2参考生功能终于要正式发布了。此外,Vidu视频延长功能一来就亮绝杀,最高可延长至五分钟。
据业内人士透露,微软已向英特尔下达其下一代人工智能芯片Maia 2的晶圆代工订单,计划采用英特尔的18A或18A-P制程。该芯片或将用于微软Azure数据中心等人工智能基础设施。
今天凌晨,Anthropic 上线了「Claude Code on the web」(即网页版 Claude Code)功能,这种全新的方式可以让用户直接从浏览器中委派编程任务。目前,网页版 Claude Code 处于 Beta 阶段,作为研究预览版向 Pro 和 Max 用户开放使用。
C.ai 之后,AI 陪伴还可能长出怎样的新物种?前 B 站副总裁刘斌新选择了一条非共识路线——从游戏陪伴切入,打造「逗逗游戏伙伴」。目前「逗逗游戏伙伴」已经拿下千万用户、月活突破 200 万,成为 AI 陪伴赛道里的另类黑马,如今,它正以「Hakko AI」之名加速出海。
刚刚,DeepSeek 推出了全新的视觉文本压缩模型 DeepSeek-OCR。 该模型最大的突破在于极高的压缩效率: 20 个节点每天可处理 3300 万页数据,硬件要求仅为 A100-40G。
刚刚,宇树发布第四款人形机器人 H2,高 180cm,重 70kg。和前代 H1 相比,今天发布的 H2 无论是在运动流畅性、还是仿生特征上,都有了相当大的升级。首先是整体的外观形态,和 H 系列都是 180cm 的身高一致,但是 H2 的重量突破性地来到了 70kg 左右,H1 仅有约 47kg。如果要计算它的 BMI,21.6 的结果,妥妥的一个健康好身材。
今天,网络文学行业面临着一个根本性问题:对于文学创作,AI 未来究竟是创作者,还是工具?10 月 16 日,在武汉光谷举行的 2025 阅文创作大会上,成立十周年的阅文给出了一个清晰而审慎的答案。会上,阅文密集发布了三款 AI 应用:「妙笔通鉴」、「版权助手」和「漫剧助手」。
美国麻省理工学院李巨团队在国际顶尖学术期刊Nature上发表了一篇研究论文,展示了一种多模态机器人平台CRESt(Copilot for Real-world Experimental Scientists),通过将多模态模型(融合文本知识、化学成分以及微观结构信息)驱动的材料设计与高通量自动化实验相结合,大幅提升催化剂的研发速度和质量。