RL加持的3D生成时代来了!首个「R1 式」文本到3D推理大模型AR3D-R1登场
RL加持的3D生成时代来了!首个「R1 式」文本到3D推理大模型AR3D-R1登场强化学习(RL)在大语言模型和 2D 图像生成中大获成功后,首次被系统性拓展到文本到 3D 生成领域!面对 3D 物体更高的空间复杂性、全局几何一致性和局部纹理精细化的双重挑战,研究者们首次系统研究了 RL 在 3D 自回归生成中的应用!
强化学习(RL)在大语言模型和 2D 图像生成中大获成功后,首次被系统性拓展到文本到 3D 生成领域!面对 3D 物体更高的空间复杂性、全局几何一致性和局部纹理精细化的双重挑战,研究者们首次系统研究了 RL 在 3D 自回归生成中的应用!
过去两年,我们几乎默认了一件事: 人和 AI 的交互就只能靠文本框和语音。 不管是 GPT、DeepSeek、Claude,还是各种音视频 Agent,核心入口几乎清一色是一个聊天框。 但只要你真正做
“中国的OpenAI” 是谁?一众媒体和分析机构给出的答案是:智谱。家中国的大模型 AI 创业公司正在港交所冲刺 IPO。在招股说明书中,它明确宣称:“2025年6月,智谱被美国OpenAI 列为全球主要竞争对手。”
2025年年初,一场常规的业务沟通会,在腾讯新闻负责人何毅进的引导下画风突变。他把这场全员会开成一场“AI焦虑吐槽大会”。
2025年底,当人类都在憧憬和等待一个全知全能的AI之神时,谷歌DeepMind却泼了一盆冷水!
即将过去的、我们无比熟悉的 2025 年,被称为是 Agent 的元年。
2025 年还有一周结束,年底,AI 视频圈又卷起来了。
在 SIGGRAPH Asia 2025 期间,盛大 AI 东京研究院(Shanda AI Research Tokyo)以展台活动、BoF 学术讨论与顶尖教授闭门交流等形式完成首次公开亮相,标志着盛大在数字人的 “交互智能 (Interactive Intelligence)” 与世界模型的 “时空智能 (Spatiotemporal Intelligence)” 等两大方向的研究
和传统的游戏自动化脚本不同,这是一个完整的通用的大模型,不仅限于单一游戏的操作,能够玩遍市面上几乎全部的游戏类型。于是,让我们正式介绍主角,来自英伟达的最新开源基础模型 NitroGen。该模型的训练目标是玩 1000 款以上的游戏 —— 无论是 RPG、平台跳跃、吃鸡、竞速,还是 2D、3D 游戏,统统不在话下!
前阵子带大家盘的学生 Gemini Pro会员,今天排上用场了。6 块钱拿下 Gemini 教育优惠,12.12 实测有效(5分钟搞定)最近在折腾 Gemini 的反重力,因为是真的香。(真香.jpg)