
连续思维机器来了!Transformer八子之一创企推出,让AI不再「一步到位」拍脑袋做决定
连续思维机器来了!Transformer八子之一创企推出,让AI不再「一步到位」拍脑袋做决定开启「分步思考」新范式。
开启「分步思考」新范式。
在视觉语言模型(Vision-Language Models,VLMs)取得突破性进展的当下,长视频理解的挑战显得愈发重要。以标准 24 帧率的标清视频为例,仅需数分钟即可产生逾百万的视觉 token,这已远超主流大语言模型 4K-128K 的上下文处理极限。
AI 不允许有人不会搭乐高。
如何将一句简单的文字描述变成物理稳定的乐高模型?LegoGPT通过物理感知技术,确保98.8%的设计稳如磐石。
递归思考 + 自我批判,CoRT 能带来 LLM 推理力的飞跃吗?
不用引入外部数据,通过自我博弈(Self-play)就能让预训练大模型学会推理?
在新一轮科技革命与产业变革的汹涌浪潮中,光子技术作为构筑未来信息社会的核心基建,正以加速度驶入智能化与规模化协同发展的深水区。作为支撑新质生产力体系的重要支柱,光子技术在信息传输、智能计算、感知交互等战略领域,发挥着不可替代的关键作用,已然成为驱动未来产业生态跃迁的核心引擎。
Agent 正在成为 2025 年 AI 世界最炙手可热的关键词之一。
近年来,生成式人工智能(Generative AI)技术的突破性进展,特别是文本到图像 T2I 生成模型的快速发展,已经使 AI 系统能够根据用户输入的文本提示(prompt)生成高度逼真的图像。从早期的 DALL・E 到 Stable Diffusion、Midjourney 等模型,这一领域的技术迭代呈现出加速发展的态势。
多模态奖励模型(MRMs)在提升多模态大语言模型(MLLMs)的表现中起着至关重要的作用,在训练阶段可以提供稳定的 reward,评估阶段可以选择更好的 sample 结果,甚至单独作为 evaluator。