视频模型假装在推理?MME-CoF新基准评估12个推理维度
视频模型假装在推理?MME-CoF新基准评估12个推理维度视频生成模型如Veo-3能生成逼真视频,但有研究发现其推理能力存疑。香港中文大学、北京大学、东北大学的研究者们设计了12项测试,发现模型只能模仿表面模式,未真正理解因果。这项研究为视频模型推理能力评估提供基准,指明未来研究方向。
视频生成模型如Veo-3能生成逼真视频,但有研究发现其推理能力存疑。香港中文大学、北京大学、东北大学的研究者们设计了12项测试,发现模型只能模仿表面模式,未真正理解因果。这项研究为视频模型推理能力评估提供基准,指明未来研究方向。
一张图,一个3D世界!今天,李飞飞团队重磅放出实时生成世界模型「RTFM」,通过端到端学习大规模视频数据,直接从输入2D图像生成同一场景下新视角的图像。值得一提的是,它仅需单块H100 GPU便能实时渲染出持久且3D一致的世界。
李飞飞的世界模型创业,最新成果来了!刚刚,教母亲自宣布对外推出全新模型RTFM(A Real-Time Frame Model),不仅具备实时运行、持久性和3D一致性,更关键的是——单张H100 GPU就能跑。
前不久,我们在收集新闻时,发现一款名为「AI 男子」的女性向 AI 陪伴项目正式上线,主要理念是“创造一个可以与自己喜欢的人交谈的世界”。「AI 男子」由日本公司 Odd Number 打造,上线初始便在 X、Instagram 和 TikTok 等主流社媒全面布局。
Supermemory 已获得由 Susa Ventures、Browder Capital 和 SF1.vc 领投的 260 万美元种子轮融资。此轮融资还包括 Cloudflare 的 Knecht、谷歌人工智能负责人 Jeff Dean、DeepMind 产品经理 Logan Kilpatrick、Sentry 创始人 David Cramer 以及来自 OpenAI、
奥特曼亲自飞赴首尔,与韩国总统、两大财阀巨头会晤并达成合作。三星电子与SK海力士将加速生产先进存储芯片,目标月产能达90万片DRAM晶圆,以满足OpenAI模型的需求。随着奥特曼逐渐握紧硬件的咽喉,留给竞争对手的时间,不多了。
DeepMind公开了有关Veo 3视频模型最新论文!论文提出了「帧链」(Chain-of-Frames,CoF),认为视频模型也可能像通用大模型一样具备推理能力。零样本能力的涌现,表明视频模型的「GPT-3时刻」来了。
CoT思维链的下一步是什么? DeepMind提出帧链CoF(chain-of-frames)。
就在上周的 Meta Connect 开发者大会上,Meta 发布了三款全新智能眼镜,但本该展示“未来体验”的现场演示却屡屡翻车。Bosworth 随后在 Instagram 上火速澄清,否认了小扎的说法。他坦言,这不是 Wi-Fi 的问题,也不是场地的原因,而是 Meta 自己的设置和失误。
起猛了,AI当上政府官员了。 智东西9月12日消息,据多家外媒报道,阿尔巴尼亚总理埃迪·拉马(Edi Rama)宣布新内阁成员名单,任命AI虚拟机器人Diella为阿尔巴尼亚新一任公共采购部长。