AI资讯新闻榜单内容搜索-世界模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 世界模型
拒绝透露姓名,神秘世界模型 MotuBrain 却拿了两个世界第一

拒绝透露姓名,神秘世界模型 MotuBrain 却拿了两个世界第一

拒绝透露姓名,神秘世界模型 MotuBrain 却拿了两个世界第一

一款名为 MotuBrain 的神秘世界模型,悄无声息地登上两个国际 benchmark 的榜首,没有任何公司署名。如果只是单榜第一,这件事或许并不稀奇。但问题在于,它同时拿下的,是两个几乎代表行业「两个极点」的榜单:一个是衡量世界模型「是否真正理解和预测现实世界」的 WorldArena

来自主题: AI资讯
8589 点击    2026-04-21 23:33
阿里首个世界模型:快乐…生蚝

阿里首个世界模型:快乐…生蚝

阿里首个世界模型:快乐…生蚝

就在刚刚,成立恰满一个月的阿里ATH(Alibaba Token Hub)事业群,发布全球首个主动式实时交互的世界模型产品。名也挺有趣的,叫HappyOyster(快乐生蚝)。HappyOyster搭载原生多模态架构,背后是支持多模态输入与音视频联合生成的流式生成世界模型,核心主打漫游(Wander)、导演(Direct)、创造(Create)、分享(Share)。

来自主题: AI资讯
7922 点击    2026-04-17 15:24
π0.7发布,VLA押出了机器人的GPT-3时刻

π0.7发布,VLA押出了机器人的GPT-3时刻

π0.7发布,VLA押出了机器人的GPT-3时刻

今天凌晨,Physical Intelligence发布了全新的VLA模型π0.7,狠狠敲了世界模型一记闷棍。π0.7第一次在机器人领域证明了Compositional Generalization(组合泛化),且VLA。

来自主题: AI资讯
7642 点击    2026-04-17 15:18
智象未来完成超5亿元新一轮融资,全力打造下一代原生全模态世界模型|AlphaFamily

智象未来完成超5亿元新一轮融资,全力打造下一代原生全模态世界模型|AlphaFamily

智象未来完成超5亿元新一轮融资,全力打造下一代原生全模态世界模型|AlphaFamily

近日,国内多模态生成式人工智能公司智象未来(HiDream.ai)宣布完成超5亿元新一轮融资。本轮融资由东方富海、安徽省投资集团旗下的省产业投资公司、峰华资本等新股东联合投资,同时合肥产投、兴泰集团、合肥高投、安徽省人工智能母基金等老股东持续加注。

来自主题: AI资讯
7439 点击    2026-04-16 13:01
刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎

刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎

刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎

今日,腾讯正式发布并开源混元3D世界模型2.0(HY-World 2.0)。作为一款多模态的世界模型,HY-World 2.0支持文字、图片和视频等形式输入,可自动生成、重建并模拟完整的3D世界。

来自主题: AI资讯
8565 点击    2026-04-16 11:14
刚刚,李飞飞世界模型新成果发布

刚刚,李飞飞世界模型新成果发布

刚刚,李飞飞世界模型新成果发布

距离新模型Marble 1.1&1.1-Plus发布不到一个周,李飞飞空间智能独角兽World Labs再度传来新消息—— 开源3D高斯溅射渲染引擎Spark 2.0。

来自主题: AI技术研报
9230 点击    2026-04-15 10:10
目标更重要?国内公司超越Generalist,进化到动作中心世界模型

目标更重要?国内公司超越Generalist,进化到动作中心世界模型

目标更重要?国内公司超越Generalist,进化到动作中心世界模型

最近,具身智能圈被 Generalist CEO 的一篇长文《Going Beyond World Models & VLAs》刷屏。文章抛出了一个看似振聋发聩的观点:目标远比工具标签更重要。与其陷入 “我们到底是在做 VLA(视觉 - 语言 - 动作模型)还是世界模型(World Model)” 的教条之争,不如回归本源:让机器高效、准确地作用于物理世界。

来自主题: AI技术研报
10030 点击    2026-04-15 09:45
头号玩家照进现实!NTU发布世界模型交互新范式,攻克主动操作难题

头号玩家照进现实!NTU发布世界模型交互新范式,攻克主动操作难题

头号玩家照进现实!NTU发布世界模型交互新范式,攻克主动操作难题

南洋理工大学MMLab团队推出Hand2World,让AI世界模型真正「伸手」互动。只需在空中比划手势,模型就能生成逼真第一人称交互视频,实时响应调整。它摒弃旧有遮挡误导,用3D手部结构与射线编码解耦手与头运动,首次实现闭环持续交互。

来自主题: AI技术研报
5612 点击    2026-04-14 15:43