CVPR 2026|1分钟单图变4D视频!AI看图直接脑补物理规律
CVPR 2026|1分钟单图变4D视频!AI看图直接脑补物理规律让静态的图片变成三维物体并动起来已经不算新鲜,但如果让图片不仅动起来,还能完美遵循现实世界的物理规律(比如蛋糕的Q弹、沙堆的散落、石雕的坚硬)呢?
来自主题: AI技术研报
5823 点击 2026-04-08 16:27
让静态的图片变成三维物体并动起来已经不算新鲜,但如果让图片不仅动起来,还能完美遵循现实世界的物理规律(比如蛋糕的Q弹、沙堆的散落、石雕的坚硬)呢?
作者测试了智谱GLM-4.5V(开启/关闭推理)、豆包、Kimi、元宝和ChatGPT-5在识别十张奇葩卫生间标识上的表现。评测模拟紧急如厕场景,按识别正确性评分。结果智谱普通模式得分最高(86分),ChatGPT-5和智谱推理模式次之(78分),豆包和元宝70分,Kimi垫底(38分),揭示了各AI视觉能力的差异及局限性。
最近这帮人我也不知道是因为啥,连续聊了3天跃问了,就是阶跃星辰那个手机APP。一直看我文章的老粉丝可能知道,跃问在我这儿一直都是iPhone16的AI识图启动器,但是我自己确实已经有段时间没去深度体验了。