AI资讯新闻榜单内容搜索-Vide

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Vide

全新视角看世界模型：从视频生成迈向通用世界模拟器

全新视角看世界模型：从视频生成迈向通用世界模拟器

全新视角看世界模型：从视频生成迈向通用世界模拟器

近年来，视频生成（Video Generation）与世界模型（World Models）已跃升为人工智能领域最炙手可热的焦点。从 Sora 到可灵（Kling），视频生成模型在运动连续性、物体交互与部分物理先验上逐渐表现出更强的「世界一致性」，让人们开始认真讨论：能否把视频生成从「逼真短片」推进到可用于推理、规划与控制的「通用世界模拟器」。

来自主题: AI技术研报

10207 点击 2026-02-09 14:36

Vibe Researching必备的科研MCP和Skills，实现10倍学术产出

Vibe Researching必备的科研MCP和Skills，实现10倍学术产出

Vibe Researching必备的科研MCP和Skills，实现10倍学术产出

大家好，我是鲁工。 Vibe Coding概念火了之后，顺带在很多领域兴起了Vibe的潮流。比如Vibe PPT、Vibe Video，以及我今天要聊的Vibe Researching。

来自主题: AI技术研报

11146 点击 2026-02-02 10:03

刚刚，创智+模思发布开源版Sora2，电影级音视频同步生成，打破闭源技术垄断

刚刚，创智+模思发布开源版Sora2，电影级音视频同步生成，打破闭源技术垄断

刚刚，创智+模思发布开源版Sora2，电影级音视频同步生成，打破闭源技术垄断

今天上午，上海创智学院 OpenMOSS 团队联合初创公司模思智能（MOSI），正式发布了端到端音视频生成模型 —— MOVA（MOSS-Video-and-Audio）。

来自主题: AI技术研报

9026 点击 2026-01-30 10:39

Video版的Deep Research来了？先浏览再定位后精读：精度提升token消耗反降58.3%

Video版的Deep Research来了？先浏览再定位后精读：精度提升token消耗反降58.3%

Video版的Deep Research来了？先浏览再定位后精读：精度提升token消耗反降58.3%

在当前的AI Research浪潮中，Autonomous Agents已经改变了我们获取信息的方式——从被动接收到主动检索。

来自主题: AI技术研报

9056 点击 2026-01-22 16:13

视频理解+开放网络搜索=首个视频Deep Research评测基准

视频理解+开放网络搜索=首个视频Deep Research评测基准

视频理解+开放网络搜索=首个视频Deep Research评测基准

现有的多模态模型往往被困在「视频」的孤岛里——它们只能回答视频内的问题。但在真实世界中，人类解决问题往往是「看视频找线索 -> 上网搜证 -> 综合推理」。

来自主题: AI技术研报

11056 点击 2026-01-22 16:10

不得了，这个新技术把视频压缩到了0.02%！

不得了，这个新技术把视频压缩到了0.02%！

不得了，这个新技术把视频压缩到了0.02%！

感谢AI！

来自主题: AI技术研报

7641 点击 2026-01-15 10:35

发现一个贼牛的开源项目，AI一键生成完整视频

发现一个贼牛的开源项目，AI一键生成完整视频

发现一个贼牛的开源项目，AI一键生成完整视频

从ChatGPT爆火以后，就总有“AI太牛了，自己是不是要失业了”等等类似的声音出现。

来自主题: AI技术研报

11078 点击 2026-01-14 11:46

空间智能终极挑战MMSI-Video-Bench来了，顶级大模型全军覆没

空间智能终极挑战MMSI-Video-Bench来了，顶级大模型全军覆没

空间智能终极挑战MMSI-Video-Bench来了，顶级大模型全军覆没

空间理解能力是多模态大语言模型（MLLMs）走向真实物理世界，成为 “通用型智能助手” 的关键基础。但现有的空间智能评测基准往往有两类问题：一类高度依赖模板生成，限制了问题的多样性；另一类仅聚焦于某一种空间任务与受限场景，因此很难全面检验模型在真实世界中对空间的理解与推理能力。

来自主题: AI技术研报

8519 点击 2026-01-06 09:50

Qwen负责人转发2025宝藏论文，年底重读「视觉领域GPT时刻」

Qwen负责人转发2025宝藏论文，年底重读「视觉领域GPT时刻」

Qwen负责人转发2025宝藏论文，年底重读「视觉领域GPT时刻」

2025最后几天，是时候来看点年度宝藏论文了。

来自主题: AI技术研报

6639 点击 2025-12-31 14:12

SIGGRAPH Asia 2025｜当视频生成真正「看清一个人」：多视角身份一致、真实光照与可控镜头的统一框架

SIGGRAPH Asia 2025｜当视频生成真正「看清一个人」：多视角身份一致、真实光照与可控镜头的统一框架

SIGGRAPH Asia 2025｜当视频生成真正「看清一个人」：多视角身份一致、真实光照与可控镜头的统一框架

在电影与虚拟制作中，「看清一个人」从来不是看清某一帧。导演通过镜头运动与光线变化，让观众在不同视角、不同光照条件下逐步建立对一个角色的完整认知。然而，在当前大量 customizing video generation model 的研究中，这个最基本的事实，却往往被忽视。

来自主题: AI技术研报

9386 点击 2025-12-30 09:52

上一页当前第4页,共20页下一页