AI资讯新闻榜单内容搜索-ai

刚刚，Vidu S1 重磅来袭，视频生成迈入实时交互时代！

Vidu S1 面向的是一类全新的使用场景：让视频模型从离线成片，走向可对话、可响应、可持续在线的实时交互。它的核心能力包括语音实时控制视频生成内容、无限长实时生成、540P (960×540) + 25FPS (最高可支持 42FPS) 实时交互，以及自定义初始图像与音色。难得的是，这套实时交互能力在消费级显卡上就能跑起来。

来自主题: AI资讯

8005 点击 2026-07-04 11:06

全球第一！中国模型登顶榜首，首个可编辑AI语音来了

全球第一！中国AI语音ViiTorVoice首创「局部编辑」神技：配音错字告别重录，像改Word一样修语音。内附姆巴佩、哈兰德爆笑实测，快来见证！这个凭空出世的中国模型，将 Qwen3-TTS、CosyVoice3、Fish Audio 等一众主流巨头挑落马下，径直登顶综合排名第一！

来自主题: AI资讯

7853 点击 2026-07-04 10:52

世界模型走了一些弯路

「不如直接数字人」私以为，世界模型这个概念的发展经过了三个非常幽默的阶段。第一阶段：硅谷真懂行的老登如杨立昆、李飞飞，觉得大语言模型在讲故事上没啥空间了，所以从学术圈拽了个新概念过来尝试弯道超车。

来自主题: AI资讯

7546 点击 2026-07-04 10:51

把Agent丢入1000+文件：人大CoDA-Bench揭示Code Agent瓶颈

中国人民大学的研究团队提出 CoDA-Bench，联合评估 Agent 的 Code Intelligence + Data Intelligence。该基准首次把 Code Agent 放进包含 1000 + 数据文件的复杂环境下，要求模型先自主探索文件系统、找到相关数据，再编写代码完成分析。实验显示，即使当前表现最好的系统，在 CoDA-Bench 上执行准确率也只有 61.1%；

来自主题: AI技术研报

8849 点击 2026-07-04 10:51

ECCV 2026 | 悉尼大学提出Linstereo, 打通立体匹配「最后一公里」

LinStereo 对应地做了三件事：PALA 换掉 ConvGRU 解决传播问题，HSCV 保留多尺度特征，DPI 用单目深度给一个靠谱的起点。PALA 做的事情说起来很直观，就是把 ConvGRU 的局部更新换成全局注意力，让每个像素每次迭代都能看到整张图。难点在于 softmax attention 是 O (N²) 的，直接用在高分辨率视差图上跑不动。

来自主题: AI技术研报

8071 点击 2026-07-04 10:50

AI Agent为什么总是不稳定？终于有了一个系统性基准来拆解

三星大模型团队联合北京大学、香港城市大学、香港科技大学等科研机构，共同发布了面向 AI Agent 的基准测试 LiveClawBench。它关注的并不是「谁的 Agent 更强」，而是一个更基础、也更关键的问题：为什么同一个 AI Agent，在一些任务中已经接近可用，而在另一些任务中却会突然失稳？

来自主题: AI技术研报

7038 点击 2026-07-04 10:50