幽深森林,身着飘逸浅裙的乐手忘情地拉动琴弦。阳光穿透树冠洒落林间,斑驳光影与悠扬的琴声相融。镜头自低处仰拍环绕,营造出如梦似幻的氛围。

过去,拍出这样一段大片感视频,你需要摄影团队、灯光、场景和一笔不低的预算。而在
AI时代,为了抽出一段令人惊艳的镜头,创作者也需要反复调提示词,消耗大把算力。
但现在,想要做一条电影感 AI 视频仅需 0.2 元,成本仅为 Seedance 2.0的2%。
近日,Agnes 旗下视频生成模型 Agnes-Video-V2.0 登陆全球AI生成领域权威第三方评测平台 Artificial Analysis 视频榜单。
继此前文本模型 Agnes2.0 Flash登榜 ClawEval、图像模型Agnes Image 2.0 Flash登上Artificial Analysis Image Edit榜单之后,Agnes终于在视频领域也完成了关键一跃,成为少数在三大核心模态均获国际权威评测覆盖和认可的AI模型公司。
Artificial Analysis是目前全球AI生成领域最具公信力的第三方评测平台,最早以文本模型评测受到关注,随后扩展到图像、视频、代码等多个领域,如今已经成为AI 圈的重要参考指标。
它的评选排名机制极为严苛,采用用户盲选+Elo积分制:数千名真实用户在完全不知情的情况下,同时观看两个模型生成的视频并投票选出更好的一个,结果通过国际象棋同款 Elo 系统计算排名。没有精心挑选的演示样本,完全由大规模用户盲选偏好决定,厂商无法刷分,无法操控结果。能进这个榜,含金量不言而喻。

在本次评测中,Agnes-Video-V2.0 交出成绩如下:文生视频(有声)ELO 885(95% CI: ±13),有效样本2,463;图生视频(有声):ELO 934(95% CI: ±12),有效样本 2,576。模型支持原生音画同出,可实现首帧生视频、首尾帧生视频,以及多帧生视频(首帧、中间帧、尾帧)。

不过,Agnes-Video-V2.0真正引发行业关注的原因,其实并不只是“上榜”。而是它在榜单模型里呈现出的另一种定位:价格屠夫。目前Agnes-Video-V2.0的定价为 0.3美元/分钟,不到头部模型均价的1/10。这种定价策略也延续了Agnes一贯强调的方向:AI 平权。
Agnes-Video-V2.0视频模型,以及不久前登榜的Agnes2.0 Flash文本模型 、Agnes Image 2.0 Flash图片模型,目前都已经正式上线Agnes旗下App(Agnes和PAVO,国内用户可在AppStore下载体验)和API官网开放调用。
为了验证Agnes-Video-V2.0到底能否用于真实创作场景,我们也做了一些实际场景测试。
第一个场景是人物对话。人物口型与对白基本能够保持同步,从细微表情到肢体动作的过渡都比较自然,情绪变化没有明显机械感。模型对复杂动作的完成度也不错,一些涉及快速姿态变化、多重身体链联动的镜头,依然能保持较好的连贯性。




第二个场景是景别切换。视频中存在明显的“镜头语言”,先是展示舞台与观众环境的大全景,再切到鼓掌观众,随后回到小提琴演奏者特写。可以看到模型已经不只是“生成画面”,而是在形成一定的导演思维与转场逻辑。

第三个场景考验的是运镜。角色以第一视角穿过一座古老、昏暗的档案馆,镜头移动,空间感和沉浸感都比较自然。

第四个场景是细节氛围。可以看到它在调色、光影层次、构图比例上的审美,也已经明显接近短剧和院线化风格,生成痕迹被进一步削弱。


对于AI短剧、短视频等高度凝练的场景,Agnes-Video-V2.0 的技术已经足够。对于需要大量抽卡、追求效率优先的创作者,Agnes-Video-V2.0则会将抽卡的成本降到更低。
某种程度上,AI视频已经开始进入一个新的阶段:随着AI视频模型的迭代速度越来越快,模型基础能力差异越来越小,接下来的发展方向就是如何把视频制作的门槛降低,也就是走向“大众“,走向”平权“。
当下的一个现实是AI 能力提升得很快,但是采用速度和规模远跟不上能力的进展。在“AI 能做什么”与“用户采纳什么”的讨论之前,首先要解决的一个难题就是用户的付费门槛。
让AI走向平价,像水电煤一样成为基础设施,是让 AI 真正有用、走向大众的第一步。以前AI 离普通人或许很远,如今像Agnes这样的创新力量正在将其推向大众。当AI实现“平价+专业”的双重突破,AI才有机会真正走进每个人的工作流。
文章来自于"Z Potentials",作者 "Z Potentials"。
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0