阿里开源14B电影级视频模型!实测来了:免费可玩,单次生成时长可达分钟级
阿里开源14B电影级视频模型!实测来了:免费可玩,单次生成时长可达分钟级AI视频生成正在迎来“通义时刻”! 就在昨夜,阿里突然发布了一款由音频驱动的14B视频模型Wan2.2-S2V—— 仅需一张图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。
AI视频生成正在迎来“通义时刻”! 就在昨夜,阿里突然发布了一款由音频驱动的14B视频模型Wan2.2-S2V—— 仅需一张图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。
朋友,你相信光吗? 在你正式做出回答之前,AI玩具领域已经用行动告诉我们:有人依然相信。 全球首款迪迦奥特曼AI玩具正式发售,国产的。
此前在2023年年末,彼时拼多多的市值曾一度逼近阿里,引得“退隐江湖”许久的阿里创始人马云罕见地在内网发声,“AI电商时代刚刚开始,对谁都是机会,也是挑战。我们要有信心,阿里会变,阿里会改”。马云的这番话除了给员工吃下一颗定心丸外,也为阿里电商的未来定了调。
AI作画、生视频,可以「自己救自己」了?! 当大家还在为CFG(无分类器引导)的参数搞到头秃,却依然得到一堆“塑料感”废片而发愁时,来自清华大学、阿里巴巴AMAP(高德地图)、中国科学院自动化研究所的研究团队,推出全新方法S²-Guidance (Stochastic Self-Guidance)。
2025 是 Agent 元年,十位创业者有八位都在造 Agent。十字路口过去几个月做了大量相关的访谈与评测,发现决定 Agent 能力上限的,不止模型本身,也不止工程和交互的打磨,基础设施也至关重要——Agent Infra。
集成全球顶尖的编程模型、最强的上下文工程能力,可一次检索10万个代码文件。阿里全新AI代码编辑器Qoder表示——它可以理解整个代码库,并交付真正适合的代码。
人在从杭州回北京的路上,想趁着脑子里的记忆还火热的时候,写下一些感悟。
继通义灵码的 Lingma IDE 之后,阿里在海外推出另一款 Agent Coding 产品。据官方介绍,Qoder (/ˈkoʊdər/) 是一个专为真实软件开发而设计的 Agent Coding 平台(所以谁不真实?)
今天凌晨,阿里推出了最新图像编辑模型 Qwen-Image-Edit!该模型基于 200 亿参数的 Qwen-Image 架构构建,支持中英文双语精准文本编辑,在保持原有风格的同时完成修改。此外,Qwen-Image-Edit 将输⼊图像同时输⼊到 Qwen2.5-VL(实现视觉语义控制)和 VAE Encoder(实现视觉外观控制),兼具语义与外观的双重编辑能⼒。
全世界可能是第一个,能做生意的Agent来了。 这,就是阿里国际站最近升级的Accio Agent。