AI资讯新闻榜单内容搜索-Fin

长视频AI数字人来了！字节×浙大推出商用级音频驱动数字人模型InfinityHuman

随着内容创作智能化需求的爆发，长时长、高质量数字人视频生成始终是行业痛点。近日，字节跳动商业化 GenAI 团队联合浙江大学推出商用级长时序音频驱动人物视频生成模型 ——InfinityHuman，打破传统音频驱动技术在长视频场景中的局限性，开启 AI 数字人实用化新征程

来自主题: AI技术研报

9089 点击 2025-09-04 15:22

传统 video dubbing 技术长期受限于其固有的 “口型僵局”，即仅能编辑嘴部区域，导致配音所传递的情感与人物的面部、肢体表达严重脱节，削弱了观众的沉浸感。现有新兴的音频驱动视频生成模型，在应对长视频序列时也暴露出身份漂移和片段过渡生硬等问题。

来自主题: AI技术研报

9586 点击 2025-08-28 14:32

在社交平台上，「AI 帮我选基金，结果赚了 8%」、「AI 自动炒股，秒杀巴菲特？」之类的帖子不时刷屏，炒股机器人、对话式理财助手有关的 Agent 也不断涌现。

来自主题: AI资讯

10848 点击 2025-07-28 17:48

在噪声污染严重影响预训练数据的质量时，如何能够高效且精细地精炼数据？中科院计算所与阿里Qwen等团队联合提出RefineX，一个通过程序化编辑任务实现大规模、精准预训练数据精炼的新框架。

来自主题: AI技术研报

8507 点击 2025-07-22 10:03

开年以来，AI 图片赛道迎来一轮小高潮。今年 3 月，在我们统计的月访问量超 200 万的 Web 端 AI 图片产品中，有 45 款产品访问量呈现环比上涨，最高增幅超过 600%。这些爆款背后的共同特征，是一股席卷社交平台的“吉卜力风”。

来自主题: AI资讯

7295 点击 2025-06-27 11:05

假作真时真亦假，无为有处有还无。

来自主题: AI资讯

7717 点击 2025-06-17 11:14

在企业系统和科学研究中普遍存在、结构复杂的关系型数据库（Relational DataBase, RDB）场景中，基础模型的探索仍处于早期阶段。

来自主题: AI技术研报

10579 点击 2025-06-15 15:54

在端侧设备上处理长文本常常面临计算和内存瓶颈。

来自主题: AI技术研报

11375 点击 2025-05-20 14:54

随着大模型的参数规模不断扩大，分布式训练已成为人工智能发展的中心技术路径。

来自主题: AI技术研报

11496 点击 2025-05-19 14:28

在复杂、未知的现实环境中，传统导航方法往往依赖闭集语义或事先构建的地图，难以实现真正的“按需探索”。为打破这一瓶颈，本文提出了 FindAnything ——一套融合视觉语言模型的对象为中心、开放词汇三维建图与探索系统。

来自主题: AI技术研报

7828 点击 2025-05-06 10:23