AI资讯新闻榜单内容搜索-Fin

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Fin
长视频AI数字人来了!字节×浙大推出商用级音频驱动数字人模型InfinityHuman

长视频AI数字人来了!字节×浙大推出商用级音频驱动数字人模型InfinityHuman

长视频AI数字人来了!字节×浙大推出商用级音频驱动数字人模型InfinityHuman

随着内容创作智能化需求的爆发,长时长、高质量数字人视频生成始终是行业痛点。近日,字节跳动商业化 GenAI 团队联合浙江大学推出商用级长时序音频驱动人物视频生成模型 ——InfinityHuman,打破传统音频驱动技术在长视频场景中的局限性,开启 AI 数字人实用化新征程

来自主题: AI技术研报
9089 点击    2025-09-04 15:22
告别「面瘫」配音,InfiniteTalk开启从口型同步到全身表达新范式

告别「面瘫」配音,InfiniteTalk开启从口型同步到全身表达新范式

告别「面瘫」配音,InfiniteTalk开启从口型同步到全身表达新范式

传统 video dubbing 技术长期受限于其固有的 “口型僵局”,即仅能编辑嘴部区域,导致配音所传递的情感与人物的面部、肢体表达严重脱节,削弱了观众的沉浸感。现有新兴的音频驱动视频生成模型,在应对长视频序列时也暴露出身份漂移和片段过渡生硬等问题。

来自主题: AI技术研报
9586 点击    2025-08-28 14:32
最懂管钱的AI?这个刚刚发布的金融推理大模型,专业测试超DeepSeek|WAIC2025

最懂管钱的AI?这个刚刚发布的金融推理大模型,专业测试超DeepSeek|WAIC2025

最懂管钱的AI?这个刚刚发布的金融推理大模型,专业测试超DeepSeek|WAIC2025

在社交平台上,「AI 帮我选基金,结果赚了 8%」、「AI 自动炒股,秒杀巴菲特?」之类的帖子不时刷屏,炒股机器人、对话式理财助手有关的 Agent 也不断涌现。

来自主题: AI资讯
10848 点击    2025-07-28 17:48
手术刀式去噪突破LLM能力上限,从头预训练模型下游任务平均提高7.2% | 中科院&阿里

手术刀式去噪突破LLM能力上限,从头预训练模型下游任务平均提高7.2% | 中科院&阿里

手术刀式去噪突破LLM能力上限,从头预训练模型下游任务平均提高7.2% | 中科院&阿里

在噪声污染严重影响预训练数据的质量时,如何能够高效且精细地精炼数据? 中科院计算所与阿里Qwen等团队联合提出RefineX,一个通过程序化编辑任务实现大规模、精准预训练数据精炼的新框架。

来自主题: AI技术研报
8507 点击    2025-07-22 10:03
AI营销席卷中东,Infinix和Snapchat首个AI营销合作如何在当地实现破圈?

AI营销席卷中东,Infinix和Snapchat首个AI营销合作如何在当地实现破圈?

AI营销席卷中东,Infinix和Snapchat首个AI营销合作如何在当地实现破圈?

开年以来,AI 图片赛道迎来一轮小高潮。今年 3 月,在我们统计的月访问量超 200 万的 Web 端 AI 图片产品中,有 45 款产品访问量呈现环比上涨,最高增幅超过 600%。这些爆款背后的共同特征,是一股席卷社交平台的“吉卜力风”。

来自主题: AI资讯
7295 点击    2025-06-27 11:05
破解三大数据库AI难题!北大&亚马逊推出全球首个图中心RDB基础模型

破解三大数据库AI难题!北大&亚马逊推出全球首个图中心RDB基础模型

破解三大数据库AI难题!北大&亚马逊推出全球首个图中心RDB基础模型

在企业系统和科学研究中普遍存在、结构复杂的关系型数据库(Relational DataBase, RDB)场景中,基础模型的探索仍处于早期阶段。

来自主题: AI技术研报
10579 点击    2025-06-15 15:54
想去哪就去哪!FindAnything:基于CLIP的开放词汇三维建图,实现真正的“按需探索”

想去哪就去哪!FindAnything:基于CLIP的开放词汇三维建图,实现真正的“按需探索”

想去哪就去哪!FindAnything:基于CLIP的开放词汇三维建图,实现真正的“按需探索”

在复杂、未知的现实环境中,传统导航方法往往依赖闭集语义或事先构建的地图,难以实现真正的“按需探索”。为打破这一瓶颈,本文提出了 FindAnything ——一套融合视觉语言模型的对象为中心、开放词汇三维建图与探索系统。

来自主题: AI技术研报
7828 点击    2025-05-06 10:23