AIGC独角兽硅基智能完成D轮融资,数字人业务营收数亿、已服务超50万用户

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AIGC独角兽硅基智能完成D轮融资,数字人业务营收数亿、已服务超50万用户
6381点击    2025-07-05 13:33

以API为核心产品,提供数字人技术输出能力。


硬氪获悉,AIGC独角兽南京硅基智能科技集团股份有限公司(以下简称“硅基智能”)近日完成数亿元D轮融资,投资方为嘉兴高新区产业基金(嘉兴秀洲区)。本轮资金将重点用于研发创新投入、推动技术落地并加快产品的市场化应用。


自2017年成立以来,「硅基智能」已完成超十亿元、10轮融资,其背后投资方包括腾讯、红杉中国、招银国际、中财奇虎、海松资本等。公司聚焦AIGC数字人技术研发与商业化应用,提出以硅基劳动力为核心,构建了DUIX智能交互平台、虚拟直播平台、视频生产平台和智能客服四大产品线。


随着AI大模型、计算机视觉、语音合成等技术的迅猛发展,数字人产业在中国迅速崛起,其通过AI技术生成的虚拟形象,能模拟人类的外貌、声音、表情并具有交互能力,被广泛应用于直播、客服、教育、娱乐等领域。


根据艾瑞咨询报告显示,2023年中国数字人市场规模已突破100亿元,预计2025年达到300亿元,年复合增长率超过50%。


当前市场上涌现了大量的AI Agent,随着大模型推理成本持续下降,单纯提供逻辑和流程自动化的能力,其技术门槛和商业壁垒将迅速消解。“纯工具性的Agent,最后一定会陷入惨烈的价格战。”「硅基智能」创始人司马华鹏告诉硬氪。


AIGC独角兽硅基智能完成D轮融资,数字人业务营收数亿、已服务超50万用户


硅基智能创始人司马华鹏出席2024年36氪WISE商业之王大会


司马华鹏指出,许多行业的智能化水平仍停留在初级阶段,事实上人们对高质量Agent存在广泛需求。AI天然具备基于逻辑推理的思维链能力,能够以绝对理性的方式解决问题,在此基础上所衍生的数字人智能体也开始进入更多需要深度推理的场景。


“比如医生对疾病的推断,本质上就是依据证据链、患者特征等信息,运用专业知识进行思维链推导的过程。”司马华鹏说,“各行各业中存在大量的思维链应用节点,未来这些节点可能逐步由AI接管,形成‘人机协同’的工作模式,即AI凭借思维链逻辑处理标准化环节,人类则聚焦创意决策、情感交互等更核心的领域。”


算法技术平台是「硅基智能」数字人产品体系的底层支撑。2024年11月,「硅基智能」以API形式,推出新一代多模态大模型DUIX ONE,该模型集成了语音识别、语音合成、NLP和计算机视觉等核心算法能力,可以提供看、听、说、高情商、并具有人类实时形象等多模态能力。


其优势在于极大提升了交互的真实感,有效解决过去传统数字人“形似神不似”的问题。同时,进入落地市场化阶段也具有更强的普适性和应用潜力。


AIGC独角兽硅基智能完成D轮融资,数字人业务营收数亿、已服务超50万用户


硅基智能DUIX ONE多模态大模型


在语音技术方面,DUIX ONE能够精准识别不同口音、语速的语音内容,在嘈杂环境下保证稳定运行,准确率高、抗噪能力强;随后可生成自然流畅、富有情感的人声,实现逼近真人发声效果。


在数字人形象构建方面,「硅基智能」通过完整人脸建模技术,能够快速、精准地创建高度逼真的人脸模型;虚拟形象驱动算法基于语音、文本等输入,可实时驱动数字人的面部表情、肢体动作,保证其行动的生动性与自然度。


进入交互环境,DUIX ONE能够深入理解人类语言背后的语义与情感,并提供智能对话、文本分类、知识问答等功能。期间,数字人会根据对话场景与用户需求,生成逻辑严谨、内容丰富的回复。


商业化方面,「硅基智能」采用差异化产品策略,针对企业客户和个人用户提供定制化服务方案。面向企业市场(2B领域),公司重点服务运营商、电商平台、传媒机构等客户群体,通过标准化的API接口服务,实现AI能力的模块化输出,大幅降低企业的技术应用门槛。


以电商直播场景为例,企业客户提供5分钟左右的视频素材,即可在AI训练平台快速完成数字人主播的个性化定制。平台支持形象外观、声音、语言风格等全维度特征建模,高度还原真人主播特质。生成后的数字人主播还具有实时智能交互能力,能准确理解观众提问,并根据评论内容作出回应,增强直播间互动性、提高观众留存率。


AIGC独角兽硅基智能完成D轮融资,数字人业务营收数亿、已服务超50万用户


硅基数字人在各行业中落地应用


目前,「硅基智能」数字人业务营收已达数亿规模,为5000余家合作品牌提供数字人主播解决方案,帮助商家降低约80%成本;在金融行业,已同超30家银行、保险公司合作并部署智能客服数字人;还与主流电视台合作开发虚拟主持人等。


面向C端用户,「硅基智能」推出了数字人“克隆”服务,帮助用户创建专属数字分身,并实现虚拟形象定制、智能陪伴等个性化功能。同时在DUIX智能交互平台和视频生产平台上,普通用户也能轻松完成"数字人视频生成"“数字人实时交互”等专业级创作,进一步降低数字内容创作的门槛。


硬氪了解到,「硅基智能」已将数字人克隆服务价格降至数千元,生产过程采用全自动化流程,仅需1秒视频,即可完成形象和声音克隆,在保证1个工作日快速交付的同时,也大幅降低了技术应用成本。


官方最新数据显示,「硅基智能」平台服务用户超过50万,日均用户生成内容突破50万条,累计AIGC直播时长在千万小时以上。通过数字人技术在短视频、直播等场景的深度应用,越来越多的普通用户正从被动的内容消费者,转变成为积极参与的内容创作者。


为了进一步推动AIGC技术普惠化,「硅基智能」将DUIX平台核心技术全面开源,目前已发布的DUIX-Mobile版本支持Android和iOS平台,为开发者提供极简集成方案,仅需调用三行核心代码,即可将数字人功能快速嵌入自有产品体系,缩短开发周期,以加快数字人在文娱、法律、金融、教育、医疗等更多行业的规模化落地。


当融合了AI多模态大模型能力、能够实时对话的数字人逐渐渗透到更多领域,进入人们生活,这不仅是技术的进步,更重新定义了情感传递的方式。"数字永生"有望从概念走向现实,当人类的情感与记忆通过数字人技术在跨越时空得以保存,这也为生命形态的拓展了全新的维度。


文章来自于“36氪网”,作者是“黄楠”。


AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
声音克隆

【开源免费】MockingBird是一个5秒钟即可克隆你的声音的AI项目。

项目地址:https://github.com/babysor/MockingBird

3
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

4
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

5
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales