一种多格式文档智能有声内容生成系统及方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多格式文档智能有声内容生成系统及方法
申请号:CN202510206671
申请日期:2025-02-25
公开号:CN119724153A
公开日期:2025-03-28
类型:发明专利
摘要
本发明公开一种多格式文档智能有声内容生成系统及方法,涉及人工智能与音频生成技术领域;包括:步骤1:对用户上传的多种格式文档进行解析,生成结构化纯文本,步骤2:根据结构化纯文本的内容进行语义分析,识别纯文本中不同的情感色彩及语气特征,根据情感色彩及语气特征将纯文本转换为多角色的对话脚本,步骤3:调用文本转音频模型,为对话脚本的每段台词,生成对应角色的音频片段,步骤4:将音频流列表中音频片段按照台词顺序拼接合成为完整的音频文件;实现多格式文档内容的自动转换与多角色音频合成,且无需依赖云端服务,保障数据隐私并提升处理效率。
技术关键词
内容生成系统 音频 内容生成方法 格式 脚本 可视化界面 统一资源定位 文本理解 色彩 分发模块 输出模块 列表 语音 标识 参数 生成技术 语义 标记