基于人工智能的内容数据生成方法、装置、设备及介质

申请号：CN202510681937

申请日期：2025-05-26

公开号：CN120849658A

公开日期：2025-10-28

类型：发明专利

摘要

本申请属于人工智能技术领域，涉及一种基于人工智能的内容数据生成方法、装置、计算机设备及存储介质，包括：接收与目标视频对应的视觉输入、音频输入及文本输入；调用包括输入层、分层复合注意力模块及决策模块的融合处理模型；基于输入层对视觉输入、音频输入及文本输入进行特征提取，得到视觉特征、音频特征及文本特征；基于分层复合注意力模块对视觉特征、音频特征及文本特征进行特征融合得到融合特征；基于决策模块对融合特征进行处理，生成目标视频的内容描述；对内容描述进行输出。此外，本申请的内容描述可存储于区块链中。本申请可应用于金融领域和医疗领域中的内容数据生成场景，通过本申请有效地提高了视频内容描述的生成效率。

技术关键词

内容数据生成方法注意力音频特征视觉特征跨模态文本融合特征计算机可读指令多任务损失函数分层模块决策视频数据生成装置计算机设备可读存储介质分支人工智能技术