对象处理方法、装置、电子设备及存储介质

申请号：CN202510220683

申请日期：2025-02-26

公开号：CN120106017A

公开日期：2025-06-06

类型：发明专利

摘要

本公开提供了一种对象处理方法、装置、电子设备及存储介质，涉及人工智能技术领域，尤其涉及大模型、生成模型等领域。具体实现方案为：根据待处理的对象包含的音频和图像中的至少一个，确定初始文本，初始文本包括多个子文本；基于大模型，根据多个子文本和第一时间戳，生成结构树；结构树包括多个结点，每个结点的属性包括结点名称和第二时间戳，每个结点表征对象中的一个片段，多个结点之间的依赖关系表征多个片段描述内容之间的层级关系；根据结构树中各结点的依赖关系和结构树中各结点的属性，从结构树中确定目标结点；根据目标结点的结点名称和第二时间戳，确定分段大纲以便展示分段大纲。

技术关键词

结点文本层级分段对象生成结构标记生成思维导图关系图像重复性参数语音字符电子设备处理器音频关键点人工智能技术计算机

系统为您推荐了相关专利信息

一种多品类多层级Clip组装工艺

承载机构跳线框架工位输送单元拾取单元

基于多模态数据和大语言模型的光伏电站故障诊断方法

光伏电站故障诊断 LSTM神经网络模型多模态大语言模型光伏电站设备

一种基于AI技术以服装驱动图像多区域特征融合系统

多区域特征融合图像编码器图像生成模型色彩服装产品

一种基于语义一致性和风格多样性的域泛化语义分割方法

语义分割方法风格文本编码器图像索引

用于化工生产的异常事件根因分析方法及装置

异常事件节点二维码化工参数