摘要
本公开提供了一种对象处理方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及大模型、生成模型等领域。具体实现方案为:根据待处理的对象包含的音频和图像中的至少一个,确定初始文本,初始文本包括多个子文本;基于大模型,根据多个子文本和第一时间戳,生成结构树;结构树包括多个结点,每个结点的属性包括结点名称和第二时间戳,每个结点表征对象中的一个片段,多个结点之间的依赖关系表征多个片段描述内容之间的层级关系;根据结构树中各结点的依赖关系和结构树中各结点的属性,从结构树中确定目标结点;根据目标结点的结点名称和第二时间戳,确定分段大纲以便展示分段大纲。