一种文本解析模型设计方法、装置、存储介质和程序产品
申请号:CN202510220541
申请日期:2025-02-26
公开号:CN120163143A
公开日期:2025-06-17
类型:发明专利
摘要
本发明提供一种文本解析模型设计方法、装置、存储介质和程序产品,涉及自然语言处理技术领域。其中,文本解析模型设计方法包括:基于语义相似度对文本进行分块,得到语义文本块;至少基于语义文本块,将文本划分为不同级别的节点,得到树状节点结构;根据文本中的非文本对象,创建非文本节点,并纳入所述树状节点结构;对所述树状节点结构中的每个节点进行元数据管理。本发明方法通过文本解析,得到包含元数据的树状节点结构,在保持文本原有层次结构和语义完整性的同时,大幅提高了复杂文本的解析效率和信息检索的准确性,为大语言模型的文本处理应用提供了强有力的支持。
技术关键词
文本
模型设计方法
节点
元数据管理
语义
分块
对象
计算机装置
计算机程序产品
处理器
信息检索
自然语言
数据字
框架
可读存储介质
存储器
模式