一种迭代式多粒度文档的切分方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种迭代式多粒度文档的切分方法
申请号:CN202510184159
申请日期:2025-02-19
公开号:CN120181069A
公开日期:2025-06-20
类型:发明专利
摘要
本发明涉及人工智能识别技术领域,尤其是提供了一种迭代式多粒度文档的切分方法。该方法包括构建训练语料,并对其进行段、词和句不同粒度的切分,由未切分文档和切分文档组成训练语料;通过训练语料训练GPT结构的深度学习模型,获得训练后的切分模型;根据训练后的切分模型对输入文档进行切分,输出切分结果,该方法解决了多粒度切分无法统一的问题,提高了文档整体的切分语义和切分结果。
技术关键词
人工智能识别技术 深度学习模型 可读存储介质 字符 计算机 代表 存储器 算法 电子设备 指令 语义 处理器 程序