一种迭代式多粒度文档的切分方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种迭代式多粒度文档的切分方法
申请号:
CN202510184159
申请日期:
2025-02-19
公开号:
CN120181069A
公开日期:
2025-06-20
类型:
发明专利
摘要
本发明涉及人工智能识别技术领域,尤其是提供了一种迭代式多粒度文档的切分方法。该方法包括构建训练语料,并对其进行段、词和句不同粒度的切分,由未切分文档和切分文档组成训练语料;通过训练语料训练GPT结构的深度学习模型,获得训练后的切分模型;根据训练后的切分模型对输入文档进行切分,输出切分结果,该方法解决了多粒度切分无法统一的问题,提高了文档整体的切分语义和切分结果。
技术关键词
人工智能识别技术
深度学习模型
可读存储介质
字符
计算机
代表
存储器
算法
电子设备
指令
语义
处理器
程序