一种非结构化文件的分割方法及装置
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种非结构化文件的分割方法及装置
申请号:
CN202510400828
申请日期:
2025-04-01
公开号:
CN120337913A
公开日期:
2025-07-18
类型:
发明专利
摘要
本发明公开了一种非结构化文件的分割方法及装置,该方法包括:获取多个非结构化文件;根据各个非结构化文件的文件体积,对非结构化文件进行分类,得到分类结果;基于分类结果,结合各个非结构化文件的文件类型,采用不同的分割策略,对非结构化文件进行分割,得到文件分割结果。通过对非结构化文件进行分类,并针对分类结果结合文件类型采用不同的分割策略,实现对非结构化文件的分割,达到提高非结构化文件存储和检索效率的效果,为后续的非结构化文件分析和价值挖掘提供基础,同时降低非结构化文件管理成本。
技术关键词
分割方法
有向无环图
文本
策略
自然语言
节点
数据获取模块
分割装置
规划
标识
动态
字符
语义
基础