一种非结构化文件的分割方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种非结构化文件的分割方法及装置
申请号:CN202510400828
申请日期:2025-04-01
公开号:CN120337913A
公开日期:2025-07-18
类型:发明专利
摘要
本发明公开了一种非结构化文件的分割方法及装置,该方法包括:获取多个非结构化文件;根据各个非结构化文件的文件体积,对非结构化文件进行分类,得到分类结果;基于分类结果,结合各个非结构化文件的文件类型,采用不同的分割策略,对非结构化文件进行分割,得到文件分割结果。通过对非结构化文件进行分类,并针对分类结果结合文件类型采用不同的分割策略,实现对非结构化文件的分割,达到提高非结构化文件存储和检索效率的效果,为后续的非结构化文件分析和价值挖掘提供基础,同时降低非结构化文件管理成本。
技术关键词
分割方法 有向无环图 文本 策略 自然语言 节点 数据获取模块 分割装置 规划 标识 动态 字符 语义 基础