一种基于人工智能的海量非结构化数据处理方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于人工智能的海量非结构化数据处理方法及系统
申请号:CN202410829080
申请日期:2024-06-25
公开号:CN118885637A
公开日期:2024-11-01
类型:发明专利
摘要
本发明公开了一种基于人工智能的海量非结构化数据处理方法及系统,涉及数据处理技术领域,包括如下步骤:通过人工智能分离出非结构化数据,并对非结构化数据打上标签;将标记的非结构化数据存入海量数据库内,并选定出非结构化数据中至少一个扩展后缀作为要素,并将要素进行分类处理形成数据要素库;从每个分类好的数据要素库中至少选定一个提取词作为搜索的主要素数据,并发送给重力标记模型,将主要素数据提取词打上重力标签;在海量数据库内下沉形成非结构化核心数据层和非结构化备选数据层;在海量数据库内形成非结构数据搜索图谱。本发明可有效避免了因检索提取词过多而造成检索量大和难以精准检索的问题。
技术关键词
结构数据搜索 数据搜索引擎 重力 数据分类 海量非结构化 标记 人工智能模块 图谱 数据读取模块 标签方法 数据处理系统 数据存储模块 数据处理技术 核心 数据标签 存储结构