一种基于AI驱动的智能数据湖管理和优化系统及方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于AI驱动的智能数据湖管理和优化系统及方法
申请号:CN202411484874
申请日期:2024-10-23
公开号:CN119322874A
公开日期:2025-01-17
类型:发明专利
摘要
本发明公开了一种基于AI驱动的智能数据湖管理和优化系统及方法,该系统包括:数据摄取模块,用以从多个数据源中自动化的收集数据;数据预处理模块,用以对原始数据进行预处理;自然语言处理模块,用以用于对非结构化的文本数据进行深度分析,提取出关键的业务信息和实体;知识图谱构建模块,用以将各类数据中的实体和关系进行结构化表示;数据分类与标注模块,用以对进入数据湖的数据进行自动分类与标注;跨源数据关联模块,用以实现跨源数据的智能关联。本发明能够从数据湖中快速提取关键信息,极大提高了数据的利用率,帮助企业从现有数据中挖掘出更高的业务价值,进而促进企业的业务创新和决策优化。
技术关键词
子模块 知识图谱构建 深度学习模型 实体 自然语言 多语言语音识别 SPARQL查询 支持智能搜索 数据分类 文本 情感分析模型 监督学习算法 分类模型训练 训练分类模型 监督学习方法 数据特征提取 关系