一种用于企业数字化转型平台的数据处理方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种用于企业数字化转型平台的数据处理方法及系统
申请号:CN202510540046
申请日期:2025-04-27
公开号:CN120316124B
公开日期:2025-12-02
类型:发明专利
摘要
本发明实施例提供一种用于企业数字化转型平台的数据处理方法及系统,属于数据处理领域。所述方法包括:获取来自各异构数据源的结构化字段信息,并对所述结构化字段信息执行预处理操作;将处理后的结构化字段信息构造为嵌入输入序列,将所述嵌入输入序列按预设模板拼接为自然语言片段,并输入至已微调的语义编码模型中,获得对应的语义嵌入向量;采用基于密度或层次结构的聚类算法识别相似字段组,并将每组结构化字段信息归为一个语义聚类簇;针对每个语义聚类簇生成对应的标准字段标识,并将生成的标准字段标识存入数字化转型后的平台的标准字段索引库中。本发明方案显著增强企业数字化平台的字段统一管理与跨系统数据对齐能力。
技术关键词
字段 标识 自然语言 数据处理方法 序列 企业数字化平台 映射关系表 空间索引结构 局部敏感哈希 异构 密度聚类算法 语义特征 模板 术语 入库单元 唯一性 数据处理系统