一种基于Word2Vec模型的船舶多源数据整合方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于Word2Vec模型的船舶多源数据整合方法
申请号:CN202411737388
申请日期:2024-11-29
公开号:CN119576917B
公开日期:2025-10-10
类型:发明专利
摘要
本发明公开了一种基于Word2Vec模型的船舶多源数据整合方法,该方法包括以下步骤:1)收集来自不同来源的船舶备件数据;2)对收集到的船舶备件数据进行预处理;3)整理预处理后的多源船舶备件数据,结合船舶数据库标准,形成一个标准的船舶目标数据库;4)对步骤3)中提取船舶目标数据库中的备件名称信息,构建船舶备件词源,基于标准化后的船舶备件词源构建词向量模型;5)从不同来源备件数据中提取需要比对的船舶备件名称与目标数据库中备件名称进行比对,计算余弦相似度;6)对待比对备件名称和目标数据库中备件名称进行融合,最终生成统一的数据表示。本发明用词向量模型进行数据匹配与融合,能够减少人工干预,提高数据整合效率。
技术关键词
多源数据整合方法 Word2Vec模型 备件 船舶 词向量模型 编辑 关键词 文本规范化 字符 处理器 异常数据 存储装置 可读存储介质 电子设备 程序 格式 计算机 代表