一种用于分布式嵌入向量的训练方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种用于分布式嵌入向量的训练方法及装置
申请号:CN202510879332
申请日期:2025-06-27
公开号:CN121009943A
公开日期:2025-11-25
类型:发明专利
摘要
本发明公开一种用于分布式嵌入向量的训练方法及装置,涉及深度学习领域,包括批量读取训练数据,根据各训练数据的ID,确定训练数据对应的位置信息;根据位置信息,确定训练数据对应的嵌入向量;根据各嵌入向量的访问频率和预先确定的元素数量,确定各嵌入向量是否复制至第一类型的特征向量块;若是,从第一类型的特征向量块获取嵌入向量,并对嵌入向量执行数据并行策略;若否,根据位置信息,从第二类型的特征向量块获取嵌入向量,并对嵌入向量执行模型并行策略。本申请能够快速准确定位嵌入向量的存储位置,为训练过程提供高效数据支持;并根据嵌入向量的访问频率,采用两种不同的并行策略,充分利用数据的稀疏访问模式,有效减少通信开销。
技术关键词
数据并行策略 进程 计算机程序产品 元素 哈希表 索引表 流水线方式 处理器 可读存储介质 频率 搜索算法 批量 训练装置 分片 模块 存储器