一种模型训练方法、装置、电子设备、芯片及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种模型训练方法、装置、电子设备、芯片及介质
申请号:CN202410851726
申请日期:2024-06-27
公开号:CN118863004A
公开日期:2024-10-29
类型:发明专利
摘要
本公开提供一种模型训练方法、装置、电子设备、芯片及介质,该方法涉及神经网络架构搜索领域。该方法包括:获取训练数据集,训练数据集包括计算图以及计算图的性能标签,计算图用于描述神经网络的拓扑结构,计算图包括节点集和边集,节点集包括神经网络的多个节点,边集包括多个节点之间的链接通路;使用训练数据集,对初始网络打分模型进行训练,得到目标网络打分模型,目标网络打分模型用于对通过神经结构搜索NAS获取的待评估神经网络进行性能评估。通过计算图和性能标签作为打分模型的训练数据对初始打分模型进行训练,将训练好的模型应用于网络搜索过程中的性能评估阶段,可以在低时空开销下,进一步提高网络处理性能。
技术关键词
节点 模型训练方法 网络特征 长短期记忆网络 模型训练装置 神经网络架构搜索 网络评估方法 通信接口 矩阵 数据 标签 编码 电子设备 处理器 芯片 大语言模型 计算机 评估装置 文本