片段级对齐数据自动构建方法、设备及可读存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
片段级对齐数据自动构建方法、设备及可读存储介质
申请号:CN202510891918
申请日期:2025-06-30
公开号:CN120743282A
公开日期:2025-10-03
类型:发明专利
摘要
本发明提出片段级对齐数据自动构建方法、设备及可读存储介质,属于数据处理技术领域,为解决现有数据对齐方法中构建的程序级对齐数据,不利于模型学习语法对齐知识,且未提及如何构建片段级对比数据的问题,包括:S1:基于大模型对源语言程序插入注释;S2:根据插入注释后的源语言程序对目标程序进行改写,在目标程序中生成和源语言程序内容和顺序一致的注释;S3:将源语言程序和目标程序分割为包含对应注释的若干个代码片段,根据代码片段的注释对源语言程序和目标程序的代码片段进行一一匹配,得到片段级对齐数据。
技术关键词
自动构建方法 程序 数据对齐方法 大语言模型 数据处理技术 处理器 计算机设备 可读存储介质 存储器