一种针对C语言编译器优化缺陷的根因分类方法

申请号：CN202510443085

申请日期：2025-04-09

公开号：CN120407250A

公开日期：2025-08-01

类型：发明专利

摘要

本发明公开了一种针对C语言编译器优化缺陷的根因分类方法，包括：步骤1、通过文献分析和数据观察的人工分析方法反复迭代构建初步的分类体系；步骤2、在构建数据集的同时通过数据验证的方法完善最终的分类体系；步骤3、使用生成式的数据增强方法扩充数据集，辅助提高分类器性能；步骤4、对数据进行适当的预处理，使用堆叠集成学习方法集成RTA和Llama3.1两种大语言模型实现自动化分类。本发明建立起一个系统化且有效的分类体系，并构建一个自动化的分类方法，有效地识别和预测C语言编译器中的优化缺陷根因，缩减缺陷修复的可疑范围，显著提高开发人员的修复效率，并促进了领域研究的深入发展。

技术关键词

集成学习方法大语言模型随机森林模型数据验证自动化分类方法分类器分层抽样方法分析方法报告文本分类模型自然语言词向量模型分析缺陷机器学习模型深度学习模型预训练模型训练集修复方法

系统为您推荐了相关专利信息

信息推送方法、装置、设备及存储介质

大语言模型信息推送方法画像数据文本

一种基于针对语音生成式大模型的对抗样本构建方法及系统

跨模态指令样本搜索算法大语言模型

一种基于大语言模型问答系统构建方法及系统

问答系统构建方法语义向量问答知识库文本大语言模型

基于梯度增强的RB网络异常车速预警方法、设备及介质

车速预警方法贝叶斯网络模型数据项随机森林模型异常事件

一种铸造系统温度智能控制系统及方法

温度智能控制系统铸造系统温度传感器集成传感模块随机森林模型