基于反馈强化学习的单元测试用例生成大模型微调方法

申请号：CN202510913668

申请日期：2025-07-03

公开号：CN120407426B

公开日期：2025-09-30

类型：发明专利

摘要

本发明涉及软件测试技术领域，公开了基于反馈强化学习的单元测试用例生成大模型微调方法，包括：构建基于需求驱动的单元测试微调数据集；构建Actor模型，并通过需求驱动的单元测试微调数据集进行优化；构建Critic模型，并通过需求驱动的单元测试微调数据集进行优化；基于优化后的Actor模型生成单元测试用例，基于优化后的Critic模型将单元测试用例映射为单一即时奖励，通过强化学习得到基于单元测试用例生成的大模型。本发明构建了一个能够自动生成高质量、需求对齐、风格一致的单元测试用例生成方法，显著提升了测试效率与质量，打破了传统测试生成在人工依赖、覆盖深度和需求一致性上的瓶颈。

技术关键词

单元测试用例微调方法 Actor模型生成测试用例联合损失函数排序损失数据 Sigmoid函数代表软件测试技术序列策略更新编码器注意力机制格式生成方法参数指标