摘要
本发明涉及软件测试技术领域,公开了基于反馈强化学习的单元测试用例生成大模型微调方法,包括:构建基于需求驱动的单元测试微调数据集;构建Actor模型,并通过需求驱动的单元测试微调数据集进行优化;构建Critic模型,并通过需求驱动的单元测试微调数据集进行优化;基于优化后的Actor模型生成单元测试用例,基于优化后的Critic模型将单元测试用例映射为单一即时奖励,通过强化学习得到基于单元测试用例生成的大模型。本发明构建了一个能够自动生成高质量、需求对齐、风格一致的单元测试用例生成方法,显著提升了测试效率与质量,打破了传统测试生成在人工依赖、覆盖深度和需求一致性上的瓶颈。