基于强化反馈的医疗交互式大模型训练方法与系统

申请号：CN202510964052

申请日期：2025-07-14

公开号：CN120809166A

公开日期：2025-10-17

类型：发明专利

摘要

本发明涉及一种基于强化反馈的医疗交互式大模型训练方法，涉及医疗交互领域，所述方法包括：基于输入数据序列和输出数据序列建立医疗交互式大模型；在完成一次医疗交互后，根据针对对话答复框最新答复内容反馈的评分数值确定对医疗交互式大模型的补充训练次数以完成对大模型的强化训练。本发明还涉及一种基于强化反馈的医疗交互式大模型训练系统。通过本发明，针对医疗交互式大模型无法量化式地强化反馈训练且内部结构不够完善的技术问题，通过引入隐藏层数量动态选择的深度神经网络架构以及定制化数据结构，完善医疗交互式大模型的结构，同时根据针对最新答复内容反馈的评分数值确定对大模型的补充训练次数，从而解决了上述技术问题。

技术关键词

医疗交互深度神经网络架构关键词字符模型训练系统数值模型训练方法序列数据关系存储器件显示器件生理手术参数疾病药物患者动态

系统为您推荐了相关专利信息

融入字符空间特征的缅甸语文本图像生成方法及装置

图像生成方法图像生成模型字符后处理模块文本图像识别

基于人工智能的退货快递平台信息自动区分方法

自动区分方法标识端口物流面单客户

物流图像智能识别方法、装置、设备及存储介质

图像智能识别方法光学字符识别语义规则文本物流

模型训练方法、测试用例生成方法、装置、介质及产品

控件模型训练方法大语言模型视频帧计算机执行指令

基于大语言模型和数据库的智能问答方法、系统及设备

大语言模型智能问答方法文本结构化查询语言智能问答系统