基于强化反馈的医疗交互式大模型训练方法与系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于强化反馈的医疗交互式大模型训练方法与系统
申请号:CN202510964052
申请日期:2025-07-14
公开号:CN120809166A
公开日期:2025-10-17
类型:发明专利
摘要
本发明涉及一种基于强化反馈的医疗交互式大模型训练方法,涉及医疗交互领域,所述方法包括:基于输入数据序列和输出数据序列建立医疗交互式大模型;在完成一次医疗交互后,根据针对对话答复框最新答复内容反馈的评分数值确定对医疗交互式大模型的补充训练次数以完成对大模型的强化训练。本发明还涉及一种基于强化反馈的医疗交互式大模型训练系统。通过本发明,针对医疗交互式大模型无法量化式地强化反馈训练且内部结构不够完善的技术问题,通过引入隐藏层数量动态选择的深度神经网络架构以及定制化数据结构,完善医疗交互式大模型的结构,同时根据针对最新答复内容反馈的评分数值确定对大模型的补充训练次数,从而解决了上述技术问题。
技术关键词
医疗交互 深度神经网络架构 关键词 字符 模型训练系统 数值 模型训练方法 序列 数据 关系 存储器件 显示器件 生理 手术 参数 疾病 药物 患者 动态
系统为您推荐了相关专利信息
图像生成方法 图像生成模型 字符 后处理模块 文本图像识别
自动区分方法 标识 端口 物流面单 客户
图像智能识别方法 光学字符识别 语义规则 文本 物流
控件 模型训练方法 大语言模型 视频帧 计算机执行指令
大语言模型 智能问答方法 文本 结构化查询语言 智能问答系统