摘要
本发明公开了一种基于深度强化学习的淀粉样变性检测方法,包括:获取待检测淀粉样变性数据集以提取状态‑动作对,所述淀粉样变性数据集包括待检测者AL淀粉样变性筛查轨迹;初始化状态‑动作函数并设置成本函数参数和收敛容忍度;根据所述状态‑动作对对状态‑动作函数进行迭代训练,使得当连续两次迭代中的状态‑动作变化值均小于收敛容忍度时,停止训练得到训练好的状态‑动作函数;根据训练好的状态‑动作函数确定置信区域的阈值边界,以根据所述阈值边界对淀粉样变性进行检测。本发明的方法将最优停止问题与无模型强化学习框架联系起来,利用深度强化学习算法的表征和学习能力,同时利用最优停止框架避免AL淀粉样变性延迟诊断的发生。