摘要
本发明涉及人工智能技术领域,可运用于金融科技领域和医疗领域,公开了基于自适应串联组的问题查询方法、装置、设备及介质,应用于高频量化交易决策场景或电子病历推理场景,其中方法包括:获取预训练语言模型作为初始策略模型,基于查询问题生成完整思维链序列和初始答案;根据预设截断位置截断完整思维链序列生成截断子序列和基础答案,并构建串联组和答案集;计算答案集的正确性指标和串联组的平均正确率;根据平均正确率和预设阈值进行动态切换奖励,以生成奖励集,计算优势集;根据优势集对初始策略模型进行更新得到目标策略模型;通过目标策略模型基于待推理查询问题进行推理生成目标答案。本发明提升多步问题查询任务的查询准确性和效率。