摘要
本发明公开一种基于相对胜负反馈的双边匹配市场在线学习方法,步骤包括:初始化请求方的偏好序列位置、偏好概率估计及置信半径;请求方基于未被明确拒绝的位置发起申请;提供方随机选择接受者,输出相对胜负反馈;请求方据此更新偏好概率估计和置信半径,构建偏好学习机制;基于更新后的数据及偏好概率差值下限,判断提供方最偏好请求方是否明确,明确则匹配,否则更新位置重复流程,直至所有请求方匹配。本发明依赖相对胜负反馈,通过在线Gale‑Shapley算法实现请求方高效偏好学习与稳定匹配,支持多请求方并行发起申请,引入相对偏好最小差距界定学习效率,适用于反馈有限场景。