一种基于相对胜负反馈的双边匹配市场在线学习方法

申请号：CN202511157139

申请日期：2025-08-18

公开号：CN121030362A

公开日期：2025-11-28

类型：发明专利

摘要

本发明公开一种基于相对胜负反馈的双边匹配市场在线学习方法，步骤包括：初始化请求方的偏好序列位置、偏好概率估计及置信半径；请求方基于未被明确拒绝的位置发起申请；提供方随机选择接受者，输出相对胜负反馈；请求方据此更新偏好概率估计和置信半径，构建偏好学习机制；基于更新后的数据及偏好概率差值下限，判断提供方最偏好请求方是否明确，明确则匹配，否则更新位置重复流程，直至所有请求方匹配。本发明依赖相对胜负反馈，通过在线Gale‑Shapley算法实现请求方高效偏好学习与稳定匹配，支持多请求方并行发起申请，引入相对偏好最小差距界定学习效率，适用于反馈有限场景。

技术关键词

在线学习方法序列玩家算法机制表达式关系逻辑场景数据