摘要
本发明公开了一种基于强化学习的电路结构模糊搜索方法和装置。其中,该方法包括:在构建的电路网络图D中指定待搜索的子图Q;确定子图Q中节点的搜索顺序和搜索起点;在电路网络图D中确定搜索起点的候选节点集;为子图Q构造查询树;从每个查询树中分别采样多条轨迹;根据采样到的轨迹,采用强化学习算法训练策略网络来筛选子图Q的匹配结果。当子图Q的规模较大时,传统模糊匹配算法的计算量呈笛卡尔积式增长,无法在有限时间内完成模糊匹配,本发明使用强化学习算法替代传统模糊匹配算法中的递归计算,通过轨迹采样获取经验,逐步得到回报最大的全局最优解,能够在有限时间内准确地完成电路模块的模糊匹配。