摘要
本发明公开了一种基于大语言模型的自然语言网页交互方法,包括:构建多智能体框架,所述多智能体框架包括任务规划智能体和规则构建智能体;任务规划智能体接收用户的文字指令,参考已有经验,进行自然语言规划并将其转换成代码,以完成文字指令所需的网页操作;规则构建智能体读取任务规划智能体与网页交互的过程,构建网页交互规则库、网页操作技能库和失败轨迹反思库,并作为任务规划智能体在下次执行网页操作任务时的已有经验。本发明实现了大语言模型智能体与网页的复杂交互操作,对于不同网页环境都有很强的适应能力和鲁棒性,并且解决了以往基于经验库方法的上下文窗口不够的问题,让智能体拥有网页环境中的持续进化能力。