基于结构感知与少样本学习的跨软件操作智能体训练方法
申请号:CN202511140848
申请日期:2025-08-15
公开号:CN120725097B
公开日期:2025-12-12
类型:发明专利
摘要
本发明涉及一种基于结构感知与少样本学习的跨软件操作智能体训练方法,包括:接收源软件上的用户的操作意图,进行预处理,并进行意图编码,得到高维意图语义向量;提取源软件上的软件GUI的控件属性信息,构建控件树,并转换为高维结构语义向量;捕获源软件上的GUI屏幕并进行图像编码,得到视觉特征向量;采用交叉注意力机制将高维意图语义向量、高维结构语义向量以及视觉特征向量进行注意力的语义一致性对齐和融合,得到融合后的特征表示;基于融合后的特征表示,构建原型库,获取目标软件上的少量用户操作样本,并利用少量用户操作样本更新原型库,以实现知识迁移,完成训练过程。与现有技术相比,本发明具有泛化能力强、高效等优点。
技术关键词
智能体训练方法
语义向量
控件
意图
软件
样本
原型
交叉注意力机制
节点
多模态信息
图像编码
表达式
视觉
接收源
融合特征
树型网络
屏幕捕获
矩阵