一种指令类型无关的视觉语言导航方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种指令类型无关的视觉语言导航方法
申请号:CN202510427171
申请日期:2025-04-07
公开号:CN120563878A
公开日期:2025-08-29
类型:发明专利
摘要
本发明涉及一种指令类型无关视觉语言导航方法,所述方法包括:步骤1,对多种类型指令进行混合,形成混合指令文本并对I进行文本编码,通过指令判别器进行分类得到分类概率pω,作为专家网络中专家路由依据;步骤2,构造跨模态硬分支路由专家网络Cross_MoE;步骤3,基于LLM的指令规范,对混合指令文本I使用大语言模型LLM进行指令规范得到指令要素集合I‘,等步骤。本发明所述方法的优越技术效果是,能够有效提升了系统对多类指令的处理能力,解决了传统导航模型在处理多类型指令在面对复杂的、多样化的指令时性能下降的不足;避免了复杂的操作步骤,使人机交互更加自然流畅,尤其对于非技术用户系统的使用门槛大大降低。
技术关键词
指令 导航方法 编码特征 混合专家网络 大语言模型 文本 输出特征 视觉 跨模态 分支 地标 拓扑地图 分类特征 模态特征 注意力 模板 编码器 节点