多模态动作模型的策略优化方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
多模态动作模型的策略优化方法、装置、设备及介质
申请号:CN202511374156
申请日期:2025-09-25
公开号:CN120877387A
公开日期:2025-10-31
类型:发明专利
摘要
本发明涉及人工智能技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了一种多模态动作模型的策略优化方法、装置、设备及介质,所述方法包括:对获取的图像数据、语言指令和目标用户的行为动作序列之间进行关系分析,得到关系依赖性,结合初始训练参数组构建初始多模态动作模型,利用获取的任务特定数据对初始多模态动作模型进行微调,得到微调多模态动作模型,获取目标环境的环境交互数据集,利用微调多模态动作模型对环境交互数据集进行逐个交互采样,生成若干个目标交互轨迹,并对微调多模态动作模型中的选择策略进行策略优化,得到目标选择策略。本发明提升了多模态动作模型在面对新情境或数据不足时,模型的选择策略准确度。
技术关键词
策略优化方法 多模态 轨迹 数据 参数 皮尔逊相关系数 关键帧 采样点 交互动作 序列 策略优化装置 指令 语义向量 图像 处理器 人工智能技术 医疗健康 强度