基于概率表征学习的视觉文本多模态动物姿态估计方法

申请号：CN202411871792

申请日期：2024-12-18

公开号：CN119723668B

公开日期：2025-10-31

类型：发明专利

摘要

本发明涉及一种基于概率表征学习的视觉文本多模态动物姿态估计方法，所述的方法包括，获取图像数据集并提取图像特征；构建属性描述集，并对所述的文本关键点类别名进行转换并获取提示模板；基于所述的提示模板构建每一关键点的多变量高斯分布；基于所述的多变量高斯分布和图像特征构建关键点空间位置得分分布图；基于所述的关键点空间位置得分分布图和图像特征得到关键点热力图，基于所述的关键点热力图进行动物姿态估计，获取关键点坐标。与现有技术相比，本发明解决了现有技术中因单一提示模板和多种类动物数据分布不均造成的姿态估计不准确的问题。

技术关键词

关键点姿态估计方法热力图多模态表达式文本图像动物变量视觉矩阵模板交叉注意力机制坐标参数信号调制数据分布