基于概率表征学习的视觉文本多模态动物姿态估计方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于概率表征学习的视觉文本多模态动物姿态估计方法
申请号:CN202411871792
申请日期:2024-12-18
公开号:CN119723668B
公开日期:2025-10-31
类型:发明专利
摘要
本发明涉及一种基于概率表征学习的视觉文本多模态动物姿态估计方法,所述的方法包括,获取图像数据集并提取图像特征;构建属性描述集,并对所述的文本关键点类别名进行转换并获取提示模板;基于所述的提示模板构建每一关键点的多变量高斯分布;基于所述的多变量高斯分布和图像特征构建关键点空间位置得分分布图;基于所述的关键点空间位置得分分布图和图像特征得到关键点热力图,基于所述的关键点热力图进行动物姿态估计,获取关键点坐标。与现有技术相比,本发明解决了现有技术中因单一提示模板和多种类动物数据分布不均造成的姿态估计不准确的问题。
技术关键词
关键点 姿态估计方法 热力图 多模态 表达式 文本 图像 动物 变量 视觉 矩阵 模板 交叉注意力机制 坐标 参数 信号调制 数据分布