一种耳廓指代分割方法和系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种耳廓指代分割方法和系统
申请号:CN202510140742
申请日期:2025-02-08
公开号:CN119579905B
公开日期:2025-05-30
类型:发明专利
摘要
本发明提供一种耳廓指代分割方法和系统,包括:将待分割人耳图像和文本描述输入耳廓指代分割模型,模型包括文本编码模块、文本引导的视觉编码模块和视觉解码模块、角度变换模块;文本编码模块得到文本特征;视觉编码模块通过组织成四阶段的结构实现文本特征与图像特征的融合,每个阶段的视觉编码器生成视觉特征,跨模态感知模块对齐与得到多模态特征,中的每个元素由注意力门控模块进行加权获得加权多模态特征,按元素与相加产生增强视觉特征,将输入视觉解码模块逐步恢复图像的空间分辨率,进一步融合文本和视觉特征输出多尺度特征;角度变换模块对多尺度特征进行角度变换,输出与文本描述相关区域的分割掩码。本发明可以对耳廓进行指代分割。
技术关键词
视觉特征 多模态特征 文本 解码模块 多尺度特征 人耳图像 阶段 编码模块 跨模态 注意力 双线性插值 分割方法 分辨率 上采样 冗余特征 非线性