一种面向高效的开放词汇全景分割方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种面向高效的开放词汇全景分割方法
申请号:CN202510109507
申请日期:2025-01-23
公开号:CN120032371A
公开日期:2025-05-23
类型:发明专利
摘要
本发明公开了一种面向高效的开放词汇全景分割方法,包括以下步骤:S1、基于多尺度特征提取器和轻量级聚合器进行视觉特征提取和聚合;S2、利用文本编码器对任意类别词汇进行编码,得到文本嵌入S3、基于词汇感知选择模块提升视觉聚合特征的语义理解,减轻掩码解码器的特征交互负担;S4、基于双向动态嵌入专家,通过动态分配专家权重,生成具有语义感知和空间感知的实例嵌入;S5、基于轻量级解码器,使用对象核逐层进行掩码预测和细化,利用对象核和文本嵌入进行点积作为类别预测;该方法在实现相当性能的同时,旨在减少模型计算开销、加快推理速度,具有显著的实用价值和应用前景。
技术关键词
全景分割方法 视觉特征提取 路由器 文本编码器 多尺度特征提取 语义 注意力 解码器 对象 感知特征 动态 参数 前馈神经网络 金字塔结构 融合视觉 双线性插值