基于物体级无损高斯场的多粒度开放词汇查询方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
基于物体级无损高斯场的多粒度开放词汇查询方法
申请号:
CN202510679561
申请日期:
2025-05-26
公开号:
CN120580432A
公开日期:
2025-09-02
类型:
发明专利
摘要
本发明提供一种基于物体级无损高斯场的多粒度开放词汇查询方法,引入了一种具有全局一致性代码本的物体级别高斯场,高斯场中的可学习语义标签向量渲染回对应的物体标签后,通过代码本建立起该标签和对应未压缩的高维特征之间的直接映射,从而支持任意维度的语义特征,而无需额外的压缩,显著提高了对物体的理解能力;本发明在多个场景中进行了广泛的定量和定性评估,展示了在物体层面零样本分割和开放词汇理解方面的卓越性能,尤其在物体‑部件的分层检索中实现了最高精度,同时还支持多粒度场景编辑。
技术关键词
查询方法
多层感知机
三元组
感兴趣物体
深度图
场景
图像结构
坐标系
视觉
文本
图像编码器
像素
语义标签
瓦片
语义特征