多模态融合食物识别大模型的构建及应用方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
多模态融合食物识别大模型的构建及应用方法及系统
申请号:CN202511014665
申请日期:2025-07-23
公开号:CN120524371A
公开日期:2025-08-22
类型:发明专利
摘要
本申请实施例公开了一种多模态融合食物识别大模型的构建及应用方法及系统,方法包括:获取多模态训练数据集,采用多模态训练数据集中的多模态训练数据进行联合训练,获取多模态融合食物识别大模型;获取待识别食物的多模态数据;通过多模态融合食物识别大模型对多模态数据进行特征提取与融合,获取对应的融合特征信息;基于融合特征信息利用多模态融合食物识别大模型进行食物种类识别及营养成分分析,输出识别结果及营养建议。本申请实施例,利用大模型的强大学习和推理能力,基于待识别食物的多模态数据进行待识别食物的识别,对食物进行更准确、全面的识别,提高食物识别的准确率和可靠性。
技术关键词
多模态 视觉特征信息 语音特征信息 融合特征 识别食物 语义特征 语音识别技术 文本 模态特征 食物数据库 注意力机制 语音识别模型 自然语言 食物推荐 跨模态 图像