一种基于跨模态深度学习的食物烹饪状态检测方法及系统
申请号:CN202411666916
申请日期:2024-11-21
公开号:CN119600592B
公开日期:2025-07-29
类型:发明专利
摘要
本发明提供一种基于跨模态深度学习的食物烹饪状态检测方法及系统,包括采集食品烹饪数据集,利用改进型Yolo模型提取图像特征;使用UMAP对图像特征进行降维后进行成熟度分级;利用TCN时间序列模型提取温度‑时间序列特征;融合图像特征和温度‑时间序列特征;训练ViT模型,并使用自适应机制改进的冠豪猪优化算法CPO对训练ViT模型超参数的设置进行智能寻找最优解;识别食物的烹饪状态;本发明通过轻量级多模态注意力机制模块实现图像特征与时间序列特征的最佳权重调整及加权融合;本发明还引入了基于冠豪猪优化算法(CPO)的ViT模型超参数优化策略,提高了模型检测精度,实现对食物烹饪状态的实时监测与评估。
技术关键词
烹饪状态检测方法
时间序列特征
跨模态
时间序列模型
状态检测系统
模型超参数
状态检测模块
多模态注意力
多模态特征
特征金字塔网络
数据可视化
图像特征提取
识别食物
动态时间规划
融合图像特征
注意力机制
图像特征信息