一种基于单模型多任务推理的智慧座舱实现方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于单模型多任务推理的智慧座舱实现方法及系统
申请号:CN202510700314
申请日期:2025-05-28
公开号:CN120510599A
公开日期:2025-08-19
类型:发明专利
摘要
本发明公开了一种基于单模型多任务推理的智慧座舱实现方法及系统,属于汽车电子领域,包括对智慧座舱内原始图像数据预处理后,将共享深度特征输入检测头和第一分类头,检测头的输出采用检测后处理得到目标检测锚框及位置信息,第一分类头的输出采用分类后处理得到分心识别分类;对目标检测锚框及位置信息进行预处理后,将人体区域子图像输入安全带识别分类模型;将人脸区域子图像并行输入疲劳识别分类模型、人脸ID匹配模型、注视点估计模型、视线估计模型及头部姿态估计模型;采集连续视频流中的人脸图像序列和语音序列,分别输入唇语识别模型和语音识别模型,将识别结果输入大语言模型处理后生成交互指令,通过语音合成模块输出响应。
技术关键词
多任务 座舱 大语言模型 人脸图像序列 头部姿态估计 语音识别模型 原始图像数据 唇语识别 注视点 特征提取网络 手部关键点 安全带 视频流 应急通风系统 联合训练方法 图像分类识别 语音识别文本