摘要
本发明公开了一种多模态图形图像处理设备,包括:手势识别模块,用于通过深度摄像头或光学传感器采集用户手势信号;语音识别模块,用于通过麦克风阵列采集语音指令并转换为控制信号;图像处理模块,用于接收输入图像并执行格式转换、分辨率调整及压缩操作;多模态融合控制单元,用于整合手势信号、语音指令和图像处理逻辑,生成输出指令;输出接口,支持自动生成JPEG、PNG、PDF、SVG格式文件,并通过有线或无线传输协议输出;本发明采用手势识别模块、多模态融合控制单元、能够通过整合手势、语音指令和自动化图像处理,实现多种场合办公的高效的人机协同,从而达到提高图形处理效率的目的。