一种生成式AI驱动的语音点单与咖啡图案生成方法及系统

申请号：CN202511029219

申请日期：2025-07-25

公开号：CN120977315A

公开日期：2025-11-18

类型：发明专利

摘要

本发明涉及人工智能、语音识别与智能终端控制技术领域，提供一种生成式AI驱动的语音点单与咖啡图案生成方法，包括基于触发预设的交互触发条件时，采集原始音频信号进行语音识别获取对应的文本信息进行语义解析，生成结构化语义结果，并根据结构化语义结果生成饮品制作指令和图案生成请求；响应于图案生成请求，通过图像生成模型生成拉花图案；将饮品制作指令和拉花图案下发至咖啡机器人的控制模块，执行饮品制作和图案生成操作，并输出定制饮品。结合多模态感知技术提高语音识别准确性并降低误触发率。通过三层意图映射机制与自然语言处理，转换语义实体为执行参数，并生成符合设备要求的高质量拉花图案。

技术关键词

图案生成方法饮品制作图像生成模型拉花语义实体麦克风阵列咖啡机器人运动特征图案生成系统生成提示词饮品类文本多模态特征语音识别准确性信号