基于多模态大语言模型的智能工具柜系统及控制方法

申请号：CN202511320782

申请日期：2025-09-16

公开号：CN120823664B

公开日期：2025-11-14

类型：发明专利

摘要

本发明属于人工智能与智能系统技术领域，尤其涉及一种基于多模态大语言模型的智能工具柜系统及控制方法。包括：核心处理模块获取智能工具柜的状态图像，并将状态图像输入至多模态识别模块；提示词工程模块向多模态识别模块输入提示词，提示词包括角色信息、输出格式信息和空间分布引导词；多模态识别模块集成有多模态大语言模型，多模态大语言模型基于智能工具柜的状态图像和提示词，实现工具名称与借还状态的识别；数据处理模块接收多模态识别模块的识别结果，完成工具取用和/或归还记录的提取和存储。本发明基于多模态大语言模型和提示词工程解决了现有技术存在的初始投入成本高和准确率受限的问题。

技术关键词

智能工具柜系统大语言模型多模态识别模块数据处理模块身份验证模块霍尔传感器模块核心指纹识别方式格式策略图像采集模块智能系统传感模块柜门受限