基于大模型的跨模态接话机器人及全场景智控系统及方法
申请号:CN202511061402
申请日期:2025-07-31
公开号:CN120825472A
公开日期:2025-10-21
类型:发明专利
摘要
本发明公开了基于大模型的跨模态接话机器人及全场景智控系统及方法,系统包括:基于多模态大模型的跨模态理解引擎,获取多模态数据并进行语义理解生成统一的语义表示;MCP协议管理器用于管理MCP协议,实现动态发现与工具调用、多任务编排以及跨模态交互;场景智控中枢实现对接各类客服对话场景渠道,并管理接话智能体;智能体调度器用于根据用户需求动态创建智能体,每个智能体负责特定任务的处理,在服务过程中通过意图分解算法识别用户需求,将复杂场景分解为多个原子服务单元,并通过动态分配任务实现负载均衡;适配接口用于实现与多种设备兼容通信。本发明显著提升系统应对突发事件能力。
技术关键词
智控系统
智控方法
协议管理器
视频帧特征
机器人
多模态
分解算法
场景分解
调度器
语义
跨模态
情绪识别技术
TTS技术
文本
客服
多任务
自然语音
意图
动态