摘要
本申请公开了一种人机交互方法、装置、电子设备及存储介质,其中,方法包括:接收用户输入的第一信息,第一信息包括文字信息和/或语音信息;对第一信息按照预先配置的消息格式进行构造,得到第二信息;将第二信息和提示词输入至多模态大模型,得到多模态大模型输出的结果信息;若结果信息包括初始操作命令,则对初始操作命令进行调整,得到目标操作命令;执行所述目标操作命令。通过上述过程,可以将用户输入的第一信息转换成明确的操作命令(即目标操作命令)并执行,提高了人机交互的便利性,同时,由于用户不用具备操作命令的相关知识,降低了专业门槛,打破了需要相关技术人员才能进行人机交互的壁垒,使得这种人机交互的方式具有普适性。