摘要
本发明公开了一种大小模型协同的虚实任务规划对齐方法,包括构建基于大语言模型的虚实任务时空轨迹预测模型,利用其上下文推理能力,在拥堵影响子图CIS的基础上推理出更准确的时空轨迹估计结果和构建基于接地动作转换的虚实任务规划对齐机制,从人类反馈中学习偏好,使大型语言LLM模型能够通过交互迭代地学习人类偏好,并利用这些知识进行微调生成并增强了员工旅行时间和现实世界设置之间的对齐,通过调整仿真环境中的任务规划策略,使其更符合真实世界的交通演化规律。本发明提升时空轨迹估计的精准度,从而有效解决复杂众包环境中的任务分配问题。