一种无人夹抱车强化学习规控算法的评价网络设计方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种无人夹抱车强化学习规控算法的评价网络设计方法
申请号:
CN202510103088
申请日期:
2025-01-22
公开号:
CN120046690A
公开日期:
2025-05-27
类型:
发明专利
摘要
本发明公开了一种无人夹抱车强化学习规控算法的评价网络设计方法,本发明通过高质量离线正样本融入评价网络的训练过程中,加速强化学习规控算法收敛并减少试错探索时间以提升作业效率;同时构建专门的评价网络融合层,依据离线正样本可信度与在线训练可信度动态调整权重,将离线正样本信息与在线训练特征融合,充分挖掘其有效作业策略,增强评价网络准确性与稳定性,最终实现整个强化学习规控算法性能的显著提升,有效推动无人夹抱车在复杂物流环境中的高效、精准作业。
技术关键词
网络设计方法
样本
夹抱车
作业场景
离线
融合策略
在线
算法
序列
训练特征融合
网络基础架构
作业策略
优化器
数据
参数
计算误差
训练集