基于连续强化学习的数据处理方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于连续强化学习的数据处理方法及系统
申请号:CN202510026660
申请日期:2025-01-08
公开号:CN119962704A
公开日期:2025-05-09
类型:发明专利
摘要
本发明公开了基于连续强化学习的数据处理方法及系统,属于机器学习和人工智能领域,其具体包括:从情景记忆模块和回放缓存模块中采样转换数据,计算先前和当前任务的策略网络梯度,并据此计算梯度夹角;根据梯度夹角调整当前任务梯度方向,并生成对抗性样本;使用对抗性样本更新策略网络和批评网络参数,同时动态调整学习率;迭代训练过程中,不断更新记忆模块和缓存模块,并定期评估模型性能;该方法能有效提升强化学习模型的训练效率和泛化能力,避免模型遗忘旧知识。
技术关键词
对抗性 数据处理方法 策略 网络 数据处理系统 强化学习模型 样本 模型更新 参数 强化学习框架 反余弦函数 记忆 回放模块 时序 动态 符号 格式 算法