AI资讯新闻榜单内容搜索-强化学习算法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 强化学习算法
多智能体强化学习算法评估Hard模式来了!浙大、南栖仙策联手推出

多智能体强化学习算法评估Hard模式来了!浙大、南栖仙策联手推出

多智能体强化学习算法评估Hard模式来了!浙大、南栖仙策联手推出

在人工智能领域,具有挑战性的模拟环境对于推动多智能体强化学习(MARL)领域的发展至关重要。在合作式多智能体强化学习环境中,大多数算法均通过星际争霸多智能体挑战(SMAC)作为实验环境来验证算法的收敛和样本利用率。

来自主题: AI技术研报
7209 点击    2025-01-05 20:51
性能提升、成本降低,这是分布式强化学习算法最新研究进展

性能提升、成本降低,这是分布式强化学习算法最新研究进展

性能提升、成本降低,这是分布式强化学习算法最新研究进展

分布式强化学习是一个综合的研究子领域,需要深度强化学习算法以及分布式系统设计的互相感知和协同。考虑到 DDRL 的巨大进步,我们梳理形成了 DDRL 技术的展历程、挑战和机遇的系列文章。

来自主题: AI技术研报
1971 点击    2024-02-13 14:05
性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max|NeurIPS 2023 Spotlight

性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max|NeurIPS 2023 Spotlight

性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max|NeurIPS 2023 Spotlight

SPF算法是一种基于状态序列频域预测的表征学习方法,利用状态序列的频域分布来显式提取状态序列数据中的趋势性和规律性信息,从而辅助表征高效地提取到长期未来信息。

来自主题: AI技术研报
8086 点击    2024-01-16 10:59
清华AI模型登Nature子刊:玩转城市空间规划,快人类3000倍

清华AI模型登Nature子刊:玩转城市空间规划,快人类3000倍

清华AI模型登Nature子刊:玩转城市空间规划,快人类3000倍

来自清华大学的研究团队提出了一个深度强化学习算法的模型。基于 15 分钟城市概念,该模型可以进行复杂的城市空间规划。

来自主题: AI技术研报
3789 点击    2023-09-18 00:29
2型糖尿病患者血糖如何精准调控?中山医院利用AI系统突破,成果刊顶级期刊

2型糖尿病患者血糖如何精准调控?中山医院利用AI系统突破,成果刊顶级期刊

2型糖尿病患者血糖如何精准调控?中山医院利用AI系统突破,成果刊顶级期刊

近日,复旦大学附属中山医院内分泌科李小英、陈颖团队联合北京邮电大学王光宇教授团队首次提出采用基于强化学习算法的AI系统“RL-DITR”制定胰岛素决策策略。

来自主题: AI资讯
3108 点击    2023-09-17 22:59