
50%优势,力压OpenAI和DeepMind!清华DSAC系列算法全面解析
50%优势,力压OpenAI和DeepMind!清华DSAC系列算法全面解析清华大学团队在强化学习领域取得重大突破
清华大学团队在强化学习领域取得重大突破
2024年生成式AI的发展堪称疯狂,大模型战火蔓延到各个赛道,垂直应用热潮此消彼长。尤其是在AI编程领域,算法进展突飞猛进,多个新晋独角兽诞生,投资者密集涌入,亿级融资从年初宣到年尾。
小模型也能击败o1?微软全华人团队提出rStar-Math算法,三大革命性技术突破,不仅让SLM在数学推理能力上刷新SOTA,更是挤进了全美20%顶尖高中生榜单。
上世纪五十年代,普通美国家庭每天看电视的时间“高达”6小时。显像管技术迎来黄金时代,但质疑声接踵而至。
当监管不到位的时候,AI与算法可以滋养出怎样的巨兽。
智能涌现独家获悉:零一万物裁撤预训练算法团队和Infra团队后,阿里通义、智能云团队给出了offer。
在人工智能领域,具有挑战性的模拟环境对于推动多智能体强化学习(MARL)领域的发展至关重要。在合作式多智能体强化学习环境中,大多数算法均通过星际争霸多智能体挑战(SMAC)作为实验环境来验证算法的收敛和样本利用率。
2019 年问世的 GPT-2,其 tokenizer 使用了 BPE 算法,这种算法至今仍很常见,但这种方式是最优的吗?来自 HuggingFace 的一篇文章给出了解释。
随着AI时代的到来,算法、大模型、深度学习等技术飞速发展,使得人形机器人成为了面向未来的黄金赛道。
平面设计是一门艺术学科,它们致力于创造一些吸引注意力和有效传达信息的视觉内容。为了减轻人类设计师的负担,各种各样的海报生成模型相继被提出。它们只关注某些子任务,远未实现设计构图任务;它们在生成过程中不考虑图形设计的层次信息。为了解决这些问题,作者将分层设计原理引入多模态模型(LMM),并提出LaDeCo算法。