AI资讯新闻榜单内容搜索-APO

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: APO
DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文

DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文

DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文

本文详细解读了 Kimi k1.5、OpenReasonerZero、DAPO 和 Dr. GRPO 四篇论文中的创新点,读完会对 GRPO 及其改进算法有更深的理解,进而启发构建推理模型的新思路。

来自主题: AI技术研报
8857 点击    2025-05-24 14:33
01年实习生被曝负责字节RL核心算法!系字节LLM攻坚小组成员

01年实习生被曝负责字节RL核心算法!系字节LLM攻坚小组成员

01年实习生被曝负责字节RL核心算法!系字节LLM攻坚小组成员

一个超越DeepSeek GRPO的关键RL算法出现了!这个算法名为DAPO,字节、清华AIR联合实验室SIA Lab出品,现已开源。禹棋赢,01年生,本科毕业于哈工大,直博进入清华AIR,目前博士三年级在读。去年年中,他以研究实习生的身份加入字节首次推出的「Top Seed人才计划」。

来自主题: AI资讯
7638 点击    2025-03-20 23:06
超越DeepSeek GRPO的关键RL算法,字节、清华AIR开源DAPO

超越DeepSeek GRPO的关键RL算法,字节、清华AIR开源DAPO

超越DeepSeek GRPO的关键RL算法,字节、清华AIR开源DAPO

DeepSeek 提出的 GRPO 可以极大提升 LLM 的强化学习效率,不过其论文中似乎还缺少一些关键细节,让人难以复现出大规模和工业级的强化学习系统。

来自主题: AI技术研报
4774 点击    2025-03-18 17:14
自动提示词优化系统综述,APO被AWS定义为5个部分 | 最新

自动提示词优化系统综述,APO被AWS定义为5个部分 | 最新

自动提示词优化系统综述,APO被AWS定义为5个部分 | 最新

本文是对亚马逊AWS研究团队最新发表的APO(自动提示词优化)技术综述的深度解读。该研究由Kiran Ramnath、Kang Zhou等21位来自AWS的资深研究者共同完成,团队成员来自不同技术背景,涵盖了机器学习、自然语言处理、系统优化等多个专业领域。

来自主题: AI技术研报
5090 点击    2025-02-28 10:11
Meta联合斯坦福发布Apollo,揭秘视频理解六大驱动力

Meta联合斯坦福发布Apollo,揭秘视频理解六大驱动力

Meta联合斯坦福发布Apollo,揭秘视频理解六大驱动力

Orr Zohar的指导老师Serena Yeung-Levy教授于2018年获得斯坦福大学博士学位,师从李飞飞和Arnold Milstein。2017年至2019年期间,Serena Yeung-Levy曾与Justin Johnson和李飞飞共同教授斯坦福大学卷积神经网络课程。

来自主题: AI技术研报
4006 点击    2024-12-28 11:54
Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福大学联合团队全面研究多模态大模型(LMM)中驱动视频理解的机制,扩展了视频多模态大模型的设计空间,提出新的训练调度和数据混合方法,并通过语言先验或单帧输入解决了已有的评价基准中的低效问题。

来自主题: AI技术研报
6828 点击    2024-12-20 15:59
守护好你的秘密!警惕前沿AI模型已具备策划能力:一项令人震惊的研究发现

守护好你的秘密!警惕前沿AI模型已具备策划能力:一项令人震惊的研究发现

守护好你的秘密!警惕前沿AI模型已具备策划能力:一项令人震惊的研究发现

最近,Apollo Research团队发布了一项令人深思的研究。这项研究揭示了一个惊人的发现:当前主流的前沿AI模型已经具备了基本的"策划"(Scheming)能力。

来自主题: AI技术研报
5022 点击    2024-12-13 13:42
深度|生成式AI面临数据过载,应专注于更小、更具体的目标

深度|生成式AI面临数据过载,应专注于更小、更具体的目标

深度|生成式AI面临数据过载,应专注于更小、更具体的目标

Kapoor 在 2024 年 TechCrunch Disrupt 大会上启动了一场关于“新数据管道”的对话,讨论现代 AI 应用的背景,他的对话伙伴包括风险投资公司NEA的合伙人Vanessa Larco,以及数据集成平台Fivetran的首席执行官George Fraser。

来自主题: AI资讯
3270 点击    2024-11-04 17:15
[重磅-万字长文]千亿美金市值美国AI政企服务巨头Palantir产品及商业化全面解析

[重磅-万字长文]千亿美金市值美国AI政企服务巨头Palantir产品及商业化全面解析

[重磅-万字长文]千亿美金市值美国AI政企服务巨头Palantir产品及商业化全面解析

本文介绍了千亿美金市值,美国服务政企的AI高科技企业Palantir公司及其核心软件平台Gotham和Foundry,以及新产品大模型人工智能平台AIP和Apollo,它们旨在帮助政府和商业组织解决复杂问题,并利用数据做出更有效的决策。

来自主题: AI资讯
5071 点击    2024-11-04 10:37
50亿美元救星来了!英特尔绝地求生,18A制程或成翻身王牌?

50亿美元救星来了!英特尔绝地求生,18A制程或成翻身王牌?

50亿美元救星来了!英特尔绝地求生,18A制程或成翻身王牌?

前脚有高通提收购,后脚就来了救星?外媒称,风投公司阿波罗全球管理(APO),计划向英特尔投资50亿美金。全公司押注18A制程,最后救命稻草能抓住吗?

来自主题: AI资讯
8183 点击    2024-09-23 15:06