字节Seed团队PHD-Transformer突破预训练长度扩展!破解KV缓存膨胀难题
字节Seed团队PHD-Transformer突破预训练长度扩展!破解KV缓存膨胀难题最近,DeepSeek-R1 和 OpenAI o1/03 等推理大模型在后训练阶段探索了长度扩展(length scaling),通过强化学习(比如 PPO、GPRO)训练模型生成很长的推理链(CoT),并在奥数等高难度推理任务上取得了显著的效果提升。
最近,DeepSeek-R1 和 OpenAI o1/03 等推理大模型在后训练阶段探索了长度扩展(length scaling),通过强化学习(比如 PPO、GPRO)训练模型生成很长的推理链(CoT),并在奥数等高难度推理任务上取得了显著的效果提升。
“定焦One”选取了市面上几家热门的AI榜单,分别是AI产品榜、Xsignal、AIGCRank、新榜,综合了月活(MAU)、日活(DAU)、下载量三个比较重要的维度,以及从业者的观点,梳理出1~3月全球AI应用的前二十及国内前十,有了以下发现:
,MetaGPT & Mila 联合全球范围内 20 个顶尖研究机构的 47 位学者,共同撰写并发布了长篇综述《Advances and Challenges in Foundation Agents:
5月19-23日,ICRA 2025将在美国亚特兰大举行。届时,第一届“探索机器人能力边界双臂机器人挑战赛(WBCD,What Bimanual Can Do)”决赛也将在ICRA 2025现场拉开帷幕。
近年来,大语言模型(LLMs)在自然语言理解、代码生成与通用推理等任务上取得了显著进展,逐步成为通用人工智能的核心基石。
她21岁创立AI公司,靠5%股份逆风翻盘!Lucy Guo如何从自学编程到辍学创业,超越Taylor Swift,成为全球最年轻的白手起家女亿万富翁?Scale AI最新估值为250亿美元,这也让联合创始人Lucy Guo凭借其股份身价暴涨。
美国当地时间4月24日,谷歌母公司Alphabet公布了截至2025年3月31日的第一季度财报。财报显示,Alphabet第一季度营收为902.34亿美元,同比增长12%,不计入汇率变动的影响为同比增长14%;按照美国通用会计准则,Alphabet第一季度净利润为345.40亿美元,较去年同期的236.62亿美元相比增长46%;
今天,美国具身智能公司 Physical Intelligence 推出了一个基于 π0 的视觉-语言-动作(VLA)模型 π0.5,其利用异构任务的协同训练来实现广泛的泛化,可以在全新的家中执行各种任务。
到了2025年,即便是对科技不太感兴趣的人应该也会对人工智能(AI)如雷贯耳了,AI改变生活也早已不是预言,而是正在发生的现实。既然AI是热点,也就意味着必然有人会试图浑水摸鱼,最近就有美国的投资者因此遭殃。近日美国司法部方面透露,AI购物应用Nate的创始人Albert Saniger被指控通过虚假宣传AI技术,骗取了超过4000万美元的投资。
今天,微软重磅官宣:「AI同事时代」正式来临!Microsoft 365 Copilot今天又迎来一波重大更新,Researcher、Analyst等智能体强势登场。同时发布的2025工作趋势报告预言:2025将成人机混合的「前沿公司」年。