AI资讯新闻榜单内容搜索-AR

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AR
OpenAI去年挖的坑填上了!奖励模型首现Scaling Law,1.8B给70B巨兽上了一课

OpenAI去年挖的坑填上了!奖励模型首现Scaling Law,1.8B给70B巨兽上了一课

OpenAI去年挖的坑填上了!奖励模型首现Scaling Law,1.8B给70B巨兽上了一课

最近,一款全新的奖励模型「POLAR」横空出世。它开创性地采用了对比学习范式,通过衡量模型回复与参考答案的「距离」来给出精细分数。不仅摆脱了对海量人工标注的依赖,更展现出强大的Scaling潜力,让小模型也能超越规模大数十倍的对手。

来自主题: AI技术研报
5854 点击    2025-07-11 16:30
感知错误率降低30.5%:隐式感知损失让模型主动“睁大眼睛” | UIUC&阿里通义

感知错误率降低30.5%:隐式感知损失让模型主动“睁大眼睛” | UIUC&阿里通义

感知错误率降低30.5%:隐式感知损失让模型主动“睁大眼睛” | UIUC&阿里通义

让大模型在学习推理的同时学会感知。伊利诺伊大学香槟分校(UIUC)与阿里巴巴通义实验室联合推出了全新的专注于多模态推理的强化学习算法PAPO(Perception-Aware Policy Optimization)。

来自主题: AI技术研报
6378 点击    2025-07-11 16:23
从Palantir看为什么context可能比模型更重要

从Palantir看为什么context可能比模型更重要

从Palantir看为什么context可能比模型更重要

最终体验 = 模型 + context (包括提示词、文件、代码库、业务数据,MCP服务等等一切喂给模型的东西),正好Andrej karpathy前几天天也整了个新提法叫Context engineering,这里可以碰瓷一下Andrej哈哈,这篇文章好几天前我发在小红书了

来自主题: AI资讯
6570 点击    2025-07-11 09:41
饿了么联创悄悄做了一家 AI 公司Orion Arm,两款AI工具Toki和Syft专攻效率赛道

饿了么联创悄悄做了一家 AI 公司Orion Arm,两款AI工具Toki和Syft专攻效率赛道

饿了么联创悄悄做了一家 AI 公司Orion Arm,两款AI工具Toki和Syft专攻效率赛道

汪渊 Raymond 已经重新开始创业,而且方向是当红的 AI 应用,公司名叫:Orion Arm,主体注册在新加坡,主做海外市场。Orion Arm 最近刚刚完成一笔 1100 万美元融资,投后估值 1 亿美元。有趣的是,他们做的不是 Agent,不是当前热门的那些领域,而是纯粹的工具Orion Arm 发布了两款 AI 工具:日程管理类的 Toki 和新闻聚合类的 Syft。

来自主题: AI资讯
7307 点击    2025-07-10 20:07
蓝鲸独家|前月之暗面产品负责人明超平AI编程项目获新一轮融资,估值已达数亿美金

蓝鲸独家|前月之暗面产品负责人明超平AI编程项目获新一轮融资,估值已达数亿美金

蓝鲸独家|前月之暗面产品负责人明超平AI编程项目获新一轮融资,估值已达数亿美金

蓝鲸科技从多位知情人士处独家获悉,前月之暗面核心产品负责人明超平AI编程项目“新言意码”新一轮融资估值数亿美金,红杉中国参与投资。相较上一轮估值翻了两倍以上。

来自主题: AI资讯
6269 点击    2025-07-10 13:36
花49元试了下Lovart国内版,集结数十个模型的设计Agent能有多强?

花49元试了下Lovart国内版,集结数十个模型的设计Agent能有多强?

花49元试了下Lovart国内版,集结数十个模型的设计Agent能有多强?

还记得那个号称「全球首个设计 Agent」的 Lovart 吗?它是继 Manus 后在海外爆火的另一款 Agent 产品,而且学到了 Manus 的「精髓」:有邀请码才能体验。当时国内出现了「一码难求」的盛况。最近,这个 Lovart 出了国内版,名叫星流 Agent,专注于设计和创意内容生成

来自主题: AI产品测评
6447 点击    2025-07-10 13:08
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦

4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦

4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦

香港大学NLP团队联合字节跳动Seed、复旦大学发布名为Polaris的强化学习训练配方:通过Scaling RL,Polaris让4B模型的数学推理能力(AIME25上取得79.4,AIME24上取得81.2)超越了一众商业大模型,如Seed-1.5-thinking、Claude-4-Opus和o3-mini-high(25/01/31)。

来自主题: AI资讯
5742 点击    2025-07-09 12:10
多模态模型学会“按需搜索”,少搜30%还更准!字节&NTU新研究优化多模态模型搜索策略

多模态模型学会“按需搜索”,少搜30%还更准!字节&NTU新研究优化多模态模型搜索策略

多模态模型学会“按需搜索”,少搜30%还更准!字节&NTU新研究优化多模态模型搜索策略

多模态模型学会“按需搜索”!字节&NTU最新研究,优化多模态模型搜索策略——通过搭建网络搜索工具、构建多模态搜索数据集以及涉及简单有效的奖励机制,首次尝试基于端到端强化学习的多模态模型自主搜索训练。

来自主题: AI技术研报
6209 点击    2025-07-09 10:35
芯片之外,中美AI拼的是能源?

芯片之外,中美AI拼的是能源?

芯片之外,中美AI拼的是能源?

7月8日消息,谷歌智能体业务主管奥马尔·沙姆斯(Omar Shams)近日做客播客节目《Manifold》,接受了密歇根州立大学计算数学教授、大模型应用开发商Superfocus.ai创始人Steve Hsu的专访。沙姆斯曾创办AI初创公司Mutable,后被谷歌收购。

来自主题: AI资讯
7593 点击    2025-07-09 09:47