AI资讯新闻榜单内容搜索-METR

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: METR
狂奔AGI,Claude年终封王!自主编码近5小时震惊全网

狂奔AGI,Claude年终封王!自主编码近5小时震惊全网

狂奔AGI,Claude年终封王!自主编码近5小时震惊全网

2025年就要结束了,原来真正的高手,隐藏在「民间」!不是谷歌、不是OpenAI,是Anthropic王者编程模型Claude Opus 4.5。在METR最新公布报告称,Claude Opus 4.5已能够持续自主编码「长达5小时不崩」。

来自主题: AI资讯
7746 点击    2025-12-21 13:51
3A大作!阿里ROLL团队从基建->算法->机理,推动RL4LLM全栈协同优化

3A大作!阿里ROLL团队从基建->算法->机理,推动RL4LLM全栈协同优化

3A大作!阿里ROLL团队从基建->算法->机理,推动RL4LLM全栈协同优化

近期,阿里巴巴 ROLL 团队(淘天未来生活实验室与阿里巴巴智能引擎团队)联合上海交通大学、香港科技大学推出「3A」协同优化框架 ——Async 架构(Asynchronous Training)、Asymmetric PPO(AsyPPO)与 Attention 机制(Attention-based Reasoning Rhythm),

来自主题: AI技术研报
8387 点击    2025-11-11 10:24
首个实例理解3D重建模型!NTU&阶越提出基于实例解耦的3D重建模型,助理场景理解

首个实例理解3D重建模型!NTU&阶越提出基于实例解耦的3D重建模型,助理场景理解

首个实例理解3D重建模型!NTU&阶越提出基于实例解耦的3D重建模型,助理场景理解

现在,NTU联合StepFun提出了IGGT (Instance-Grounded Geometry Transformer) ,一个创新的端到端大型统一Transformer,首次将空间重建与实例级上下文理解融为一体。

来自主题: AI技术研报
5709 点击    2025-10-31 14:49
速递|字节旗下AI编程工具Trae涉嫌“偷跑”用户数据,内存占用超VSCode 5倍,官方回应新版本已大幅优化

速递|字节旗下AI编程工具Trae涉嫌“偷跑”用户数据,内存占用超VSCode 5倍,官方回应新版本已大幅优化

速递|字节旗下AI编程工具Trae涉嫌“偷跑”用户数据,内存占用超VSCode 5倍,官方回应新版本已大幅优化

近日,一位开发者在 GitHub 上公开警告称,字节跳动旗下 AI 编程环境 Trae IDE 存在在用户未明确知情的情况下,将数据上传至字节服务器的行为,即便用户已在设置中手动关闭遥测(Telemetry)功能。

来自主题: AI资讯
7218 点击    2025-07-31 11:39
AI进化时间表已现!LLM每7个月能力翻倍,2030年职场不复存在?

AI进化时间表已现!LLM每7个月能力翻倍,2030年职场不复存在?

AI进化时间表已现!LLM每7个月能力翻倍,2030年职场不复存在?

LLM正以前所未有的速度进化:METR发现,它们的智能每7个月就翻一番。到了2030年,一个模型可能只需几小时,就能搞定人类工程师几个月的工作。别眨眼,你的岗位或许已在倒计时中。

来自主题: AI技术研报
6863 点击    2025-07-15 10:24
速递|高盛两度押注!AI对账Simetrik B轮扩募至8500万美金,旨在服务企业年省百万美元对账成本

速递|高盛两度押注!AI对账Simetrik B轮扩募至8500万美金,旨在服务企业年省百万美元对账成本

速递|高盛两度押注!AI对账Simetrik B轮扩募至8500万美金,旨在服务企业年省百万美元对账成本

金融与会计服务初创企业 Simetrik 获得由高盛领投的 3000 万美元新融资。此次融资是对该公司2024 年 2 月披露的 B 轮融资的追加。当时该公司已从由高盛资产管理的,成长型股票团队领投的投资者处筹集了 5500 万美元。

来自主题: AI资讯
6193 点击    2025-06-05 16:34
北大团队发布首篇大语言模型心理测量学系统综述:评估、验证、增强

北大团队发布首篇大语言模型心理测量学系统综述:评估、验证、增强

北大团队发布首篇大语言模型心理测量学系统综述:评估、验证、增强

随着大语言模型(LLM)能力的快速迭代,传统评估方法已难以满足需求。如何科学评估 LLM 的「心智」特征,例如价值观、性格和社交智能?如何建立更全面、更可靠的 AI 评估体系?北京大学宋国杰教授团队最新综述论文(共 63 页,包含 500 篇引文),首次尝试系统性梳理答案。

来自主题: AI技术研报
9471 点击    2025-05-27 16:13
Nature发文「智能体摩尔定律」,Agent能力每7个月翻倍,5年后能顶人类苦干一个月的工作

Nature发文「智能体摩尔定律」,Agent能力每7个月翻倍,5年后能顶人类苦干一个月的工作

Nature发文「智能体摩尔定律」,Agent能力每7个月翻倍,5年后能顶人类苦干一个月的工作

AI Agents(智能体)也有自己的“摩尔定律”了?!就在最近,Nature报道了一项来自非营利研究机构METR的最新发现:AI在完成长期任务方面的进步速度惊人,其时间跨度大约每七个月翻一番。

来自主题: AI技术研报
8855 点击    2025-03-21 14:57