AI资讯新闻榜单内容搜索-研究

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 研究
谷歌AI攻克6道世界级难题,比IMO金牌更震撼!陶哲轩指明新玩法

谷歌AI攻克6道世界级难题,比IMO金牌更震撼!陶哲轩指明新玩法

谷歌AI攻克6道世界级难题,比IMO金牌更震撼!陶哲轩指明新玩法

Google DeepMind最新AI智能体Aletheia在FirstProof挑战赛中,独立攻克了6道世界级数学难题,实现了从竞赛水平到PhD科研级的质变。人类数学研究的「手工时代」或许正步入倒计时。

来自主题: AI资讯
8020 点击    2026-03-01 11:28
GRASP Lab | VPP-TC: 基于可行性理论的被动力矩安全控制框架

GRASP Lab | VPP-TC: 基于可行性理论的被动力矩安全控制框架

GRASP Lab | VPP-TC: 基于可行性理论的被动力矩安全控制框架

本篇文章被 ICRA 2026 接收并获得 IROS 2025 双料 Workshop 最佳论文,第一作者张子哲(site: zizhe.io)是宾夕法尼亚大学机器人学硕士生,同时在 GRASP 实验室担任科研助理,导师为 Nadia Figueroa 教授,研究兴趣涵盖机器学习,安全控制以及人机交互。

来自主题: AI技术研报
8571 点击    2026-03-01 11:18
21万年费彭博终端机被AI复刻!Perplexity俩月憋出新“PC”:整合所有AI功能,以Opus为核心调度19个模型

21万年费彭博终端机被AI复刻!Perplexity俩月憋出新“PC”:整合所有AI功能,以Opus为核心调度19个模型

21万年费彭博终端机被AI复刻!Perplexity俩月憋出新“PC”:整合所有AI功能,以Opus为核心调度19个模型

Perplexity发推表示,推出新产品Perplexity Computer,一个基于浏览器的、全能型通用数字员工。按照官方的说法,它能推理、委派、搜索、构建、记忆、编码、交付,部署项目、设计文件、研究课题、管理工作流程……

来自主题: AI资讯
8257 点击    2026-03-01 11:10
Claude Code“隐形技术栈”被扒出来了!2430次测试揭秘工具偏好清单

Claude Code“隐形技术栈”被扒出来了!2430次测试揭秘工具偏好清单

Claude Code“隐形技术栈”被扒出来了!2430次测试揭秘工具偏好清单

最近,专注于量化AI主观决策的基准测试工作室Amplifying.ai,针对Claude Code的工具选择倾向开展了一项系统性研究。研究覆盖3款模型、4种项目类型及20个工具类别,累计分析了2430次工具选择行为。

来自主题: AI技术研报
8276 点击    2026-02-27 17:04
算力救不了AI智商?谷歌新大招终结「随机鹦鹉」争论!

算力救不了AI智商?谷歌新大招终结「随机鹦鹉」争论!

算力救不了AI智商?谷歌新大招终结「随机鹦鹉」争论!

传统AI模型在稀疏奖励环境中,往往会找不到激励难以学会层次化思考。如今,谷歌团队通过引入元控制器操控模型内部残差流,让智能体学会了「跳跃式思考」。该研究揭示了大模型内部可自发形成了类似人脑的层次化决策机制,为AI在需要多步的复杂任务提供了全新的训练范式。

来自主题: AI技术研报
7435 点击    2026-02-27 10:58
首次证实RL能让3D模型学会推理,复杂文本描述下生成质量跃升!

首次证实RL能让3D模型学会推理,复杂文本描述下生成质量跃升!

首次证实RL能让3D模型学会推理,复杂文本描述下生成质量跃升!

当GRPO让大模型在数学、代码推理上实现质变,研究团队率先给出答案——首个将强化学习系统性引入文本到3D自回归生成的研究正式诞生,并被CVPR 2026接收。该研究不只是简单移植2D经验,而是针对3D生成的独特挑战,从奖励设计、算法选择、评测基准到训练范式,做了一套完整的系统性探索。

来自主题: AI技术研报
6944 点击    2026-02-27 10:28
刚刚,庞若鸣跳槽OpenAI!放弃14亿年薪,在Meta只待了7个月

刚刚,庞若鸣跳槽OpenAI!放弃14亿年薪,在Meta只待了7个月

刚刚,庞若鸣跳槽OpenAI!放弃14亿年薪,在Meta只待了7个月

入职Meta「超级智能实验室」仅7个月,华人明星研究员庞若明(Ruoming Pang)转投OpenAI。此前,他曾担任苹果AI/ML基础模型团队负责人,却因内部不合,转身离开。为了挖走庞若明,小扎曾为他开出高达2亿美金薪酬包。在此期间,他主要在MSL中,担任AI基础设施负责人。

来自主题: AI资讯
9606 点击    2026-02-26 17:19
大语言模型真的会「推理」吗?一项系统性研究梳理 LLM 的结构性推理失败

大语言模型真的会「推理」吗?一项系统性研究梳理 LLM 的结构性推理失败

大语言模型真的会「推理」吗?一项系统性研究梳理 LLM 的结构性推理失败

近期发表于 TMLR 的论文《Large Language Model Reasoning Failures》对这一问题进行了系统性梳理。该研究并未围绕 “模型是否真正理解” 展开哲学层面的争论,而是采取更加务实的路径 —— 通过整理现有文献中的失败现象,构建统一框架,系统分析大语言模型的推理短板。

来自主题: AI技术研报
7311 点击    2026-02-26 10:52
清华数学系大神跳槽OpenAI!曾主导SAM与Llama开发,Sora负责人:欢迎加入

清华数学系大神跳槽OpenAI!曾主导SAM与Llama开发,Sora负责人:欢迎加入

清华数学系大神跳槽OpenAI!曾主导SAM与Llama开发,Sora负责人:欢迎加入

刚刚,毕业清华大学数学系,曾在Meta FAIR工作3.75年、主导过SAM与Llama多项核心工作的研究员张鹏川(Pengchuan Zhang)宣布离职。他的下一站,是来到OpenAI,投身于世界模拟与机器人学(World Simulation and Robotics)方向的研究。

来自主题: AI资讯
9444 点击    2026-02-25 14:57
Gemini 3仅得33.6分!清华发布首个「约束流形」空间智能基准

Gemini 3仅得33.6分!清华发布首个「约束流形」空间智能基准

Gemini 3仅得33.6分!清华发布首个「约束流形」空间智能基准

SSI-Bench是首个在约束流形中评估模型空间推理能力的基准,强调真实结构与约束条件,通过排序任务考察模型是否能准确理解三维结构的几何与拓扑关系,揭示当前大模型在空间智能上严重依赖2D信息,实际表现远低于人类。研究指出,模型需提升三维构型识别和约束推理能力,才能真正理解空间问题。

来自主题: AI技术研报
9049 点击    2026-02-25 14:33