AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
清华团队:1.5B 模型新基线!用「最笨」的 RL 配方达到顶尖性能

清华团队:1.5B 模型新基线!用「最笨」的 RL 配方达到顶尖性能

清华团队:1.5B 模型新基线!用「最笨」的 RL 配方达到顶尖性能

如果有人告诉你:不用分阶段做强化学习、不搞课程学习、不动态调参,只用最基础的 RL 配方就能达到小模型数学推理能力 SOTA,你信吗?

来自主题: AI技术研报
5785 点击    2025-11-13 09:37
NeurIPS 25开新坑:145万个图文对,覆盖八种主流水下理解任务

NeurIPS 25开新坑:145万个图文对,覆盖八种主流水下理解任务

NeurIPS 25开新坑:145万个图文对,覆盖八种主流水下理解任务

华中科技大学团队推出首个水下多模态大模型NAUTILUS,支持8种水下场景理解任务,并开源145万图文对的NautData数据集。模型通过视觉特征增强模块解决水下图像模糊和颜色失真问题,性能超越现有模型,恶劣环境下表现更佳。

来自主题: AI技术研报
10010 点击    2025-11-12 17:16
阿里发了个简历AI神器,大小仅0.6B

阿里发了个简历AI神器,大小仅0.6B

阿里发了个简历AI神器,大小仅0.6B

复杂的简历,AI也能读懂了。

来自主题: AI技术研报
8954 点击    2025-11-12 17:15
全球第二、国内第一!钉钉发布DeepResearch多智能体框架,已在真实企业部署

全球第二、国内第一!钉钉发布DeepResearch多智能体框架,已在真实企业部署

全球第二、国内第一!钉钉发布DeepResearch多智能体框架,已在真实企业部署

在数字经济浪潮中,企业对于高效、精准的信息获取与决策支持的需求日益迫切。从前沿科学探索到行业趋势分析,再到企业级决策支持,一个能够从海量异构数据源中提取关键知识、执行多步骤推理并生成结构化或多模态输出的「深度研究系统」正变得不可或缺。

来自主题: AI技术研报
6629 点击    2025-11-12 17:05
Nature子刊:太空中建数据中心,无限能源,浙大首次证实可行!

Nature子刊:太空中建数据中心,无限能源,浙大首次证实可行!

Nature子刊:太空中建数据中心,无限能源,浙大首次证实可行!

浙江大学和新加坡南洋理工大学新研究旨在探索空间碳中和数据中心的可行性。太空环境具备两大独特优势:丰富的太阳能可为计算设备提供清洁稳定的电力;接近绝对零度的深空环境则为服务器废热提供了理想的散热条件。

来自主题: AI技术研报
9184 点击    2025-11-12 15:16
《麦肯锡2025 AI报告》|附下载

《麦肯锡2025 AI报告》|附下载

《麦肯锡2025 AI报告》|附下载

麦肯锡刚刚发布了2025年AI最新报告,一组数据让人“破防”:88%的组织都在用AI,但只有39%的组织吃出了“真金白银”。这份《The state of AI in 2025》回答了AI时代大家都很关心的一个问题:

来自主题: AI技术研报
7399 点击    2025-11-12 11:22
6666!NeurIPS满分论文来了

6666!NeurIPS满分论文来了

6666!NeurIPS满分论文来了

四个审稿人全给6分,NeurIPS唯一满分论文炸了!

来自主题: AI技术研报
9921 点击    2025-11-12 10:53
打破显存墙:谢赛宁团队提出CLM,单卡RTX 4090「撬动」1亿高斯点

打破显存墙:谢赛宁团队提出CLM,单卡RTX 4090「撬动」1亿高斯点

打破显存墙:谢赛宁团队提出CLM,单卡RTX 4090「撬动」1亿高斯点

3D Gaussian Splatting (3DGS) 是一种日益流行的新视角合成方法,给定 3D 场景的一组带位姿的图像(即带有位置和方向的图像),3DGS 会迭代训练一个场景表示,该表示由大量各向异性 3D 高斯体组成,用以捕捉场景的外观和几何形状。

来自主题: AI技术研报
10037 点击    2025-11-12 10:51
英伟达铁幕之后,谷歌AI芯片已成气候

英伟达铁幕之后,谷歌AI芯片已成气候

英伟达铁幕之后,谷歌AI芯片已成气候

英伟达在聚光灯下狂飙,谷歌却在幕后悄悄造出自己的AI基建帝国系统。当别人还在抢GPU时,它早已自给自足、闭环生长——闷声干大事,从未如此谷歌。

来自主题: AI技术研报
6103 点击    2025-11-12 10:25
上交×蚂蚁发布 DiagGym:以世界模型驱动交互式医学诊断智能体

上交×蚂蚁发布 DiagGym:以世界模型驱动交互式医学诊断智能体

上交×蚂蚁发布 DiagGym:以世界模型驱动交互式医学诊断智能体

临床诊断并非一次性的「快照」,而是一场动态交互、不断「探案」的推理过程。然而,当下的大模型大多基于静态数据训练,难以掌握真实诊疗中充满不确定性的多轮决策轨迹。如何让AI学会「追问」、选择检查,并一步步抽丝剥茧,迈向正确诊断?

来自主题: AI技术研报
7750 点击    2025-11-12 10:24
谷歌的两个5天课程都讲了什么,介绍一下这9+N份白皮书 |最新

谷歌的两个5天课程都讲了什么,介绍一下这9+N份白皮书 |最新

谷歌的两个5天课程都讲了什么,介绍一下这9+N份白皮书 |最新

2025年末,谷歌通过Kaggle平台,以前所未有的力度,连续推出了两个为期五天的线上强化课程。这不仅仅是两次普通的线上分享,更像是一场由谷歌顶级机器学习(ML)研究员和工程师亲自引领的、深入探索生成式AI及其前沿应用——AI Agents(人工智能代理)的集训。

来自主题: AI技术研报
9203 点击    2025-11-12 10:21
ICCV 2025 Highlight | 大规模具身仿真平台UnrealZoo

ICCV 2025 Highlight | 大规模具身仿真平台UnrealZoo

ICCV 2025 Highlight | 大规模具身仿真平台UnrealZoo

你是否曾为搭建具身仿真环境耗费数周学习却效果寥寥? 是否因人工采集海量交互数据需要高昂成本而望而却步? 又是否因找不到足够丰富真实的开放场景让你的智能体难以施展拳脚?

来自主题: AI技术研报
9757 点击    2025-11-12 09:32
从VLA到RoboOmni,全模态具身新范式让机器人察言观色、听懂话外音

从VLA到RoboOmni,全模态具身新范式让机器人察言观色、听懂话外音

从VLA到RoboOmni,全模态具身新范式让机器人察言观色、听懂话外音

复旦⼤学、上海创智学院与新加坡国立⼤学联合推出全模态端到端操作⼤模型 RoboOmni,统⼀视觉、⽂本、听觉与动作模态,实现动作⽣成与语⾳交互的协同控制。开源 140K 条语⾳ - 视觉 - ⽂字「情境指令」真机操作数据,引领机器⼈从「被动执⾏⼈类指令」迈向「主动提供服务」新时代。

来自主题: AI技术研报
8426 点击    2025-11-12 09:29
MIT融合新旧视觉技术,破解救援机器人导航瓶颈,无需标定,数秒生成3D场景

MIT融合新旧视觉技术,破解救援机器人导航瓶颈,无需标定,数秒生成3D场景

MIT融合新旧视觉技术,破解救援机器人导航瓶颈,无需标定,数秒生成3D场景

在一场矿难救援中,时间意味着生命。想象一台搜救机器人在部分坍塌的矿井中穿行:浓烟、碎石、扭曲的金属梁。它必须在险象环生的环境中迅速绘制地图,识别路径,并精准定位自己的位置。

来自主题: AI技术研报
7695 点击    2025-11-12 08:51
只用 Claude Skills,打造专属 AI 伴侣|附完整教程

只用 Claude Skills,打造专属 AI 伴侣|附完整教程

只用 Claude Skills,打造专属 AI 伴侣|附完整教程

我日常最常用的 AI,不是 ChatGPT,也不是 Gemini 官网。

来自主题: AI技术研报
5696 点击    2025-11-11 17:58
如何打造AI科学家?AI Scientist综述,从模块到自治六阶段方法 |最新

如何打造AI科学家?AI Scientist综述,从模块到自治六阶段方法 |最新

如何打造AI科学家?AI Scientist综述,从模块到自治六阶段方法 |最新

本文基于研究者的系统性综述,围绕“AI Scientist(AI科学家)”这一新的概念展开,核心线索是研究者的六阶段方法论与三阶段演进轨迹;您如果正搭建一个可验证、可协作、可扩展的研究自动化体系,这篇综述更像一张总路线图而非空洞口号,有不少思路可以借鉴。

来自主题: AI技术研报
9036 点击    2025-11-11 11:22
Cursor 首度揭秘:"训练即产品",用强化学习让 AI 编程快 4 倍的秘密武器

Cursor 首度揭秘:"训练即产品",用强化学习让 AI 编程快 4 倍的秘密武器

Cursor 首度揭秘:"训练即产品",用强化学习让 AI 编程快 4 倍的秘密武器

Sasha Rush 在分享开头就提到,Cursor Composer 在他们的内部 benchmark 上的表现几乎与最好的 Frontier 模型(前沿模型)持平,并且优于去年夏天发布的所有模型。它的表现明显好于最好的开源模型,以及那些被标榜为"快速"的模型。

来自主题: AI技术研报
7774 点击    2025-11-11 11:12
美国知名对冲基金拆解400年“泡沫史”的最终判断:AI离“泡沫”还远

美国知名对冲基金拆解400年“泡沫史”的最终判断:AI离“泡沫”还远

美国知名对冲基金拆解400年“泡沫史”的最终判断:AI离“泡沫”还远

面对“AI是否陷入泡沫”的热议,美国知名对冲基金Coatue深度研究了过去400年间30余次典型泡沫案例,从中提炼出共性特征,并据此发布了年度AI重磅报告。Coatue将这一框架应用于当前AI领域,得出的结论是:AI正处于早期“替代/普及”阶段,远未到达泡沫顶点。

来自主题: AI技术研报
7571 点击    2025-11-11 10:58
谢赛宁×李飞飞×LeCun首次联手!寒武纪-S「空间超感知」AI震撼登场

谢赛宁×李飞飞×LeCun首次联手!寒武纪-S「空间超感知」AI震撼登场

谢赛宁×李飞飞×LeCun首次联手!寒武纪-S「空间超感知」AI震撼登场

当AI不再对着文字死记硬背,而是学会在视频里对人类世界进行超感知,这套全新范式会不会撬开AGI的大门?

来自主题: AI技术研报
8211 点击    2025-11-11 10:26
3A大作!阿里ROLL团队从基建->算法->机理,推动RL4LLM全栈协同优化

3A大作!阿里ROLL团队从基建->算法->机理,推动RL4LLM全栈协同优化

3A大作!阿里ROLL团队从基建->算法->机理,推动RL4LLM全栈协同优化

近期,阿里巴巴 ROLL 团队(淘天未来生活实验室与阿里巴巴智能引擎团队)联合上海交通大学、香港科技大学推出「3A」协同优化框架 ——Async 架构(Asynchronous Training)、Asymmetric PPO(AsyPPO)与 Attention 机制(Attention-based Reasoning Rhythm),

来自主题: AI技术研报
7890 点击    2025-11-11 10:24
AI同时学会了人类的智慧和无脑

AI同时学会了人类的智慧和无脑

AI同时学会了人类的智慧和无脑

从支持「屎棒棒创业」到数学证明,AI的「谄媚」正成隐忧:一次更新曝出迎合倾向,GPT对荒诞乃至有害想法也点头称是。斯坦福、CMU研究证实模型更爱迎合,令用户更固执、更少反思却更信任AI;数学基准亦见模型为伪命题硬编证明。

来自主题: AI技术研报
6165 点击    2025-11-11 09:51
PixelRefer :让AI从“看大图”走向“看懂每个对象”

PixelRefer :让AI从“看大图”走向“看懂每个对象”

PixelRefer :让AI从“看大图”走向“看懂每个对象”

多模态大模型(MLLMs)虽然在图像理解、视频分析上表现出色,但多停留在整体场景级理解。

来自主题: AI技术研报
10072 点击    2025-11-11 09:50
万字洞察丨100 家顶尖 AI 初创公司的 7 个真相

万字洞察丨100 家顶尖 AI 初创公司的 7 个真相

万字洞察丨100 家顶尖 AI 初创公司的 7 个真相

Leonis Capital 在全球超过 10,000 家 AI 初创公司中,基于融资、招聘、用户使用情况,GitHub 趋势、新闻、ProductHunt、ARR 预估等数据和信号,筛选出了 100 家增长最快的初创公司。他们对这 100 家 AI 初创公司进行了详细分析,制作了一份 The Leonis AI 100 的研究报告。

来自主题: AI技术研报
10112 点击    2025-11-10 15:13
与DeepSeek-OCR不谋而合,NeurIPS论文提出让LLM像人一样读长文本

与DeepSeek-OCR不谋而合,NeurIPS论文提出让LLM像人一样读长文本

与DeepSeek-OCR不谋而合,NeurIPS论文提出让LLM像人一样读长文本

在处理短文本时,大语言模型(LLM)已经表现出惊人的理解和生成能力。但现实世界中的许多任务 —— 如长文档理解、复杂问答、检索增强生成(RAG)等 —— 都需要模型处理成千上万甚至几十万长度的上下文。

来自主题: AI技术研报
5776 点击    2025-11-10 15:12
首个AI商业广告工作流开源,我做出了可口可乐最有创意的广告

首个AI商业广告工作流开源,我做出了可口可乐最有创意的广告

首个AI商业广告工作流开源,我做出了可口可乐最有创意的广告

可乐可乐是真头铁, 24年用AI做广告挨骂,25年继续用继续挨骂,主要是创意很偷懒,两年了还给我看同一条广告。

来自主题: AI技术研报
7367 点击    2025-11-10 15:10
AAAI 2026结果公布,刷出88887高分!2.3万投稿录用率仅17.6%

AAAI 2026结果公布,刷出88887高分!2.3万投稿录用率仅17.6%

AAAI 2026结果公布,刷出88887高分!2.3万投稿录用率仅17.6%

AAAI 2026录用结果重磅公布!这一届,投稿量暴增至23,680篇,录用率仅17.6%,竞争程度远超往年。一些成功上岸的研究员们晒出了录用成绩单,有人甚至拿下了88887高分。

来自主题: AI技术研报
6545 点击    2025-11-10 14:33