AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一句话,我用豆包 AI 做出《红楼梦》互动游戏

一句话,我用豆包 AI 做出《红楼梦》互动游戏

一句话,我用豆包 AI 做出《红楼梦》互动游戏

“一位老师,用 AI 做了个《林黛玉初进贾府》的互动游戏。”

来自主题: AI技术研报
10451 点击    2025-11-13 15:21
让AI精准操作网页:CAMEL Hybrid Browser Toolkit深度解析

让AI精准操作网页:CAMEL Hybrid Browser Toolkit深度解析

让AI精准操作网页:CAMEL Hybrid Browser Toolkit深度解析

本文档分析 CAMEL 项目中 hybrid_browser_toolkit 的技术实现,覆盖其架构设计、核心功能与通信协议。

来自主题: AI技术研报
10375 点击    2025-11-13 15:20
跨层压缩隐藏状态同时加速TTFT和压缩KV cache!

跨层压缩隐藏状态同时加速TTFT和压缩KV cache!

跨层压缩隐藏状态同时加速TTFT和压缩KV cache!

我们都知道 LLM 中存在结构化稀疏性,但其底层机制一直缺乏统一的理论解释。为什么模型越深,稀疏性越明显?为什么会出现所谓的「检索头」和「检索层」?

来自主题: AI技术研报
9328 点击    2025-11-13 15:19
GRPO训练不再「自嗨」!快手可灵 x 中山大学推出「GRPO卫兵」,显著缓解视觉生成过优化

GRPO训练不再「自嗨」!快手可灵 x 中山大学推出「GRPO卫兵」,显著缓解视觉生成过优化

GRPO训练不再「自嗨」!快手可灵 x 中山大学推出「GRPO卫兵」,显著缓解视觉生成过优化

目前,GRPO 在图像和视频生成的流模型中取得了显著提升(如 FlowGRPO 和 DanceGRPO),已被证明在后训练阶段能够有效提升视觉生成式流模型的人类偏好对齐、文本渲染与指令遵循能力。

来自主题: AI技术研报
7852 点击    2025-11-13 14:52
AI虚拟细胞诞生!科学家成功预测药物作用、细胞命运和器官发育

AI虚拟细胞诞生!科学家成功预测药物作用、细胞命运和器官发育

AI虚拟细胞诞生!科学家成功预测药物作用、细胞命运和器官发育

科学家用 AI 预测细胞未来的命运照进了现实——在虚拟世界中重塑生命系统,这对药物发现、早期筛选和疾病预防至关重要。

来自主题: AI技术研报
6296 点击    2025-11-13 09:39
清华团队:1.5B 模型新基线!用「最笨」的 RL 配方达到顶尖性能

清华团队:1.5B 模型新基线!用「最笨」的 RL 配方达到顶尖性能

清华团队:1.5B 模型新基线!用「最笨」的 RL 配方达到顶尖性能

如果有人告诉你:不用分阶段做强化学习、不搞课程学习、不动态调参,只用最基础的 RL 配方就能达到小模型数学推理能力 SOTA,你信吗?

来自主题: AI技术研报
6235 点击    2025-11-13 09:37
NeurIPS 25开新坑:145万个图文对,覆盖八种主流水下理解任务

NeurIPS 25开新坑:145万个图文对,覆盖八种主流水下理解任务

NeurIPS 25开新坑:145万个图文对,覆盖八种主流水下理解任务

华中科技大学团队推出首个水下多模态大模型NAUTILUS,支持8种水下场景理解任务,并开源145万图文对的NautData数据集。模型通过视觉特征增强模块解决水下图像模糊和颜色失真问题,性能超越现有模型,恶劣环境下表现更佳。

来自主题: AI技术研报
10470 点击    2025-11-12 17:16
阿里发了个简历AI神器,大小仅0.6B

阿里发了个简历AI神器,大小仅0.6B

阿里发了个简历AI神器,大小仅0.6B

复杂的简历,AI也能读懂了。

来自主题: AI技术研报
9412 点击    2025-11-12 17:15
全球第二、国内第一!钉钉发布DeepResearch多智能体框架,已在真实企业部署

全球第二、国内第一!钉钉发布DeepResearch多智能体框架,已在真实企业部署

全球第二、国内第一!钉钉发布DeepResearch多智能体框架,已在真实企业部署

在数字经济浪潮中,企业对于高效、精准的信息获取与决策支持的需求日益迫切。从前沿科学探索到行业趋势分析,再到企业级决策支持,一个能够从海量异构数据源中提取关键知识、执行多步骤推理并生成结构化或多模态输出的「深度研究系统」正变得不可或缺。

来自主题: AI技术研报
7116 点击    2025-11-12 17:05
Nature子刊:太空中建数据中心,无限能源,浙大首次证实可行!

Nature子刊:太空中建数据中心,无限能源,浙大首次证实可行!

Nature子刊:太空中建数据中心,无限能源,浙大首次证实可行!

浙江大学和新加坡南洋理工大学新研究旨在探索空间碳中和数据中心的可行性。太空环境具备两大独特优势:丰富的太阳能可为计算设备提供清洁稳定的电力;接近绝对零度的深空环境则为服务器废热提供了理想的散热条件。

来自主题: AI技术研报
9571 点击    2025-11-12 15:16
《麦肯锡2025 AI报告》|附下载

《麦肯锡2025 AI报告》|附下载

《麦肯锡2025 AI报告》|附下载

麦肯锡刚刚发布了2025年AI最新报告,一组数据让人“破防”:88%的组织都在用AI,但只有39%的组织吃出了“真金白银”。这份《The state of AI in 2025》回答了AI时代大家都很关心的一个问题:

来自主题: AI技术研报
7976 点击    2025-11-12 11:22
6666!NeurIPS满分论文来了

6666!NeurIPS满分论文来了

6666!NeurIPS满分论文来了

四个审稿人全给6分,NeurIPS唯一满分论文炸了!

来自主题: AI技术研报
10417 点击    2025-11-12 10:53
打破显存墙:谢赛宁团队提出CLM,单卡RTX 4090「撬动」1亿高斯点

打破显存墙:谢赛宁团队提出CLM,单卡RTX 4090「撬动」1亿高斯点

打破显存墙:谢赛宁团队提出CLM,单卡RTX 4090「撬动」1亿高斯点

3D Gaussian Splatting (3DGS) 是一种日益流行的新视角合成方法,给定 3D 场景的一组带位姿的图像(即带有位置和方向的图像),3DGS 会迭代训练一个场景表示,该表示由大量各向异性 3D 高斯体组成,用以捕捉场景的外观和几何形状。

来自主题: AI技术研报
10521 点击    2025-11-12 10:51
英伟达铁幕之后,谷歌AI芯片已成气候

英伟达铁幕之后,谷歌AI芯片已成气候

英伟达铁幕之后,谷歌AI芯片已成气候

英伟达在聚光灯下狂飙,谷歌却在幕后悄悄造出自己的AI基建帝国系统。当别人还在抢GPU时,它早已自给自足、闭环生长——闷声干大事,从未如此谷歌。

来自主题: AI技术研报
6661 点击    2025-11-12 10:25
上交×蚂蚁发布 DiagGym:以世界模型驱动交互式医学诊断智能体

上交×蚂蚁发布 DiagGym:以世界模型驱动交互式医学诊断智能体

上交×蚂蚁发布 DiagGym:以世界模型驱动交互式医学诊断智能体

临床诊断并非一次性的「快照」,而是一场动态交互、不断「探案」的推理过程。然而,当下的大模型大多基于静态数据训练,难以掌握真实诊疗中充满不确定性的多轮决策轨迹。如何让AI学会「追问」、选择检查,并一步步抽丝剥茧,迈向正确诊断?

来自主题: AI技术研报
8276 点击    2025-11-12 10:24
谷歌的两个5天课程都讲了什么,介绍一下这9+N份白皮书 |最新

谷歌的两个5天课程都讲了什么,介绍一下这9+N份白皮书 |最新

谷歌的两个5天课程都讲了什么,介绍一下这9+N份白皮书 |最新

2025年末,谷歌通过Kaggle平台,以前所未有的力度,连续推出了两个为期五天的线上强化课程。这不仅仅是两次普通的线上分享,更像是一场由谷歌顶级机器学习(ML)研究员和工程师亲自引领的、深入探索生成式AI及其前沿应用——AI Agents(人工智能代理)的集训。

来自主题: AI技术研报
9853 点击    2025-11-12 10:21
ICCV 2025 Highlight | 大规模具身仿真平台UnrealZoo

ICCV 2025 Highlight | 大规模具身仿真平台UnrealZoo

ICCV 2025 Highlight | 大规模具身仿真平台UnrealZoo

你是否曾为搭建具身仿真环境耗费数周学习却效果寥寥? 是否因人工采集海量交互数据需要高昂成本而望而却步? 又是否因找不到足够丰富真实的开放场景让你的智能体难以施展拳脚?

来自主题: AI技术研报
10260 点击    2025-11-12 09:32
从VLA到RoboOmni,全模态具身新范式让机器人察言观色、听懂话外音

从VLA到RoboOmni,全模态具身新范式让机器人察言观色、听懂话外音

从VLA到RoboOmni,全模态具身新范式让机器人察言观色、听懂话外音

复旦⼤学、上海创智学院与新加坡国立⼤学联合推出全模态端到端操作⼤模型 RoboOmni,统⼀视觉、⽂本、听觉与动作模态,实现动作⽣成与语⾳交互的协同控制。开源 140K 条语⾳ - 视觉 - ⽂字「情境指令」真机操作数据,引领机器⼈从「被动执⾏⼈类指令」迈向「主动提供服务」新时代。

来自主题: AI技术研报
8905 点击    2025-11-12 09:29
MIT融合新旧视觉技术,破解救援机器人导航瓶颈,无需标定,数秒生成3D场景

MIT融合新旧视觉技术,破解救援机器人导航瓶颈,无需标定,数秒生成3D场景

MIT融合新旧视觉技术,破解救援机器人导航瓶颈,无需标定,数秒生成3D场景

在一场矿难救援中,时间意味着生命。想象一台搜救机器人在部分坍塌的矿井中穿行:浓烟、碎石、扭曲的金属梁。它必须在险象环生的环境中迅速绘制地图,识别路径,并精准定位自己的位置。

来自主题: AI技术研报
8145 点击    2025-11-12 08:51
只用 Claude Skills,打造专属 AI 伴侣|附完整教程

只用 Claude Skills,打造专属 AI 伴侣|附完整教程

只用 Claude Skills,打造专属 AI 伴侣|附完整教程

我日常最常用的 AI,不是 ChatGPT,也不是 Gemini 官网。

来自主题: AI技术研报
6360 点击    2025-11-11 17:58
如何打造AI科学家?AI Scientist综述,从模块到自治六阶段方法 |最新

如何打造AI科学家?AI Scientist综述,从模块到自治六阶段方法 |最新

如何打造AI科学家?AI Scientist综述,从模块到自治六阶段方法 |最新

本文基于研究者的系统性综述,围绕“AI Scientist(AI科学家)”这一新的概念展开,核心线索是研究者的六阶段方法论与三阶段演进轨迹;您如果正搭建一个可验证、可协作、可扩展的研究自动化体系,这篇综述更像一张总路线图而非空洞口号,有不少思路可以借鉴。

来自主题: AI技术研报
9498 点击    2025-11-11 11:22
Cursor 首度揭秘:"训练即产品",用强化学习让 AI 编程快 4 倍的秘密武器

Cursor 首度揭秘:"训练即产品",用强化学习让 AI 编程快 4 倍的秘密武器

Cursor 首度揭秘:"训练即产品",用强化学习让 AI 编程快 4 倍的秘密武器

Sasha Rush 在分享开头就提到,Cursor Composer 在他们的内部 benchmark 上的表现几乎与最好的 Frontier 模型(前沿模型)持平,并且优于去年夏天发布的所有模型。它的表现明显好于最好的开源模型,以及那些被标榜为"快速"的模型。

来自主题: AI技术研报
8233 点击    2025-11-11 11:12
美国知名对冲基金拆解400年“泡沫史”的最终判断:AI离“泡沫”还远

美国知名对冲基金拆解400年“泡沫史”的最终判断:AI离“泡沫”还远

美国知名对冲基金拆解400年“泡沫史”的最终判断:AI离“泡沫”还远

面对“AI是否陷入泡沫”的热议,美国知名对冲基金Coatue深度研究了过去400年间30余次典型泡沫案例,从中提炼出共性特征,并据此发布了年度AI重磅报告。Coatue将这一框架应用于当前AI领域,得出的结论是:AI正处于早期“替代/普及”阶段,远未到达泡沫顶点。

来自主题: AI技术研报
8042 点击    2025-11-11 10:58
谢赛宁×李飞飞×LeCun首次联手!寒武纪-S「空间超感知」AI震撼登场

谢赛宁×李飞飞×LeCun首次联手!寒武纪-S「空间超感知」AI震撼登场

谢赛宁×李飞飞×LeCun首次联手!寒武纪-S「空间超感知」AI震撼登场

当AI不再对着文字死记硬背,而是学会在视频里对人类世界进行超感知,这套全新范式会不会撬开AGI的大门?

来自主题: AI技术研报
8641 点击    2025-11-11 10:26
3A大作!阿里ROLL团队从基建->算法->机理,推动RL4LLM全栈协同优化

3A大作!阿里ROLL团队从基建->算法->机理,推动RL4LLM全栈协同优化

3A大作!阿里ROLL团队从基建->算法->机理,推动RL4LLM全栈协同优化

近期,阿里巴巴 ROLL 团队(淘天未来生活实验室与阿里巴巴智能引擎团队)联合上海交通大学、香港科技大学推出「3A」协同优化框架 ——Async 架构(Asynchronous Training)、Asymmetric PPO(AsyPPO)与 Attention 机制(Attention-based Reasoning Rhythm),

来自主题: AI技术研报
8300 点击    2025-11-11 10:24
AI同时学会了人类的智慧和无脑

AI同时学会了人类的智慧和无脑

AI同时学会了人类的智慧和无脑

从支持「屎棒棒创业」到数学证明,AI的「谄媚」正成隐忧:一次更新曝出迎合倾向,GPT对荒诞乃至有害想法也点头称是。斯坦福、CMU研究证实模型更爱迎合,令用户更固执、更少反思却更信任AI;数学基准亦见模型为伪命题硬编证明。

来自主题: AI技术研报
6494 点击    2025-11-11 09:51