AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
浏览器秒变手机!中科院开源Agent训练场,微信、原神都能跑

浏览器秒变手机!中科院开源Agent训练场,微信、原神都能跑

浏览器秒变手机!中科院开源Agent训练场,微信、原神都能跑

中科院自动化所模式识别实验室开源MobileGym,运行在浏览器里的高并发安卓仿真平台,完全自定义,告别模拟器风控与真机成本,一个平台搞定Mobile Agent训练与评测,甚至还能玩原神!

来自主题: AI技术研报
5304 点击    2026-06-02 16:17
聊一聊 Agent 的存算分离架构设计

聊一聊 Agent 的存算分离架构设计

聊一聊 Agent 的存算分离架构设计

一个有灵魂,有记忆的 Agent,一次任务的生命周期包括以下步骤

来自主题: AI技术研报
9985 点击    2026-06-02 15:23
DataMaster:当AI开始成为自己的数据工程师

DataMaster:当AI开始成为自己的数据工程师

DataMaster:当AI开始成为自己的数据工程师

过去,AI 研发基本是一条由人主导的流水线。

来自主题: AI技术研报
8457 点击    2026-06-02 15:05
图灵奖得主Sutton新作:AI的下一步,是走向「生成认知」

图灵奖得主Sutton新作:AI的下一步,是走向「生成认知」

图灵奖得主Sutton新作:AI的下一步,是走向「生成认知」

从 LLM 的超长文本处理、视频生成模型的以假乱真、Agent 自主规划与执行的日趋成熟,到 VLA、世界模型等开始进入物理世界,AI 正在不断拓宽其能力边界。

来自主题: AI技术研报
6259 点击    2026-06-02 15:05
Mind Lab连续发布LoRA最新进展,大模型「持续学习」新范式浮现

Mind Lab连续发布LoRA最新进展,大模型「持续学习」新范式浮现

Mind Lab连续发布LoRA最新进展,大模型「持续学习」新范式浮现

最近,前沿实验室 Mind Lab 密集发布了一系列关于 LoRA 与 PEFT(高效微调)的研究结果,似乎描绘出了另一条大模型「持续学习」的路径。在 Mind Lab 的视角中,PEFT 不再是对大模型全参数后训练的一种廉价平替,更是实现从 “基础模型” 向 “可持续学习智能体” 过渡的核心架构机制。

来自主题: AI技术研报
8095 点击    2026-06-02 12:25
机器人运控训练步入分钟级时代!清华AIR开源UniLab:3分钟训好人形,速度暴涨10倍,Mac上也能跑

机器人运控训练步入分钟级时代!清华AIR开源UniLab:3分钟训好人形,速度暴涨10倍,Mac上也能跑

机器人运控训练步入分钟级时代!清华AIR开源UniLab:3分钟训好人形,速度暴涨10倍,Mac上也能跑

在具身智能训练中,“把计算全部塞进GPU”似乎成了唯一的提速密码,机器人运控并行训练的框架,IsaacLab、MuJoCoPlayground、mjlab都默认遵循这一范式,这些系统都牢牢绑定在NVIDIA生态中。

来自主题: AI技术研报
8064 点击    2026-06-02 11:59
牛津、英伟达等提出记忆压缩新范式:训练时让模型学会断舍离

牛津、英伟达等提出记忆压缩新范式:训练时让模型学会断舍离

牛津、英伟达等提出记忆压缩新范式:训练时让模型学会断舍离

2026 年初,各大 AI 厂商在上下文窗口长度上展开激烈角逐。Google 的 Gemini 3 Pro 已支持 100 万级 token 上下文,Meta 的 Llama 4 Scout 更宣称可处理 1000 万 token。GPT-5 系列也在快速推进长上下文能力。

来自主题: AI技术研报
9782 点击    2026-06-02 11:23
7000字长文解读AI大模型智能旅游规划项目方案(AI产品经理必看)

7000字长文解读AI大模型智能旅游规划项目方案(AI产品经理必看)

7000字长文解读AI大模型智能旅游规划项目方案(AI产品经理必看)

上一篇文章,和大家聊了一下这个项目,做了一个整体性的复盘,但主要是以业务和团队等方面说的,但是实现方案和大模型相关评估上,说的不多,这篇文章,我们就在产品实现方案和大模型这块来聊一下。

来自主题: AI技术研报
9006 点击    2026-06-02 11:23
GUI Agent「记与学」双修,长程任务有了专属记忆增强型自进化框架

GUI Agent「记与学」双修,长程任务有了专属记忆增强型自进化框架

GUI Agent「记与学」双修,长程任务有了专属记忆增强型自进化框架

本文团队长期从事负责任的人工智能与人工智能赋能社会科学相关研究,围绕视觉生成大模型安全治理、智能体安全等方向开展系统性工作,相关成果发表于AAAI、ICML、TMM 等国际期刊与会议。

来自主题: AI技术研报
7212 点击    2026-06-02 11:23
材料版AlphaFold来了!40个工业任务全方位SOTA,AI4S迎来行业大突破

材料版AlphaFold来了!40个工业任务全方位SOTA,AI4S迎来行业大突破

材料版AlphaFold来了!40个工业任务全方位SOTA,AI4S迎来行业大突破

AI模型在电脑上预测精度爆表,一到实验室就各种出错用不了?

来自主题: AI技术研报
7230 点击    2026-06-01 14:58
陆子恒:我们用AI穷举了20万种材料,知道了一个价值10亿的问题 | AI for Science沙龙

陆子恒:我们用AI穷举了20万种材料,知道了一个价值10亿的问题 | AI for Science沙龙

陆子恒:我们用AI穷举了20万种材料,知道了一个价值10亿的问题 | AI for Science沙龙

材料研发的“试错时代”,正在被AI加速改变。5月21日,未来光锥「AI for Science 创变者说」第二期沙龙“AI+材料的千亿级机会”,邀请了三位学界与产业一线嘉宾,共同探讨AI+材料科学的前沿与实践。

来自主题: AI技术研报
9249 点击    2026-06-01 14:58
罗福莉划重点,小米大模型降价99%的秘籍公开

罗福莉划重点,小米大模型降价99%的秘籍公开

罗福莉划重点,小米大模型降价99%的秘籍公开

紧跟DeepSeek价格战,小米掏出技术底牌!

来自主题: AI技术研报
6578 点击    2026-06-01 13:58
别硬卷Prompt了,这才是普通人拥抱AI视频的最短途径!

别硬卷Prompt了,这才是普通人拥抱AI视频的最短途径!

别硬卷Prompt了,这才是普通人拥抱AI视频的最短途径!

大家最近应该都被云南大神MX-Shell花3000制作的《丧尸清道夫》刷屏了吧。他做的这个抖音400多万点赞的AI视频,真的非常牛逼。

来自主题: AI技术研报
7050 点击    2026-06-01 13:56
OpenAI 刚开源了一个 1.5B 参数的隐私过滤模型,却只用 50M 活跃参数就能精准标记姓名、电话、密码这些敏感信息。

OpenAI 刚开源了一个 1.5B 参数的隐私过滤模型,却只用 50M 活跃参数就能精准标记姓名、电话、密码这些敏感信息。

OpenAI 刚开源了一个 1.5B 参数的隐私过滤模型,却只用 50M 活跃参数就能精准标记姓名、电话、密码这些敏感信息。

你有没有过这样的经历:把聊天记录、用户反馈或内部文档丢给大模型时,总担心里面夹杂着真实姓名、手机号、邮箱甚至 API key,最后只能手动一条条删?或者团队在处理海量数据时,规则写的正则永远漏掉那些“藏在句子里的隐私”。

来自主题: AI技术研报
8970 点击    2026-06-01 10:29
到底是谁会相信RAG已死啊?

到底是谁会相信RAG已死啊?

到底是谁会相信RAG已死啊?

最近一两年,互联网上各种为RAG赛博哭坟的帖子不胜枚举。

来自主题: AI技术研报
9625 点击    2026-06-01 09:27
ICML 2026 | 清华姚权铭团队提出LMNet,让语言模型学会自己「组网」

ICML 2026 | 清华姚权铭团队提出LMNet,让语言模型学会自己「组网」

ICML 2026 | 清华姚权铭团队提出LMNet,让语言模型学会自己「组网」

大语言模型正在成为人工智能系统的核心组件。从文本生成、数学推理到代码编写,单个大模型已经展现出强大的能力。

来自主题: AI技术研报
7715 点击    2026-06-01 09:26
Rubrics综述:Agent时代,如何定义一个「好答案」?

Rubrics综述:Agent时代,如何定义一个「好答案」?

Rubrics综述:Agent时代,如何定义一个「好答案」?

近年来,随着大模型从简单问答,走向深度研究、医疗咨询、多模态生成和长程 Agent 任务,一个基础问题变得越来越难回答:我们到底应该怎样判断模型输出的质量?

来自主题: AI技术研报
8377 点击    2026-06-01 09:24
τ0-WM:最大规模预训练的开源具身世界模型来了

τ0-WM:最大规模预训练的开源具身世界模型来了

τ0-WM:最大规模预训练的开源具身世界模型来了

刚刚,上海创智学院副教授、智元机器人首席科学家罗剑岚带队,发布全球最大规模的开源预训练具身世界模型——τ0-World Model(τ0-WM)。整个τ0-WM参数量达到5B,预训练数据规模高达约3万小时。其中,真机遥操作数据第一次成了绝对主力,占到了1.78万小时。

来自主题: AI技术研报
9184 点击    2026-05-31 19:39
打破Agent训练瓶颈!人大&至知研究院开源Claw Agent数据+训练+评测全链条

打破Agent训练瓶颈!人大&至知研究院开源Claw Agent数据+训练+评测全链条

打破Agent训练瓶颈!人大&至知研究院开源Claw Agent数据+训练+评测全链条

大模型从“回答问题”走向“完成任务”,正在面临以下瓶颈:面向Claw Agents的数据、训练和评测都比传统environment training更难。为了解决该问题,中国人民大学、至知研究院等最新提出ClawGym——

来自主题: AI技术研报
6381 点击    2026-05-31 11:42
AI权威清洗: 一张肉眼难辨的图片,就能让GPT-5.4、Claude Opus 4.6集体造谣

AI权威清洗: 一张肉眼难辨的图片,就能让GPT-5.4、Claude Opus 4.6集体造谣

AI权威清洗: 一张肉眼难辨的图片,就能让GPT-5.4、Claude Opus 4.6集体造谣

来自 ETH Zurich 的 Florian Tramèr 团队在最新论文中抛出了一个出乎意料的问题:如果 AI"看到" 的图,根本不是你肉眼看到的那张,会发生什么样的后果呢?他们把这种现象称作 AI 权威清洗(AI Authority Laundering)。

来自主题: AI技术研报
8850 点击    2026-05-31 11:27
终于,清华快手养出了通人性的AI!

终于,清华快手养出了通人性的AI!

终于,清华快手养出了通人性的AI!

清华大学经济管理学院的陈柯均博士生、张佳音教授、徐心教授与快手消费策略算法部合作探索完成了一项联合实验:从视频传递的价值观的角度,去理解观看视频后用户的行为和心理变化。

来自主题: AI技术研报
8163 点击    2026-05-31 11:15
DeepSeek陈德里AI论文第二弹:从6分到8分,DeliAutoResearch SKILL又进化了

DeepSeek陈德里AI论文第二弹:从6分到8分,DeliAutoResearch SKILL又进化了

DeepSeek陈德里AI论文第二弹:从6分到8分,DeliAutoResearch SKILL又进化了

DeepSeek 研究员陈德里(Deli Chen)和 AI 合作的第二篇论文来了!论文地址:https://victorchen96.github.io/continual_learning_survey.pdf这篇论文聚焦 continual learning(持续学习) 与 self-iteration(自我迭代)。在陈德里看来,这是 AI 迈向 AGI 过程中极为关键的一步。

来自主题: AI技术研报
9840 点击    2026-05-30 22:40
9.5万大学生和37万高中生的使用数据,暴露了AI 时代真正的分水岭

9.5万大学生和37万高中生的使用数据,暴露了AI 时代真正的分水岭

9.5万大学生和37万高中生的使用数据,暴露了AI 时代真正的分水岭

2026年5月,两篇重磅研究在一周内相继发表。一组来自加州大学伯克利分校研究团队,样本是美国 20 所公立研究型大学的 95,513 名本科生。研究发表在《Science》科学杂志上,主题是大学生如何使用生成式 AI,以及怎样用它作弊。

来自主题: AI技术研报
9021 点击    2026-05-30 22:40
李飞飞造了ImageNet,现在她又带人超越了它

李飞飞造了ImageNet,现在她又带人超越了它

李飞飞造了ImageNet,现在她又带人超越了它

就在前两天,斯坦福大学等机构发布了一个名为 GPIC(Giant Permissive Image Corpus,巨型开放图像语料库)的数据集。

来自主题: AI技术研报
8703 点击    2026-05-30 15:57
登顶HuggingFace日榜!英伟达清华团队γ-World:把世界模型从单机打到联机

登顶HuggingFace日榜!英伟达清华团队γ-World:把世界模型从单机打到联机

登顶HuggingFace日榜!英伟达清华团队γ-World:把世界模型从单机打到联机

5 月下旬,NVIDIA 联合清华大学、多伦多大学和 Vector Institute 发布 Gamma-World,共一第一为清华大学电子系博士刘芳甫,核心 Research 方向是世界模型和空间智能。

来自主题: AI技术研报
8944 点击    2026-05-30 11:26