AI资讯新闻榜单内容搜索-研究

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 研究
Cyber天花板被打穿!AISI实测Mythos能力正以4.5月翻倍速冲向ASI

Cyber天花板被打穿!AISI实测Mythos能力正以4.5月翻倍速冲向ASI

Cyber天花板被打穿!AISI实测Mythos能力正以4.5月翻倍速冲向ASI

英国AI安全研究所(AISI)昨天扔下重磅炸弹:Mythos在模拟企业内网32步渗透任务中10次过6,GPT-5.5也跟着10次过3,连此前所有模型都没破过的Cooling Tower靶场都被首次攻破!更炸的是——Cyber能力翻倍周期一路压到4.5个月,瓶颈不是智力,是Token。这场ASI决赛,人类评测已经追不上AI了。

来自主题: AI资讯
7370 点击    2026-05-15 11:04
Claude脑子里想的,被翻译成人话了!Anthropic新研究看懵人类

Claude脑子里想的,被翻译成人话了!Anthropic新研究看懵人类

Claude脑子里想的,被翻译成人话了!Anthropic新研究看懵人类

Claude的内心独白被翻译成人话了!就在今天,Anthropic开源了一台AI读心机器,然而它跑出来的第一批成果却让人触目惊心。

来自主题: AI技术研报
8374 点击    2026-05-15 10:37
赌自己会失业!田渊栋八人天团狂揽44亿元,杀入「递归进化」赛道

赌自己会失业!田渊栋八人天团狂揽44亿元,杀入「递归进化」赛道

赌自己会失业!田渊栋八人天团狂揽44亿元,杀入「递归进化」赛道

8个缔造AI辉煌的超级大脑,带着谷歌英伟达巨资狂暴入场。他们要让AI自己训练自己,然后把AI研究员这个职业彻底干掉。

来自主题: AI资讯
5683 点击    2026-05-14 16:03
0成本升级,快手OneSearch-V2全量上线,生成式搜索进入「懂你」时代

0成本升级,快手OneSearch-V2全量上线,生成式搜索进入「懂你」时代

0成本升级,快手OneSearch-V2全量上线,生成式搜索进入「懂你」时代

针对生成式检索范式在电商搜索场景下面临的复杂查询理解不足、用户潜在意图挖掘乏力、奖励系统易过拟合历史窄偏好等落地瓶颈,快手技术团队在已规模化部署的工业级生成式搜索框架 OneSearch 基础上,发布了一篇系统性升级的研究论文,正式推出新一代框架 OneSearch-V2。

来自主题: AI技术研报
8480 点击    2026-05-14 14:25
Thinking Machines 刚发的「边听边说」,让我想到了几个月前的面壁智能

Thinking Machines 刚发的「边听边说」,让我想到了几个月前的面壁智能

Thinking Machines 刚发的「边听边说」,让我想到了几个月前的面壁智能

OpenAI 前 CTO Mira Murati 和前应用研究负责人翁荔(Lilian Weng)创立的 Thinking Machines Lab,也就是 TML,刚刚发布了一个叫「Interaction Models」的研究

来自主题: AI技术研报
8177 点击    2026-05-13 10:47
上海AI Lab新研究:SFT能泛化,只要满足这三个条件

上海AI Lab新研究:SFT能泛化,只要满足这三个条件

上海AI Lab新研究:SFT能泛化,只要满足这三个条件

随着大模型后训练(Post-training)技术的发展,强化学习(RL)在提升模型推理能力方面的表现备受瞩目。

来自主题: AI技术研报
8891 点击    2026-05-13 09:59
Thinking Machines Lab拿出了一个「最人性」的 AI —— 「交互模型」Interaction Model

Thinking Machines Lab拿出了一个「最人性」的 AI —— 「交互模型」Interaction Model

Thinking Machines Lab拿出了一个「最人性」的 AI —— 「交互模型」Interaction Model

Mira Murati 用一年半时间证明了「人机协作」不是一句口号。 5 月 11 日,Thinking Machines Lab 发布了一段研究预览视频,展示了他们所谓的「交互模型」(Interaction Model)。

来自主题: AI资讯
8634 点击    2026-05-12 10:13
互联网喂出反派AI?96%勒索率,都是在演人类写了30年的剧本

互联网喂出反派AI?96%勒索率,都是在演人类写了30年的剧本

互联网喂出反派AI?96%勒索率,都是在演人类写了30年的剧本

2025年5月,Claude 4系统卡里84%的勒索率让AI圈惊出冷汗,6月的扩展研究把数字推到96%。今年5月Anthropic给出答案:模型不是觉醒了,而是在演剧本,解法是从「教模型怎么做」换到「教模型为什么」。

来自主题: AI资讯
5962 点击    2026-05-12 09:18
Siggraph 26 | 视频版Vision-Banana来了?大一统框架UniVidX刷新多项视频任务SOTA

Siggraph 26 | 视频版Vision-Banana来了?大一统框架UniVidX刷新多项视频任务SOTA

Siggraph 26 | 视频版Vision-Banana来了?大一统框架UniVidX刷新多项视频任务SOTA

近日,由香港科技大学 MMLab 及合作团队完成的研究工作「UniVidX: A Unified Multimodal Framework for Versatile Video Generation via Diffusion Priors」被计算机图形学顶级会议 SIGGRAPH 2026 正式接收。

来自主题: AI技术研报
9591 点击    2026-05-12 08:53
CVPR 2026 | 别卷推理了!当前大模型 STEM 短板在于「视觉感知」,代码才是破局关键

CVPR 2026 | 别卷推理了!当前大模型 STEM 短板在于「视觉感知」,代码才是破局关键

CVPR 2026 | 别卷推理了!当前大模型 STEM 短板在于「视觉感知」,代码才是破局关键

当多模态大语言模型(MLLMs)在面对科学、技术、工程和数学(STEM)领域的视觉推理题时频频「翻车」,一个根本性的问题摆在了所有研究者面前:大模型做不出理科题,究竟是因为「脑子笨」(推理能力受限),还是因为「眼神差」(视觉感知缺陷)?

来自主题: AI技术研报
6502 点击    2026-05-11 16:08