AI资讯新闻榜单内容搜索-研究

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 研究
Claude Code 上线 Routines:化身24小时打工人,关机照样云端修Bug提PR

Claude Code 上线 Routines:化身24小时打工人,关机照样云端修Bug提PR

Claude Code 上线 Routines:化身24小时打工人,关机照样云端修Bug提PR

Anthropic正式推出了Claude Code的自动化任务功能Routines,目前处于研究预览阶段。只要配置好一次提示词、代码仓库和连接器,Claude就能在云端全自动干活了。这些任务全部运行在Anthropic的云端基础设施上,意味着完全不需要你一直开着电脑,哪怕你下班关机,它也能按时帮你处理代码积压、审查代码,甚至随时响应云端事件。

来自主题: AI技术研报
8750 点击    2026-04-15 14:56
清华2年前预言,正成为全球共识!Meta等三大AI机构已得出同一结论

清华2年前预言,正成为全球共识!Meta等三大AI机构已得出同一结论

清华2年前预言,正成为全球共识!Meta等三大AI机构已得出同一结论

太疯狂了!Meta和METR刚测出的AI进化数据,与中国团队两年前提出的「密度定律」完美重合。硅谷猛然回头,发现中国研究者在这条路上已领先两年!

来自主题: AI技术研报
8201 点击    2026-04-14 09:11
分享一个我用了2年的深度研究Prompt,半小时帮你搞懂任何陌生领域。

分享一个我用了2年的深度研究Prompt,半小时帮你搞懂任何陌生领域。

分享一个我用了2年的深度研究Prompt,半小时帮你搞懂任何陌生领域。

前两天办完大会,然后昨天周末跟一个朋友吃饭,聊着聊着他突然放下筷子看着我说了一句,不是哥们,你怎么什么都懂一点?

来自主题: AI技术研报
9660 点击    2026-04-13 14:31
迎接范式革命:最新、最全的大模型Latent Space综述,NUS、复旦、清华等联合出品

迎接范式革命:最新、最全的大模型Latent Space综述,NUS、复旦、清华等联合出品

迎接范式革命:最新、最全的大模型Latent Space综述,NUS、复旦、清华等联合出品

从 2024 年底的关于潜在空间的早期探索,再到 2025 年底和 2026 年初的相关研究爆发,潜空间范式正在彻底重塑大模型 (LLMs, VLMs, VLAs 等延伸模型) 的底层设计逻辑。

来自主题: AI技术研报
7068 点击    2026-04-13 14:31
同一个模型,换个Harness排名跳了25位:智能体基础设施完全解剖

同一个模型,换个Harness排名跳了25位:智能体基础设施完全解剖

同一个模型,换个Harness排名跳了25位:智能体基础设施完全解剖

LangChain 只换了模型外面的基础设施——同一个模型、同一套权重——就从 TerminalBench 2.0 排行榜 30 名开外直接跳到了第 5 名。另一个独立研究项目让大模型自己优化这层基础设施,达到了 76.4% 的通过率,超过了所有人工设计的方案。

来自主题: AI技术研报
6555 点击    2026-04-13 10:13
小模型用不好Skill?新范式SKILL0让模型学会Skill的底层逻辑,3B模型推理token省5倍

小模型用不好Skill?新范式SKILL0让模型学会Skill的底层逻辑,3B模型推理token省5倍

小模型用不好Skill?新范式SKILL0让模型学会Skill的底层逻辑,3B模型推理token省5倍

浙江大学联合美团龙猫团队、清华大学推出全新研究成果——SKILL0,并提出技能内化(Skill Internalization)——小模型真正需要的,或许不是推理时的“外挂技能”,而是将技能内化为本能。

来自主题: AI技术研报
8095 点击    2026-04-12 11:56
循环即实验室:八个AI自主研究系统横评

循环即实验室:八个AI自主研究系统横评

循环即实验室:八个AI自主研究系统横评

今天 Interesting Engineering++ 发了一篇长文,把这些系统放在同一个分析框架里做了横评,回答的就是这些问题。原文地址:interestingengineering.substack.com/p/the-loop-is-the-lab

来自主题: AI技术研报
9540 点击    2026-04-11 14:22
Claude Mythos其实没那么神?AI发现bug其实早已是寻常

Claude Mythos其实没那么神?AI发现bug其实早已是寻常

Claude Mythos其实没那么神?AI发现bug其实早已是寻常

昨天,VIDOC Security Lab 的一篇博客介绍了他们的发现:Claude Mythos 的实力可能被高估了;或者说,之前已有模型达到了同等的能力。正如研究者 Dawid Moczadło 说的那样:「这并非一种新能力。」

来自主题: AI资讯
9063 点击    2026-04-11 14:18