AI资讯新闻榜单内容搜索-Agents

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Agents
ICML 2026 | Agentic强化学习训练的信息自锁问题

ICML 2026 | Agentic强化学习训练的信息自锁问题

ICML 2026 | Agentic强化学习训练的信息自锁问题

随着大语言模型逐步从「单轮问答」走向「真实环境中的持续交互」,LLM agents 正在被用于越来越复杂的 agentic applications:deep research、coding、computer use、customer service、medical inquiry、troubleshooting 等等。

来自主题: AI技术研报
5664 点击    2026-06-17 14:05
“智能体最后的考试”,Fable 5竟然不敌GPT 5.5

“智能体最后的考试”,Fable 5竟然不敌GPT 5.5

“智能体最后的考试”,Fable 5竟然不敌GPT 5.5

刚刚,UC伯克利放出了一场号称“智能体最后的考试”的全新基准测试。它把当今最强的AI Agent们拉到考场上,让它们干真正的活——在Siemens NX里建3D模型、在Unreal Engine里搭游戏场景、在Adobe After Effects里做特效合成。

来自主题: AI技术研报
8809 点击    2026-06-13 10:41
Claude把病毒起源算错90年,都是网页惹的祸?

Claude把病毒起源算错90年,都是网页惹的祸?

Claude把病毒起源算错90年,都是网页惹的祸?

顶级AI编码一日千里,到了生物学领域却频频翻车,并非模型不够聪明,而是科学数据库至今只为人类点鼠标而生。

来自主题: AI资讯
8358 点击    2026-06-10 14:45
Anthropic最新博客:生物学Agent的瓶颈不在模型,而在数据基础设施

Anthropic最新博客:生物学Agent的瓶颈不在模型,而在数据基础设施

Anthropic最新博客:生物学Agent的瓶颈不在模型,而在数据基础设施

当前,Coding Agents 在软件工程领域一路高歌猛进,科学家们看到此场景,也不禁寄予厚望:AI 智能体何时能以同样的速度,帮人类攻克药物设计、病毒监控与生物学建模的重重难关?

来自主题: AI技术研报
9781 点击    2026-06-09 14:53
Coding Agent 技术全景图:Context Engineering、Subagents 与 Harness,一年范式转移全解析

Coding Agent 技术全景图:Context Engineering、Subagents 与 Harness,一年范式转移全解析

Coding Agent 技术全景图:Context Engineering、Subagents 与 Harness,一年范式转移全解析

一年前,行业还在为“从自动补全到 Agent”的进化感到兴奋。然而一年过去,我们不难发现单纯靠“Vibe Coding”和“Prompt 调优”,面对非确定性模型带来的风险和成本问题,显然无法撑起企业级软件开发。

来自主题: AI技术研报
6667 点击    2026-06-09 09:37
打破Agent训练瓶颈!人大&至知研究院开源Claw Agent数据+训练+评测全链条

打破Agent训练瓶颈!人大&至知研究院开源Claw Agent数据+训练+评测全链条

打破Agent训练瓶颈!人大&至知研究院开源Claw Agent数据+训练+评测全链条

大模型从“回答问题”走向“完成任务”,正在面临以下瓶颈:面向Claw Agents的数据、训练和评测都比传统environment training更难。为了解决该问题,中国人民大学、至知研究院等最新提出ClawGym——

来自主题: AI技术研报
6625 点击    2026-05-31 11:42
阿里Qoder推出Cloud Agents,Agent上线仅需1天

阿里Qoder推出Cloud Agents,Agent上线仅需1天

阿里Qoder推出Cloud Agents,Agent上线仅需1天

今天,阿里Qoder上线Cloud Agents,这是全托管的AI Agent运行平台,可提供Agent底座、模型服务及运行环境等全栈Agent能力,企业可通过API的方式直接调用,让应用和业务系统快速长出“大脑”和“双手”,Agent 上线时间从1个月缩短至1天。

来自主题: AI资讯
7515 点击    2026-05-31 11:16
Anthropic 更新:Managed Agent 开放自托管

Anthropic 更新:Managed Agent 开放自托管

Anthropic 更新:Managed Agent 开放自托管

刚刚 Anthropic 又给他们的官方 Managed Agents 加了俩功能:自托管沙箱 self-hosted sandboxes 和 MCP 隧道 MCP tunnels

来自主题: AI技术研报
9366 点击    2026-05-20 10:11
24小时从零写一个GBA模拟器!GPT-5.5跑出53分登顶,Gemini得了0.8分,底部还有两家交白卷

24小时从零写一个GBA模拟器!GPT-5.5跑出53分登顶,Gemini得了0.8分,底部还有两家交白卷

24小时从零写一个GBA模拟器!GPT-5.5跑出53分登顶,Gemini得了0.8分,底部还有两家交白卷

Mechanize 发布了一项硬核测试:给前沿 AI coding agents 24 小时,用 Rust 从零写一个完整的 Game Boy Advance 模拟器,再和顶级开源模拟器 Mesen2 逐帧对比打分。

来自主题: AI技术研报
8038 点击    2026-05-18 16:48