AI资讯新闻榜单内容搜索-agent

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: agent
红杉中国发布 xbench,首个由投资机构打造的 AI 基准测试

红杉中国发布 xbench,首个由投资机构打造的 AI 基准测试

红杉中国发布 xbench,首个由投资机构打造的 AI 基准测试

随着基础模型的快速发展和 AI Agent 进入规模化应用阶段,被广泛使用的基准测试(Benchmark)却面临一个日益尖锐的问题:想要真实地反映 AI 的客观能力正变得越来越困难。

来自主题: AI技术研报
6951 点击    2025-05-27 09:50
没有银弹,没有免费午餐!KtR用算法思维重构Multi-Agent设计

没有银弹,没有免费午餐!KtR用算法思维重构Multi-Agent设计

没有银弹,没有免费午餐!KtR用算法思维重构Multi-Agent设计

1986年,图灵奖得主Fred Brooks在软件工程领域提出了著名的"没有银弹"理论:没有任何一种技术或方法能够独自带来软件工程生产力的数量级提升。近四十年后,这个深刻洞察在AI领域再次得到验证——你是否也曾经历过这样的挫折:

来自主题: AI技术研报
4711 点击    2025-05-26 09:50
312条轨迹激发241%性能!上交大与SII开源电脑智能体,超越 Claude 3.7

312条轨迹激发241%性能!上交大与SII开源电脑智能体,超越 Claude 3.7

312条轨迹激发241%性能!上交大与SII开源电脑智能体,超越 Claude 3.7

自 Anthropic 推出 Claude Computer Use,打响电脑智能体(Computer Use Agent)的第一枪后,OpenAI 也相继推出 Operator,用强化学习(RL)算法把电脑智能体的能力推向新高,引发全球范围广泛关注。

来自主题: AI技术研报
7123 点击    2025-05-25 15:11
AI创业访谈④丨Flowith,10个95后想把自由思考变成Agent

AI创业访谈④丨Flowith,10个95后想把自由思考变成Agent

AI创业访谈④丨Flowith,10个95后想把自由思考变成Agent

搅起波澜的 flowith 是个目前只有 10 人的年轻团队。生于 1996 年的创始人 Derek(倪正民)已是团队里最年长的;另外一位创始人 Zion( 吴熠宸)生于 1998 年;最年轻的成员则是 00 后。

来自主题: AI资讯
7845 点击    2025-05-24 17:48
Claude 4如何思考?资深研究员回应:RLHF范式已过,RLVR已在编程/数学得到验证

Claude 4如何思考?资深研究员回应:RLHF范式已过,RLVR已在编程/数学得到验证

Claude 4如何思考?资深研究员回应:RLHF范式已过,RLVR已在编程/数学得到验证

惊艳全球的Claude 4,但它到底是如何思考?来自Anthropic两位研究员最新一期博客采访,透露了很多细节。这两天大家可以说是试玩了不少,有人仅用一个提示就搞定了个浏览器Agent,包括API和前端……直接一整个大震惊,与此同时关于Claude 4可能有意识并试图干坏事的事情同样被爆出。

来自主题: AI资讯
7740 点击    2025-05-24 17:43
用Cherry替代Manus,AI调用多个MCP在本地处理Excel生成可视化报告文件

用Cherry替代Manus,AI调用多个MCP在本地处理Excel生成可视化报告文件

用Cherry替代Manus,AI调用多个MCP在本地处理Excel生成可视化报告文件

Manus在agent领域可谓「炙手可热」,但受限于网络以及少得可怜的积分,很多人还是无法用得上。AI Agent的处理逻辑:无非就是用AI根据用户需求,规划好要做的事后,不断的调用不同的工具来实现。

来自主题: AI技术研报
7034 点击    2025-05-23 14:20
AI版Office全网首测,键盘鼠标彻底退休!打工人沸腾

AI版Office全网首测,键盘鼠标彻底退休!打工人沸腾

AI版Office全网首测,键盘鼠标彻底退休!打工人沸腾

这次,引领者又是中国公司!在5月中旬拿到GAIA榜首的这个AI版office,直接结合了Deep Research和通用Agent两大神器的优点,从此office三件套彻底进入第四代。

来自主题: AI资讯
4769 点击    2025-05-23 12:32
Claude 4发布:新一代最强编程AI!

Claude 4发布:新一代最强编程AI!

Claude 4发布:新一代最强编程AI!

就在刚刚,Anthropic正式发布Claude 4系列模型:Claude Opus 4和Claude Sonnet 4。没喊口号,没搞长篇论文,这次Claude升级的关键词只有一个:干活。据Anthropic宣称,Opus 4是目前全球最强的编程模型,能够稳定胜任复杂且持续时间长的任务和Agent工作流。而Sonnet 4则着重强化了编程和推理能力,能更精准地响应用户的指令。

来自主题: AI资讯
8916 点击    2025-05-23 09:51