
AutoGLM 2.0 深度解析:云端智能体的技术跃进与现实挑战
AutoGLM 2.0 深度解析:云端智能体的技术跃进与现实挑战进入 2025 年,GUI Agent 赛道热度逐渐抬升 —— OpenAI 推出 Operator 并发布了 ChatGPT Agent,字节则发布了 UI-TARS-1.5 定位 GUI 开源方案。但大多数产品依然依赖本地执行,难以 24h 稳定运行。
进入 2025 年,GUI Agent 赛道热度逐渐抬升 —— OpenAI 推出 Operator 并发布了 ChatGPT Agent,字节则发布了 UI-TARS-1.5 定位 GUI 开源方案。但大多数产品依然依赖本地执行,难以 24h 稳定运行。
自从 GPT-5 发布后,DeepSeek 创始人梁文锋就成了 AI 圈最「忙」的人。
DeepSeek V3.1和V3相比,到底有什么不同?官方说的模模糊糊,就提到了上下文长度拓展至128K和支持多种张量格式,但别急,我们已经上手实测,为你奉上更多新鲜信息。
作者测试了智谱GLM-4.5V(开启/关闭推理)、豆包、Kimi、元宝和ChatGPT-5在识别十张奇葩卫生间标识上的表现。评测模拟紧急如厕场景,按识别正确性评分。结果智谱普通模式得分最高(86分),ChatGPT-5和智谱推理模式次之(78分),豆包和元宝70分,Kimi垫底(38分),揭示了各AI视觉能力的差异及局限性。
“一句话做应用”,虽说这个概念已经并不新鲜。但说实话,市面上能真正达到交付标准的产品寥寥无几。
视频Agent生成过程中顶多也就是让我点点选项,或者直接针对某一处不满意的地方用对话形式修改,甚至可能我提了一个意见,直接整个片子都给我换了个不一样的。
OpenAI 发布了 GPT-5,我在公众号里、社群里、论坛里,很多地方都在刷屏一个消息:GPT-5 来了,而且在编程能力上“强得可怕”。
上上周我们一起测试了六款视频Agent, Agent们手里有一堆音频、视频、剪辑、生图等工具,由他们决定调用顺序成片
一起给GPT5上上强度吧! 我相信它的参数、API、纸面实力已经被扒得差不多了,所以接下来的内容先会分为总结篇,把system card、发布会、OpenAI自家技术博客、奥特曼私下说的信息做个全篇,然后从编程、写作、多模态、PPT等等给GPT犁一边,最后再总结一下GPT-5后续的一些开发计划啥的,Here we go!
GPT-5的发布让全球震动,网友也都开始了试玩模式。 50万粉Youtuber Matthew Berman也参与其中,用25分钟的视频展示了数十个案例。
GPT5更新了,简单测了几个Case。GPT5更新了,简单测了几个Case。山姆真的是营销大师。从前些天透漏的信息看,GPT5 牛逼的不行了。但实际呢?!至少在我今天的测试Case中,没一个比 Claude 4 sonnet 好!
凌晨1点,在万众瞩目的境况下,OpenAI的直播正式开始。GPT-5,终于来了。
一直被称为"CloseAI"的OpenAI,终于舍得发布了他们继GPT-2之后的第一个开源模型:GPT-OSS
谷歌DeepMind的Genie 3是如何诞生的?这位主持人深入探访实验室内部,全球独家首测了Genie 3,扒出超多震撼细节。同时,前谷歌研究员的笔记中,也曝光了使用初体验,他直言:炸裂,Genie 3让我看到了游戏未来五年的尽头!
gpt-oss-120b 和 gpt-oss-20b OpenAI终于把开源的模型放出来了。 gpt-oss系列也是自GPT2以来,OpenAI首次开源的大语言模型。
没等来GPT-5,最先更新的是Gemini 2.5 Deep Think,不愧是你,卷王Gemini。
果然只要坚持每天测Agent, 总能开出金的。Agent们好用但不便宜,有没有那种不烧积分,一句话就能定制多个智能体的Agent开发平台呢?今天就有了!
伙计,噢! 看看我们的设计Agent Lovart最近又更新了什么! ChatCanvas 一个“活在”画布上, 能听我无限次修改意见的设计师!这可太棒啦!
还记得Midjourney最早的视频功能V1上线时,一张图、五秒钟、高美感、低分辨,是所有人对V1的第一印象。
在用 AI 做数据分析的时候,你有没有遇到过这样的场景?
这段时间国产 AI 模型非常热闹,各家都瞄着 Coding 和 Agent 场景,开源自己的最新模型。
最近,AI圈又悄悄扔下了一枚“重磅炸弹”——美图公司,这个我们熟悉的影像巨头,终于祭出了它在AIGC领域的大杀器:美图RoboNeo。
又一家支持Claude Code的模型登场! GLM-4.5 在推理、代码、Agent(智能体)综合能力都达到了开源模型Top1水准,在单个模型中实现了推理、代码、Agentic等能力原生融合。
承认吧,AI 已经彻底卷进了我们的生活。
OpenAI GPT Agent以为只比Manus们差了一步, 但7月份带着一堆更新回归的MiniMax Agent告诉它其实已经慢一圈了。
兄弟们,是不是也感觉最近被Cursor“背刺”了?这位曾经的AI编程王者,开启 AI 编程大航海时代的白月光,现在是又卡又慢,关键的Claude模型还不给中国区用、改变计费方式,用户的体验简直一言难尽。
前不久看到群里的聊天,正好聊到用纳米AI做视频很方便,当时太忙了没来得及体验,隔了一周后,在我好友小熊猫Loki群里再次看到了朋友Hank给吴老师做的视频成品,是个制作精良的小动画,画面、配音、节奏都不错。感觉真的很有趣,于是我花了几天体验了一下纳米AI。
最近测Agent测的非常上头, 而且越来越发现AI在各种专门的领域的垂直能力发展的越来越好了。
这应该是上线以来案例最少的 Agent 了,OpenAI GPT Agent奥特曼你不给我用,就别怪我用 Manus 跟你硬碰硬了。
大家好我是歸藏(guizang),今天给大家带来秘塔深度研究的体验。