你的设想被证实了!不微调模型也能微调Agent,Memento霸榜GAIA|UCL最新
你的设想被证实了!不微调模型也能微调Agent,Memento霸榜GAIA|UCL最新你或许也有过这样的猜想,如何让AI智能体(Agent)变得更聪明、更能干,同时又不用烧掉堆积如山的算力去反复微调模型?
你或许也有过这样的猜想,如何让AI智能体(Agent)变得更聪明、更能干,同时又不用烧掉堆积如山的算力去反复微调模型?
当大多数人还在抱怨传统工单系统的笨重时,一家叫做 Pylon 的公司却在短短18个月内完成了从种子轮到B轮总计5100万美元的融资,估值飙升至8亿美元。更令人震惊的是,他们已经吸引了780多家快速增长的公司,包括 Together AI、Cognition 和 Temporal,其中超过150家公司主动从 Zendesk、Intercom 等老牌平台迁移过来。
AI写论文早就不稀奇了,可如今,它甚至能提出实验方案,设计出能被验证的分子。今年10月,AI将更进一步,走上学术舞台。在一场名为Agents4Science的会议上,它不仅要当第一作者、评审,还要亲自上台报告。这不只是一次会议,更像是一场公开的实验。
我们也看过各种 AI Coding 领域的评测,发现大多停留在了 「代码生成」与「封闭题目」的考核,却忽视了环境配置、依赖处理、跨仓库资源利用等开发者必经的真实需求 —— 当下众多 Benchmark 仅通过题目,已难以衡量 Code Agent 的实际效果。
人多,好办事。agent多,照样好办事! 在最新的Andrew’s Letters中,吴恩达老师就指出: 并行智能体正在成为提升AI能力的新方向。
让LMM作为Judge,从对模型的性能评估到数据标注再到模型的训练和对齐流程,让AI来评判AI,这种模式几乎已经是当前学术界和工业界的常态。
我们每天都在用语音交流,从早上叫醒Siri到晚上和家人通话,语音似乎是人类最直观的交流方式。但当我们试图让机器也用这种方式与我们互动时,却发现背后隐藏着巨大的技术挑战。
“投资可以很简单很有趣。” 这是一个9岁开始炒股、10年前押中英伟达的投资老手——赖蕴琦Vakee,想传递给所有人的理念。
谷歌最新图像模型nano banana横空出世,它不仅能融合多张图片拼接出全新画面,还能理解地理、建筑与物理结构,甚至将二维地图转化为三维景观。凭借Gemini的世界知识与交错生成技术,模型实现了「有记忆」的多轮创作,带来极高一致性与创造力。nano banana正在重塑AI图像生成的边界,也引发了「AI创意伙伴」未来的无限遐想。
最近,a16z的合伙人们发布了一篇深度分析文章,系统梳理了Computer Use(计算机使用)技术的发展现状和未来前景。他们认为,这项技术正在将AI agent从概念推向现实,让AI真正具备了处理端到端数字工作流的能力。