
刚刚,谷歌AI智能体首次上线手机,Gemini看懂屏幕实时交流!
刚刚,谷歌AI智能体首次上线手机,Gemini看懂屏幕实时交流!谷歌Gemini迈出关键一步:「睁眼看世界」。用户发现Gemini新增实时屏幕共享功能,能准确识别屏幕上的内容并实时互动;并且可以打开摄像头与物理世界交互,帮用户给釉陶「上色」。
谷歌Gemini迈出关键一步:「睁眼看世界」。用户发现Gemini新增实时屏幕共享功能,能准确识别屏幕上的内容并实时互动;并且可以打开摄像头与物理世界交互,帮用户给釉陶「上色」。
进入2025年,AI Agent迎来了蓬勃发展的新阶段。
3 月份发布的 Manus,让大众第一次感受到了 Agent 的强大。
知名 AI 工程师、Pleias 的联合创始人 Alexander Doria 最近针对 DeepResearch、Agent 以及 Claude Sonnet 3.7 发表了两篇文章,颇为值得一读,尤其是 Agent 智能体的部分。
中国科学院大学团队在这篇论文中,提出了一个崭新观点:智能体不但是AI领域的核心,更可能是构成宇宙的基本单元,或许还将引发21世纪科学范式的重大变革!
AI Agents(智能体)也有自己的“摩尔定律”了?!就在最近,Nature报道了一项来自非营利研究机构METR的最新发现:AI在完成长期任务方面的进步速度惊人,其时间跨度大约每七个月翻一番。
Manus 团队公司的另外一款产品,面向国内用户的 Monica中文版,如今全面开放,无需邀请码。并且同步上线了 app 和网页插件版本,插件可以在浏览英文页面时提供全文翻译,体验很丝滑。
火热的智能体离杀手级爆款有多远?
在春节的 DeepSeek 大热后,大模型也更多走进了大家的生活。我们越来越多看到各种模型在静态的做题榜单击败人类,解决各种复杂推理问题。但这些静态的测试与模型在现实中的应用还相去甚远。模型除了能进行对话,还在许多更复杂的场景中以各种各样的方式与人类产生互动。除了对话任务外,如何实现大模型与人的实时同步交互协作越来越重要。
Manus的火爆带热了多个技术概念,Computer Use Agent就是其中之一。但要探讨这种“电脑使用”智能体,还得从Claude 3.5 Sonnet说起。