刚刚,Claude 发布了一个重磅更新:可以直接生成Excel和PPT了!
现在,Claude可以直接创建和编辑各种文件:
Excel表格、Word文档、PPT幻灯片、PDF文件,通通不在话下。
Anthropic 用户关系负责人Alex 特别强调:
代码智能体为软件工程做的事情,很快就会扩展到所有知识工作领域,这只是开始。
要注意的是,这次的更新,并不是说像之前那样用前端代码写点蓝紫渐变的样式就完了,而是会输出真正可用的文件。
用你的Office 办公软件就可以直接打开的那种。
技术方案上,Anthropic给Claude配备了一个私有计算机环境,让它能在里面写代码、运行程序,最终生成你需要的各种格式文件。
这个环境让Claude能做很多很酷的事情:
高级数据分析:上传原始数据,返回清洗后的数据、统计分析、图表和书面洞察报告
图像视频处理:裁剪、调整、各种操作都能搞定
处理各类文件:GIF动图、LaTeX文档、ZIP压缩包,什么格式都能处理
甚至是,跨格式转换。
你可以上传PDF报告让它生成PPT,分享会议记录让它整理成格式化文档,上传发票让它整理成带计算功能的Excel表格。
Claude处理所有繁琐的技术工作,按你需要的方式呈现信息。
目前这个功能作为预览版提供给Max、Team和Enterprise用户,Pro用户还需要等几周。
具体开启步骤:
选中后会默认关掉Analysis tool 的实验功能(相对新功能而言,这个过时了)。
然后,你就可以上传相关文件或描述你的需求了。
Claude会在后台完成所有工作,你可以下载完成的文件,或者直接保存到Google Drive。
有Max账号的我,自然也第一时间测了一把这个新功能。
我直接Claude的更新公告内容全选后贴进去,并说:帮我把这次更新的内容做成一个PPT介绍。
然后,它就咔咔开始整活了……
先是一顿分析 + 执行各种命令:
然后,就开始生成ppt 了:
很快就生成了一份pptx 的文件出来,可以直接预览,也可以点击下载后用办公软件打开:
来看一眼:
还不错啊!
但,有个问题是:
我明明用中文和你对话,你怎么给我生成了英文版PPT呢……
我告诉它「用中文」,于是:
点击,就能播放演示了。
质量还不错,和我花一小时做的ppt 相比,好像也没太多差别。
但……有点太朴素了,有人可能喜欢更花哨一些?
于是我让它浮夸一些:
结果我得到了这个:
过于浮夸了……(也没有加上过渡动画)
相信仔细调一调prompt,应该能有更好的质量。
其实对我来说,朴素版就很好了。
这次更新的背后,则是:又有一大批公司要被干死了。
首当其冲的是那些AI PPT生成公司。
过去一年涌现出的各种「一键生成PPT」的产品,现在Claude直接就能做了,而且还能处理Excel、Word、PDF等各种格式。
那些做AI文档处理、数据分析可视化、格式转换的创业公司,恐怕都要重新思考自己的定位了。
以及,让人心疼的还有Manus。
在禁止这家中国背景的公司使用API 后,Anthropic 今天又放出了Manus 主打的办公系列功能直接对标。
从现在起,职场打工人们在Claude 中就能完成几乎所有任务了。
值得注意的是,Claude背后的Anthropic,正在将触手从模型伸向应用。
自从今年5月全面推出的Claude Code之后,其已然成为开发者的首选工具(暂不算其作死降智被codex 薅走了的用户)。
而仅仅三个月时间,Claude Code的使用量就增长了10倍以上,目前已经产生超过5亿美元的年化收入。
这个数字实在是过于惊人:
一个工具在三个月内就达到了许多独角兽公司需要数年才能达到的收入规模。
而更为惊人的则是:
Claude Code干死Cursor等AI编程工具只是第一步。
其目标,显然是要将在Claude Code中的成功方法论,scale 至全系列应用中去——
最终打造无数个垂类Claude Code 应用来。
而结合此前的130亿美元暴力融资,外加近期的模型莫名降智事件……随着这次的功能发布,也许一切也都能说得通了。
可以说,Anthropic的野心,已经昭然若揭了。
而留给创业者的,还有多少空间呢?
创业公司们,你们要小心了!
文章来自于微信公众号 “AGI Hunt”,作者 “AGI Hunt”
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。
项目地址:https://github.com/mannaandpoem/OpenManus
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0