图片来源:Menio Ventures
Z Highlights:
2024年标志着生成式AI成为企业关键战略的转折点。数据显示出一个极具冲击力的趋势:今年企业在AI上的支出飙升至138亿美元,是2023年23亿美元支出的6倍以上——这清晰地表明企业正在从试验阶段走向实际执行,将AI深度嵌入其核心业务战略中。
这场支出激增反映出组织内部对生成式AI的乐观情绪:72%的决策者预计在不久的将来会更广泛地采用生成式AI工具。这种信心并非凭空而来——生成式AI工具已经深深融入了专业人士的日常工作中,从程序员到医疗服务提供者,几乎无所不在。
尽管前景乐观、投资持续增长,许多决策者仍在探索哪些AI应用真正适合自身业务。我们调查中超过三分之一的受访者表示尚未清晰规划如何在全组织范围内部署生成式AI。这并不意味着他们在盲目投资;相反,这凸显出我们正处于大规模转型的早期阶段。企业领导者才刚刚开始理解生成式AI对组织可能产生的深远影响。
在去年的《2023年企业生成式AI现状报告》中,我们记录了企业对AI的初步试验阶段。而2024年的报告则在此基础上进一步扩展,纳入了600位美国企业领导者的洞察,揭示了当下企业从试点走向生产阶段的趋势——生成式AI正成为企业不可或缺的战略核心。
企业对生成式AI的投入彰显其日益增长的战略承诺
目前,企业在生成式AI方面的60%投资来自“创新预算”,这反映了生成式AI仍处于采用的早期阶段。然而,仍有40%的生成式AI支出来自更为“常规”的预算,其中有58%是从原有的资金分配中重新调整的——这表明企业正日益坚定地致力于AI转型。
图片来源:Menio Ventures
信号已经非常明确:生成式AI正在从未来技术转变为核心商业工具。
尽管企业在基础模型上的投资仍占主导地位,但应用层的增长速度如今更快,这得益于基础设施层日渐成型的设计模式。企业正在利用这些工具在各个行业中优化工作流程,从而创造可观的价值,并为更广泛的创新铺平道路。
接下来的内容中,我们将探讨企业生成式AI采用的两个关键维度:
•应用层:这是最早实现突破的领域,也是初创企业挖掘新市场(greenfield markets)的大好时机;
•现代AI技术栈:大模型竞争正在重塑行业格局,同时一些特定的基础设施模式正迅速获得广泛采用。
深入应用层:应用层正在升温
在2024年,大多数生成式AI的发展都发生在应用层。随着许多架构设计模式的建立,应用层公司正在利用LLM在各个领域的能力,解锁新的效率与能力。企业客户正把握时机,在2024年向生成式AI应用投入了46亿美元,这一数字几乎是去年报告的6亿美元的8倍。
公司不仅仅是花得更多了,他们的想法也更加宏大。平均而言,各组织已识别出10个这种变革性技术的潜在用例,表明它们的目标广泛而雄心勃勃。其中近四分之一(24%)被列为近期优先实施,表明在实际部署方面势头强劲。而这还只是开始。大多数公司仍处于采用的早期阶段,仅有少量用例进入实际生产,另有三分之一(33%)仍处于原型设计和评估阶段。
企业内部:最有价值用例排行
尽管仍在不断试验中,明确的采用趋势已显示出一小部分用例通过提升生产力或运营效率带来了可衡量的投资回报(ROI):
•代码协同助手以51%的采用率处于领先地位,使开发者成为AI最早的核心用户。GitHub Copilot迅速达到3亿美元的收入运行率验证了这一发展趋势,而像Codeium和Cursor这样的新兴工具也在快速增长。除了通用编码助手外,企业还在采购特定任务的协同助手,如Harness的AI DevOps工程师和QA助手,用于流水线生成和测试自动化,以及像All Hands这样的AI Agent,能够执行更完整的软件开发任务。
•客服聊天机器人也获得了显著使用率,企业采用率为31%。这些应用为内部员工和外部客户提供可靠的、全天候、基于知识的支持。Aisera、Decagon和Sierra的智能体直接与最终客户交互,而Observe AI则在通话过程中为联络中心坐席提供实时指导。
•企业搜索 + 信息检索与转换(分别为28%和27%)反映了企业希望解锁并利用其组织中分散数据孤岛中宝贵知识的强烈动机。Glean和Sana等解决方案可连接电子邮件、聊天工具和文档存储系统,实现跨系统的统一语义搜索,并提供AI驱动的知识管理。
•会议摘要以24%的采用率排名第五,通过自动记录会议笔记和要点节省时间并提升生产力。Fireflies.ai、Otter.ai和Sana等工具可捕捉并总结在线视频会议内容,而Fathom可从视频中提炼要点。Eleos Health将该创新应用于医疗领域,自动完成数小时的文档记录,并可直接集成到电子病历(EHR)中,从而让医疗人员能够专注于病患护理。
图片来源:Menio Ventures
我们的数据显示,组织主要投资于具有实际回报、以投资回报率(ROI)为导向的用例。排名前五的用例(代码生成、聊天机器人、企业搜索、数据转换和会议摘要)都聚焦于提升生产力和效率。
智能体与自动化:AI开始掌舵
当前的实施模式显示出企业更倾向于增强人类工作流程,而非完全自动化。但我们正逐步迈向更具自主性的解决方案。各行业已经开始出现由AI驱动、能够独立管理复杂端到端流程的智能体早期示例。像Forge和Sema4在金融后台工作流程中的应用,以及Clay的市场拓展工具,展示了完全自主的生成式AI系统如何变革传统由人类主导的领域,预示着一个“服务即软件”(Services-as-Software)的未来时代即将到来,在这一时代中,AI驱动的解决方案拥有传统服务提供商的能力,但完全通过软件运行。
自建还是购买?视情况而定的策略
在“自建还是购买”的决策中,公司呈现出接近均衡的分布:47%的解决方案为内部开发,53%则来自外部供应商。这与2023年形成了明显对比,当时我们报告称80%的企业依赖第三方生成式AI软件——这表明,越来越多的企业在构建自身内部AI工具方面拥有了更强的信心与能力,而不再主要依赖外部供应商。
长期主义:企业在生成式AI采用中优先考虑价值而非速赢
在选择生成式AI应用时,企业有着明确的优先级:投资回报率和行业特定的定制化是选择新工具时最重要的考量因素。令人惊讶的是,价格并不是主要问题;我们调查的企业领导者中,只有1%提到价格是他们的选择顾虑。买家们正在进行一场长期博弈:相比最低价(1%),他们更关注那些能带来可衡量价值(30%)以及能够理解其工作独特背景(26%)的工具。
图片来源:Menio Ventures
尽管企业在投资回报率和定制化方面做足功课,但它们可能忽视了实施过程中至关重要的环节。许多组织直到为时已晚才发现,它们低估了技术集成、持续支持和可扩展性的重要性。这就像只看燃油效率买了一辆车,结果后来才意识到服务可得性和维护便捷性在长期来看同样关键。
当AI试点项目受阻或停滞时,往往是因为在选择过程中未能充分考虑这些挑战。尽管买家并未关注价格标签,实施成本却常常让他们措手不及——26%的失败试点中提到了这一问题。数据隐私障碍(21%)和令人失望的投资回报率(ROI)(18%)也会导致试点偏离正轨。技术问题,尤其是关于“幻觉”的问题(15%),构成了失败原因的最后一环。在规划和选择阶段主动应对这些潜在问题,可以显著提高实施成功的可能性。
去年,传统厂商在企业市场上占据主导地位,采用的是一种“嵌套升级”策略,将生成式AI能力叠加到现有产品之上。我们曾预测初创公司将逐步占据一席之地,今年的数据证实了我们的判断:虽然64%的客户仍然倾向于购买成熟厂商的产品,理由是信任和即开即用的功能,但传统厂商的主导地位已经开始显现裂痕。我们的数据显示,不满情绪正在增长:18%的决策者对传统厂商的产品表示失望;而40%的人质疑当前解决方案是否真正满足他们的需求,这为创新型初创公司提供了切入并赢得市场的机会。
当前生成式AI的采用令人瞩目的不仅仅是其规模——更在于其覆盖范围。今年,生成式AI的预算流向了企业的每一个部门。
图片来源:Menio Ventures
技术部门占据了支出的大头,这并不令人意外:IT(22%)、产品与工程(19%)以及数据科学(8%)三者合计几乎占据了企业生成式AI投资的一半。其余预算则分布于客户相关职能部门,如客服(9%)、销售(8%)和市场营销(7%);后台支持团队如人力资源和财务(各占7%);以及一些较小的部门,如设计(6%)和法务(3%)。
图片来源:Menio Ventures
最初的生成式AI应用是面向文本和图像生成的横向解决方案,但2024年,越来越多的应用开始在将大型语言模型(LLM)的新能力应用于高度专业化的垂直化工作流程中获得认可。以下垂直领域正引领着这一趋势:
•医疗健康:传统上技术采纳较慢的医疗行业,如今正引领生成式AI的应用,企业支出达到5亿美元。像Abridge、Ambience、Heidi和Eleos Health这样的环境辅助记录工具,正成为医生办公室的常用设备,同时自动化解决方案也在临床生命周期的各个环节涌现——从分诊和接诊(例如Notable),到编码(例如SmarterDx、Codametrix)以及收入周期管理(例如Adonis、Rivet)。
•法律:历来对技术较为抗拒的法律行业(企业AI支出3.5亿美元)现正采用生成式AI,以管理大量非结构化数据并自动化复杂的基于模式的工作流程。该领域大致分为诉讼法和交易法,包含众多子专业。Everlaw专注于诉讼领域,涵盖法律保全、电子发现和审判准备,而Harvey和Spellbook则在交易法方面推动AI发展,提供合同审查、法律研究和并购解决方案。特定的实践领域也有针对性的AI创新:EvenUp专注于伤害法,Garden聚焦专利与知识产权,Manifest覆盖移民和劳动法,Eve则重新定义了从客户接待到案件解决的原告案件处理流程。
•金融服务:金融服务行业因其复杂的数据、严格的监管和关键的工作流程(企业AI支出1亿美元),正处于AI转型的前沿。像Numeric和Klarity这样的初创企业正在革新会计领域,而Arkifi和Rogo通过先进的数据提取加速金融研究。Arch利用AI颠覆注册投资顾问(RIA)和投资基金的后台流程。Orby和Sema4是以对账和报告为起点的更广泛的横向解决方案,而Greenlite和Norm AI则提供实时合规监控,以应对不断变化的法规。
•媒体与娱乐:从好莱坞银幕到创作者的智能手机,生成式AI正在重塑媒体和娱乐行业(企业AI支出1亿美元)。Runway等工具现已成为制片厂的标准装备,而Captions和Descript等应用则赋能独立创作者。Black Forest Labs、Higgsfield、Ideogram、Midjourney和Pikapush等平台正推动专业人士在图像和视频创作领域的边界。
经过一年的快速演变,现代AI技术栈在2024年趋于稳定,企业逐渐围绕构成大多数生产级AI系统运行架构的核心构建模块达成共识。
图片来源:Menio Ventures
基础模型依然占据主导地位。大型语言模型(LLM)层吸引了65亿美元的企业投资。然而,通过不断试验,企业日益认识到数据支架和集成在构建复杂复合AI架构中的重要性,这些架构不仅能在演示中表现出色,更能在生产环境中稳定运行。
企业不再依赖单一供应商,而是采纳务实的多模型方法。我们的研究显示,组织通常在其AI技术栈中部署三种或以上的基础模型,根据不同用例或结果选择不同模型。该策略同样适用于开源与闭源的争论,尽管行业讨论激烈,偏好却保持稳定。闭源解决方案占据了绝大多数的市场份额,达到81%,而以Meta的Llama 3为首的开源替代方案稳定在19%,较2023年仅下降1个百分点。
在闭源模型中,OpenAI的先发优势有所削弱,企业市场份额从50%降至34%。主要受益者是Anthropic,其企业市场份额从12%翻倍至24%,部分企业在Claude 3.5 Sonnet成为最先进模型后,转而使用该模型替代GPT-4。企业在选择新LLM时,最常考虑的因素依次是安全与保障(46%)、价格(44%)、性能(42%)及扩展功能(41%)。
图片来源:Menio Ventures
基础模型领域仍在快速演进。Anthropic于2024年10月22日发布的Claude 3.5 Sonnet具备突破性能力,包括计算机使用功能,预示其市场份额有望继续提升。
企业不再依赖单一供应商,而是采纳务实的多模型方法。我们的研究显示,组织通常在其AI技术栈中部署三种或以上的基础模型,根据不同用例或结果选择不同模型。该策略同样适用于开源与闭源的争论,尽管行业讨论激烈,偏好却保持稳定。闭源解决方案占据了绝大多数的市场份额,达到81%,而以Meta的Llama 3为首的开源替代方案稳定在19%,较2023年仅下降1个百分点。
在闭源模型中,OpenAI的先发优势有所削弱,企业市场份额从50%降至34%。主要受益者是Anthropic,其企业市场份额从12%翻倍至24%,部分企业在Claude 3.5 Sonnet成为最先进模型后,转而使用该模型替代GPT-4。企业在选择新LLM时,最常考虑的因素依次是安全与保障(46%)、价格(44%)、性能(42%)及扩展功能(41%)。
图片来源:Menio Ventures
基础模型领域持续快速演进。Anthropic于2024年10月22日发布的Claude 3.5 Sonnet具备突破性功能,包括计算机使用能力,表明其市场份额有望进一步增长。
企业AI设计模式——构建高效、可扩展AI系统的标准化架构——正迅速演变。RAG(检索增强生成)现已占据主导地位,采用率达51%,较去年31%大幅上升。与此同时,尽管在领先应用提供商中备受推崇,微调仍然罕见,只有9%的生产模型经过微调。
今年最大的突破?Agents架构首次亮相,已支持12%的实现。
图片来源:Menio Ventures
为了支持RAG,企业必须高效存储和访问相关查询知识。尽管传统数据库如Postgres(15%)和MongoDB(14%)仍然常见,AI优先的解决方案持续获得市场份额。作为AI原生向量数据库的Pinecone,已占据18%的市场份额。类似的转变也发生在数据ETL/准备领域。传统ETL平台(如Azure Document Intelligence)仍占28%的部署比例,但专为处理文档中如PDF和HTML等非结构化数据细节设计的Unstructured等专业工具正迅速开辟市场,市场份额达16%。整个技术栈中,我们观察到对专门满足现代AI需求技术的强烈需求。
2024年是一个转型与演进之年,2023年我们记录的炒作浪潮逐渐让位于现实世界的落地应用。基于我们今天分享的数据和作为投资者观察到的趋势,以下是我们对未来的三大预测:
1.Agents将驱动下一波变革。
Agents自动化将推动下一波AI变革,处理复杂的多步骤任务,超越当前聚焦内容生成和知识检索系统的能力。Clay和Forge等平台预示了先进代理如何可能颠覆价值4000亿美元的软件市场——并蚕食美国10万亿美元的服务经济。这一转变将催生新基础设施:代理认证、工具集成平台、AI浏览器框架以及专门用于AI生成代码的运行时环境。
2.David战胜Goliath:更多巨头将倒下。
ChatGPT今年对Chegg和Stack Overflow的冲击敲响警钟:Chegg市值蒸发85%,Stack Overflow网站流量减半。其他领域同样面临被颠覆的风险。IT外包公司如Cognizant和传统自动化玩家如UiPath应警惕AI原生挑战者进入其市场。随着时间推移,甚至像Salesforce和Autodesk这样的软件巨头也将面对AI原生挑战。
3.无缓解迹象:AI人才短缺加剧。
我们正处于大规模人才短缺的边缘。随着AI系统普及并日益复杂,科技行业将面临严重的人才稀缺。这不仅仅是数据科学家的短缺,更是能够将先进AI能力与领域专业知识桥接的专家严重不足。人才库已处于危险低点。预计竞争将激烈,具备AI技能的企业架构师薪资将普遍飙升2-3倍。尽管有培训项目和AI卓越中心的投入,人才缺口仍将超过供给,激化为下一波AI创新提供动力的有限人才争夺战。
AI正在为一个由尖端AI工具、赋能的劳动力和变革性商业模式驱动的新变革时代铺路,这将重塑我们的经济。我们在投资组合中亲眼见证了这一变革:
•AI帮助诺贝尔奖得主、大卫·贝克(David Baker),Vilya和Xaira Therapeutics的联合创始人,利用计算方法生成潜在新药,并预测其结构和功能,加速为需要的患者开发新的救命疗法。
•AI助力大陆集团、米其林和雀巢等制造商捕捉“部落”知识,保持工厂高标准工作。借助Squint,他们将教学材料转化为沉浸式增强现实体验,提供实时、逐步的指导和验证,提升安全性,减少操作员错误,确保产量稳定。
•AI帮助公司更快、更可靠地识别顶尖工程人才,利用CodeSignal自动化编程评估,个性化调整题目难度,并检测抄袭,从而更准确高效地评估技术能力。
•AI助力Abnormal Security保护企业免受复杂的电子邮件威胁,如网络钓鱼和商业邮件欺诈,每年通过检测异常并阻止攻击,防止高达400万美元的潜在损失。
•AI使财富500强品牌能够大规模制作个性化、符合品牌调性的内容,借助Typeface,品牌广告产出提升四倍,制作时间缩短一半,每月节省数百小时,同时发布能引起客户共鸣的优质内容。
原文:2024: The State of Generative AI in the Enterprise https://menlovc.com/2024-the-state-of-generative-ai-in-the-enterprise/
编译:Chenkai Gao,关注大模型与AI Agent等前沿技术,欢迎交流。
请注意,本文编译自文末载明的原始链接,不代表Z Potentials立场。如果您对本文有任何想法或见解,欢迎在评论区留言互动探讨。
Z Potentials将继续提供更多关于人工智能、机器人、全球化等领域的优质内容。我们诚邀对未来充满憧憬的您加入我们的社群,与我们共同分享、学习、成长。
文章来自于微信公众号“Z Potentials”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner