想象一下,你是一位金融分析师,面前堆满了数百页的季报、SEC文件和市场数据,你需要在明天早上交出一份全面的行业分析报告。
在传统模式下,这意味着熬通宵、大量咖啡和眼睛盯着Excel表格到发红。
但如果有一个AI助手能够自动完成这些繁重工作,帮你筛选有价值的信息,分析因果关系,甚至预测特朗普关税政策对整个美国经济的影响呢?
这不是科幻场景,而是刚刚获得4350万美元融资的Samaya AI正在实现的现实。
当许多AI公司在追求更大、更通用的模型时,这家由谷歌大脑和Meta AI实验室顶尖研究人员创立的公司,选择了一条截然不同的路径
——深度专精于金融领域的专业AI,并用"专家智能"重新定义了AI在这个30万亿美元行业中的应用方式。
当我第一次看到Samaya AI的产品演示时,我被它的准确性和深度所震撼。
这不仅仅是又一个能搜索信息的AI工具,而是一个真正理解金融逻辑、能够执行复杂分析任务的专业助手。
更令人印象深刻的是,它刚刚推出的"因果世界模型"(Causal World Models)能够构建经济体系的因果关系图,这是大多数大语言模型无法企及的能力。
我认为,这代表了AI在金融服务领域的一个重要转折点,从简单的信息检索工具转变为真正的分析伙伴。
2022年,当Maithra Raghu和她的联合创始人们在谷歌大脑、Meta的基础AI研究实验室、亚马逊Web服务和艾伦人工智能研究所等顶级AI实验室工作时,
他们看到了生成式AI的发展,并认识到了它在金融服务领域的巨大应用潜力。
但与大多数公司不同的是,他们坚信,不是开发设计用于执行任何任务的广泛、通用的大型语言模型(LLMs),
而是创建专门针对特定领域的产品,才能获得更高质量的结果。正如Raghu所说:"我们深信专家智能源于专业化。
如果没有专业化,就很难达到金融公司要求的质量和可靠性水平。"这种见解成为了Samaya AI的核心理念,并指导他们构建了一套与众不同的AI解决方案。
金融服务行业一直是数据和技术的重度用户,但令人惊讶的是,尽管这是一个规模超过30万亿美元的行业,
占全球GDP的20-30%,但大部分数据分析工作仍然依赖人工完成。
想象一下,那些年薪数十万美元的分析师,每天花费大量时间手动整理数据、制作PowerPoint和Excel表格,而这些模板可能是团队十年前就开始使用的。
这种状况简直令人难以置信,但却是金融行业的日常现实。
我观察到,尽管像Bloomberg、S&P的Capital IQ和FactSet这样的公司创造了超过800亿美元的价值,但它们主要提供的是数据访问服务,而非数据分析服务。
这意味着,对于数据合成、知识上下文化和定量分析,仍然需要高薪分析师手动完成。这种状况是不可持续的,尤其是在数据量不断增长的今天。
但现在,随着生成式AI能够理解并推理各种数据格式,金融知识工作及其技术栈的现状终于准备好迎来变革。
正如NEA的合伙人Tiffany Luck所说:"金融服务公司长期以来一直是数据和垂直特定技术解决方案的信仰者和主要消费者。"
而Samaya AI正是瞄准了这一巨大机会,开发了一套专为复杂金融工作流程设计和训练的专家AI代理。
金融领域的工作流程有几个独特的复杂性,使得通用AI难以满足需求:首先是分散且专业化的数据源,包括各种格式的公开文件、付费研究、替代数据和内部数据;
其次是精度要求极高,任何不准确都可能带来重大后果;第三是可审计性,即使是端到端的AI解决方案也需要设计为人类可以快速但细致地审核AI的来源和推理;
最后是"最后一公里"工作,高级决策者期望信息以符合几十年机构惯例的精确格式呈现。
我认为,正是这些独特需求,创造了专业垂直AI的巨大机会。
通用AI代理可能对子任务如文档搜索有所帮助,但金融服务工作流程中的真正端到端自动化需要专门的垂直解决方案,这些解决方案能够理解行业的复杂性。
Samaya AI显然看到了这一点,并通过构建专门的专家AI代理来解决这些挑战。
据NEA透露,Samaya已经看到使用量实现了100%的月环比增长,并已经为摩根士丹利等大型客户提供服务。
摩根士丹利全球研究主管Katy Huberty表示,Samaya正在"从我们广泛的研究库以及外部来源创建可行的见解,增强我们为客户提供世界级分析的能力。"
这种快速增长和知名客户的采用,证明了市场对专业金融AI解决方案的巨大需求。
Samaya的技术创新:因果世界模型与专家架构
Samaya AI刚刚发布的"因果世界模型"(Causal World Models)让我特别感兴趣。与大多数只擅长找出相关性的大语言模型不同,Samaya的系统能够理解因果关系。
在一个试验项目中,他们使用这款AI软件模拟了特朗普政府提出的关税对整个美国经济的影响,系统生成了一个复杂的流程图,
突出显示了各个经济部门之间的互动,并提供了定量和定性分析。
这种因果推理能力在金融领域尤为重要。投资分析不仅仅是寻找数据中的模式,更是理解事件之间的因果关系。
比如,利率变化如何影响不同行业,供应链中断如何波及下游企业,或者政策变化如何改变消费者行为。
而Samaya使用多阶段过程来构建因果关系图,然后利用这个图来推理它试图回答的问题。
Samaya的第一个产品是一个可以进行金融研究和分析的工具。
它既可以在网络上查找高质量的金融数据源(如SEC文件),也可以连接到公司自己的知识库和数据源,并使用这些源来查找信息。
该系统可用于查找可比较的公司并比较它们的财务估值和绩效——这是金融分析师经常进行的任务。它还可用于帮助对潜在投资进行尽职调查。
从技术架构上看,Samaya的方法也与主流大型语言模型有明显不同。
Samaya CEO Maithra Raghu将其描述为"专家架构网格"(a lattice of experts architecture),包括许多较小的语言模型,
每个模型负责研究任务的一部分,其中一些模型用于检查其他模型的输出。这种方法大大降低了"幻觉"的可能性——即AI模型编造信息的情况。
对比起来,Samaya的研究工具产生的输出在某些方面类似于OpenAI、Google DeepMind、Anthropic或Perplexity等公司推出的所谓"深度研究"工具
——区别在于Samaya AI的产品似乎对金融信息有更大的流畅性,并能更准确地执行金融分析。
Samaya还有可以生成特定格式结果的工具,这些格式在金融服务中很常见——如PowerPoint幻灯片和Excel电子表格。
我认为,这种模块化的架构设计是Samaya能够提供高精度结果的关键。
在金融行业,90%的准确率是远远不够的,而Samaya的专业化路线使其能够达到接近人类专家的水平。
这也解释了为什么摩根士丹利等金融巨头已经开始使用他们的产品。
从根本上说,Samaya的技术理念是"专家智能源于专业化"。这与当前AI行业追求通用性的主流思路形成鲜明对比。
在一个普遍认为"越大越好"的行业中,Samaya选择了专注于特定领域的路径,这让他们能够在金融分析这一垂直领域实现超越通用模型的性能。
人机交互:AI agent的未来方向
在与Samaya AI的技术主管Andrea Cortoni的一次深入交流中,我了解到他们对AI agent的独特理解,这让我重新思考了AI在金融工作流程中的角色。
他强调,人机交互将是agent成功的关键所在,而仅仅专注于推理能力是不够的。"
数据本身和知识推理本身都是不够的。人机交互将是至关重要的,"他在一次AI数据对话中表示。
这观点让我想起了当前AI行业的一个误区:许多人认为最强大的AI就是能够完全自主执行任务的AI。
但实际上,真正有价值的AI agent可能是那些能够作为"同事"与人类紧密协作的系统。
想象一个分析师与AI agent共同完成研究报告的场景:
分析师提出问题和方向,AI收集和分析数据,然后分析师审查结果并提出新的问题,形成一个持续的反馈循环。
讨论到agentic AI时,Cortoni提出了一个有趣的问题:"什么是agent?是一个你给它任务它就自己去做的模型,还是你可以与之互动的,如同同事一样的东西?"
他认为后者可能更有价值,因为它能创建一个反馈循环,随着时间的推移提高质量和生产力。"
是完全接管你工作的东西更有用,还是你可以一起头脑风暴的东西更有用?"这个问题触及了agent设计的核心。
当被问及什么样的agent最受金融客户欢迎时,Cortoni强调了灵活性的重要性。"这真的取决于人们正在处理的用例。
这就是为什么构建一个你可以与这些agent真正轻松互动的灵活世界将是至关重要的。"
在金融领域,用例可能包括审查特定主题、行业、公司,甚至进行投机性分析。
为每种可能的用例硬编码一种交互方式是不可行的,这就是为什么Samaya专注于构建一个既灵活又易于定制的交互过程。
关于评估生成数据的质量,Cortoni指出了金融领域的特殊挑战:
"每当你处理金融机构、银行、对冲基金时,你需要非常真实、非常准确地呈现给用户,至少,你需要在做事方式上明确透明。"
他还提到了事实性与推测之间的平衡:"事实性只有在你能依赖存在的数据时才可能。但如果你正在生成数据,有时这意味着你正在提出可能没有根据的假设。"
这种二元性在金融工作流程中尤为重要。
我看到,Samaya正是采取了这种方向。
他们不是简单地构建一个"按下按钮就能得到答案"的系统,而是创建一个知识平台,使用户能够与AI进行多轮交互,逐步精炼结果。
这种方法不仅能够提高准确性,还能让用户对结果有更强的控制感和信任感。
在金融领域,这种交互模式尤为重要。
一位高级分析师需要的不仅是数据汇总,还需要能够探索不同的假设和情景,了解背后的推理过程,并能够在必要时调整分析方向。
Samaya的系统设计正是针对这种复杂工作流程优化的。
对比当前市场上的其他高级AI系统,如OpenAI的Deep Research,Cortoni指出了一个关键区别:
"现在你看到像深度研究这样的东西,他们真的非常专注于推理部分,能够真正推理他们被给予的任务,
但我真的相信这只是问题的一部分,它甚至不一定能完全解决问题。"这再次强调了人机交互在agent设计中的核心地位。
Samaya的市场定位与竞争格局
Samaya AI的融资轮由New Enterprise Associates(NEA)领投,参与方包括前谷歌CEO、现硅谷著名投资者Eric Schmidt;
AI"教父"、Meta首席AI科学家Yann LeCun;对冲基金Two Sigma的联合创始人David Siegel;
以及前高盛技术高管、现Sixth Street Partners副董事长Marty Chavez。这阵容本身就说明了市场对Samaya愿景的认可。
Eric Schmidt在一份声明中表示:"这正在重新定义AI如何与金融服务合作。"
NEA合伙人Tiffany Luck表示,Samaya符合他们关于特定行业垂直领域需要专门设计的AI工具的投资理念。
她特别强调,在金融服务领域,90%的准确率是不够的,而Samaya能够提供所需的高精度,
并能服务于金融服务公司内不同类型的用户,从初级分析师到高级领导。
Samaya的创始团队拥有极其丰富的技术背景,这是他们面对如此复杂技术挑战的关键优势。
创始人兼CEO Maithra Raghu是Google Brain的早期成员,在那里工作了六年多,研究深度学习系统,
此前她在康奈尔大学完成了机器学习博士学位,并与Jeff Dean和Geoffrey Hinton等AI领域的领导者合作过。
创始团队充满了来自Google Brain、斯坦福大学、AWS和其他领先机构的顶级AI人才。
他们在知识型AI领域产生了惊人的影响,从共同撰写原始RAG论文到长上下文LLM的首批研究,再到改进检索LLM的可指导性方面的突破。
金融服务AI市场的竞争其实已经相当激烈。
摩根士丹利也在使用OpenAI的模型,摩根大通有一个庞大的AI研究团队为银行内部开发工具,彭博社正在构建专门针对金融数据和金融服务公司的AI模型。
此外,还有许多初创公司也在与Samaya竞争金融研究的AI工具市场,包括Model ML、V7 Labs和Rogo。
但我认为,Samaya的独特之处在于其团队的深厚技术背景和对金融领域的专注。创始团队的技术实力将是他们应对提供专家AI知识代理最具挑战性方面的关键。
这种技术深度与行业专注的结合,使Samaya在竞争中占据了独特位置。
从实际应用来看,Samaya的代理已经能够自主合成行业范围的投资报告,并通过对专有文档的推理创建投资演示文稿。
他们还发布了因果世界模型,可以自主建模整个经济并为具有挑战性的问题提供定量预测,例如"关税对美国GDP和经济的影响是什么?"
这种复杂的经济建模能力是Samaya的一大技术优势,也是其与竞争对手的主要区别点之一。
原始RAG论文到长上下文LLM的首批研究,再到改进检索LLM的可指导性方面的突破。这种技术深度与行业专注的结合,使Samaya在竞争中占据了独特位置。
我对金融AI未来的思考
随着像Samaya这样的公司推动金融服务AI的边界,我看到了几个可能的发展方向。首先是AI将从执行具体任务转向提供更全面的决策支持。
想象一个AI系统不仅能告诉你某家公司的财务状况,还能帮你理解宏观经济趋势如何影响该公司的长期前景,以及这对你的投资组合意味着什么。
这种转变将使金融专业人士能够更快地做出更明智的决策,并减少分析过程中的人为偏见。
其次是AI与人类专家的合作将变得更加无缝。金融分析师将不再需要在繁琐的数据收集和整理上浪费时间,而是可以专注于战略思考和最终决策。
AI将成为他们的思维伙伴,而不仅仅是工具。
正如Andrea Cortoni所强调的,未来最强大的AI agent不会是那些完全自主工作的系统,而是那些能够与人类进行富有成效的协作的系统。
他提出了一个关键问题:"是完全接管你工作的东西更有用,还是你可以一起头脑风暴的东西更有用?"
我认为答案显然是后者,尤其是在金融这种需要微妙判断和直觉的领域。
第三是AI将使金融知识更加民主化。目前,高质量的金融研究和分析主要集中在大型金融机构手中,这些机构拥有资源雇佣顶级分析师和订阅昂贵的数据服务。
但随着像Samaya这样的AI系统变得更加普及,小型投资者和企业也可能获得类似的洞察力,从而创造更公平的竞争环境。
这种民主化趋势可能会对整个金融服务行业产生深远影响,挑战传统的信息不对称模式。
关于数据质量和合成数据的问题也将变得更加重要。
正如Cortoni所指出的,生成数据的质量在金融领域尤为关键:"每当你处理金融机构、银行、对冲基金时,你需要非常真实、非常准确地呈现给用户。"
但同时,他也认识到了推测的价值:"事实性只有在你能依赖存在的数据时才可能。但如果你正在生成数据,有时这意味着你正在提出可能没有根据的假设。"
在金融世界中,这种事实与推测之间的平衡将成为AI系统设计的核心考量。
我也思考了合成数据在金融分析中的伦理和法律问题。当AI系统生成看似真实但实际上是合成的财务数据或市场预测时,如何确保用户了解其源头和限制?
这些问题将需要行业标准和监管框架来解决,特别是考虑到金融决策的高风险性质。
另一个关键发展领域是多模态模型在金融中的应用。未来的金融AI可能不仅能理解文本数据,还能分析图表、图像、视频和音频。
例如,它可能能够观看公司财报电话会议的视频,不仅理解所说的内容,还能分析高管的语气和肢体语言,从而获得更全面的图景。
这种多模态分析可能会揭示纯文本分析无法捕捉的微妙信号。
最后,我认为未来最成功的金融AI将不仅仅关注技术性能,更关注如何真正增强人类能力。正如Samaya的Andrea Cortoni所强调的,人机交互是关键。
金融决策通常涉及复杂的价值判断和风险评估,这不仅需要数据分析,还需要经验和直觉。真正出色的AI系统将能够补充人类的这些能力,而不是试图取代它们。
文章来自于 “深思圈”,作者 :Leo
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/