Z Potentials|对话质变科技CEO离哲:大模型决定上半场,数据和工程能力决定下半场

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Z Potentials|对话质变科技CEO离哲:大模型决定上半场,数据和工程能力决定下半场
5486点击    2025-09-16 15:48

Z Potentials|对话质变科技CEO离哲:大模型决定上半场,数据和工程能力决定下半场


导语


在大厂内部“从0到1”推动并构建数据基础设施十余年之后,离哲选择走向台前,开启一场真正意义上的“从技术到产品、从产品到服务闭环”的创业实验。


离哲本名占超群,曾从无到有搭建起国内营收最高的云原生数据仓库体系,也曾因践行数据价值最大化的愿景积极参与数据业务设计,担任阿里妈妈核心商业化项目达摩盘架构师与“城市大脑”多个项目总架构师。


对“云 + AI”趋势的敏锐判断,使离哲加入了质变科技,一家追求质变价值、估值数亿美金融资数千万美金、有机会重新定义AI时代数据基础设施的公司,重新定义数据、云、智能的一体化新范式。真正让他坚信并全力押注这一方向的,是ChatGPT的发布。离哲回忆,那一天,他正在休假,深度使用ChatGPT的那一刻,他立即意识到:这不仅是一项技术突破,更是一次足以重构整个数据范式的深刻变革。这种冲击是颠覆性的,也让他彻底确信——传统数据仓库的技术体系与产品逻辑将迎来一场前所未有的洗牌,数据价值最大化迎来质变时刻。


基于对行业趋势的深刻洞察,质变科技推出了Powerdrill Bloom——一款以“代码”为核心载体的数据智能体产品。它通过将用户需求动态转化为以思维树为中心的代码链,实现可解释、可干预、可执行的代码逻辑,打破了传统“Chat+数据库”模式的局限,实现了严肃业务场景下的可解释性、可控性与闭环执行。


在他看来,“未来五年,软件的形态将发生根本性变革。云的体系结构正处于爆发前夜,而AI的发展则会彻底改变数据的使用方式和应用场景。”


他提出了一个与主流视角不同的判断:AI时代,“ToB/ToC”的用户市场迎来融合,AI时代产品将从“用户容忍度”基准出发去划分可行性边界。内容创作等高容忍度领域,更适合大模型驱动的多样化、创造性输出,而制造等低容忍度的行业,对输出准确性几乎零容错,AI应用门槛极高。


在他看来,数据分析、决策属于“中等容忍度”场景,既要求输出的高准确性和可解释可追溯性,又存在用户查询表述模糊、数据环境和需求繁杂且实时变化的挑战。传统“Chat+数据库”的Data Agent模式难以胜任——生产环境中严肃的数据业务,需要采用全新的类人交互方式以及可解释、可干预、可控的交付标准,而不仅仅是一个“问答机器人”。


“我们打造的不仅仅是一个工具,而是一种新的数据价值服务”,离哲说,“就像移动互联网不是‘更方便更即时的网页’,AI时代的数据智能体也不该只是‘更聪明的BI’。我们要打通从一个模糊的Idea出发,到交付可执行层面Action的完整链条。”


随着Anthropic Claude 4.0、OpenAI GPT5.0等旗舰模型以及配套的Multi-Agent的发布,大模型公司快速吞噬了很多Agent公司的市场,以至于大模型公司成为很多创业者头上的达摩克利斯之剑。离哲认为,大模型公司抢占了AI 上半场,模型能力的爆发,建立了用户心智和使用习惯,在创意内容等高容忍度场景通吃。而在严肃可靠的、更大规模的生产力场景,数据和工程能力将是核心壁垒,探索区别于chat的创新交互方式、优秀的数据工程能力,才能真正实现生产力提升,而这也是质变科技追求并坚定投入的方向。


创业是一场关于远见、判断和执行力的接力。他始终笃信:“真正的突破来自长期积累、机遇以及质变级创新。”


此次,Z Potentials对话了质变科技 CEO 离哲,他与我们分享了从阿里出走创业的底层动因,对Powerdrill Bloom这款类人智能体产品的定位思考,以及对当前AI Agent市场的深度观察。enjoy~


  • 我认为云计算还有很大的机会。这和大家普遍认为的"云计算已经是昨日黄花,只是大厂的规模化生意且技术发展缓慢"完全不同。未来五年,软件的形态会发生根本性变革,以结果为导向的AI计算服务会规模出现。这个变革就像2003年之前,人们无法想象手机会催生移动互联网的全新应用形态。现在云的体系结构变革同样处于爆发前夜,一切刚刚开始。


  • AI会彻底改变数据的使用方式和场景。以前的数据分析主要服务于高管,帮助他们看报表、做运营决策;但未来,如果AI足够强大,结合数据能力,它可以直接赋能一线人员,比如零售店的店长、快餐店的店员,帮他们优化进货、个性化经营、个性化决策,真正提升效率而不是没有赢家的卷。


  • 我个人一直想做颠覆性的创新,做基础技术久了就会发现,真正的突破往往来自长期积累、拥抱大机遇大变革大场景。AI时代,ToC和ToB用户市场迎来融合,基于"用户容忍度"基准去划分AI产品的可行性边界更具价值。AI本质上是一条高度通用且极为强大的拟合曲线,这就决定了它在解决问题时必然会遇到"容忍度"的问题。


  • 目前Data agent的产品成熟度和标准还处于初期。海外Wisdom融资2300万美元,Julius累计融资超千万美元,国内大厂也都有自己的Data agent产品。这些产品都处于早期探索阶段,行业普遍做法是提供一个Chat界面,后面连接数据文件如excel或数据库,生成简单的工作流和指标计算。但这种方式用户使用频率很低,因为让大部分用户提出问题、提准问题、提好问题非常难,用户的私有数据是一个没有流动的封闭沼泽,并且结果满意度也很低。


  • 我们有两个目标:第一,在Data agent领域,希望未来三年达到1000万用户规模。同时要在可行动级生产力层面,至少在2-3个细分场景做到全球领先。


01 十余年阿里生涯后,离哲投身创业,押注云与数据的AI革命


ZP:首先请您介绍一下自己和自己的经历。


Z Potentials|对话质变科技CEO离哲:大模型决定上半场,数据和工程能力决定下半场


离哲:大家好,我本名占超群,花名离哲。花名从2011年使用至今已有十四五年了,已经习惯大家叫我离哲了。我的职业生涯可以分为几个重要阶段。毕业后是在电信行业做大数据平台开发,2011年加入阿里巴巴后,从零开始构建实时数据仓库和云原生数据仓库体系,做了十余年。期间还担任过阿里妈妈达摩盘架构师和城市大脑架构师,专注于大数据与AI的结合应用,特别是在超大规模场景下。我们研发的产品最终成为中国营收最高的云原生数据产品,并服务了多个国家部委级的客户以及多家超大型互联网客户。


期间,出于对数据和AI领域研究的深度兴趣,我选择到清华大学读博,研究方向是数据库与AI的融合。目前在学术研究上也取得了一些成果,包括获得浙江省科技进步一等奖,在数据库顶会发表多篇论文,还参与了一些创新性的数据库研发工作,比如全球首发的非结构化与结构化数据一体化的向量数据库(AnalyticDB-V)、全索引数据仓库等。早期向量数据库这类技术主要应用于音视频等多模态数据的存储、检索与分析,如今应用场景已经更加广泛。


从职业发展的整体脉络来看,我主要经历了从自研技术到工具,再到产品化和商业化的完整过程。这个过程中积累了从技术到规模商业化的完整经验。


ZP:您能详细分享下在阿里的这11年职业生涯中,主要取得了哪些成绩?


离哲:在阿里的11年可以分为几个重要阶段:


第一个阶段是2011到2013年底,思考如何将技术转化为工具。当时淘宝需要一个能够支撑其庞大规模的新型数据仓库系统,用于商家经营指导,比如帮助商家分析热门商品和进货、选品。这个挑战非常大,数据量达到几千亿到上万亿级别,需要实现用户可实时交互、自由探索的体验。当时整个业界都没有现成的解决方案,我们创新性地开发了一套结合全索引、数据库技术以及分布式计算的新型数据仓库架构,实现了万亿级数据的毫秒级分析,这在当时是全球首创,后来我们还就此发表了顶级会议论文。


第二个阶段是将这个工具产品化。我们把实时数据仓库从工具形态转变为自助服务产品,让用户可以自助开通使用。这个产品后来接入了阿里巴巴集团几乎所有的业务系统。


第三个阶段将产品商业化,2015年是阿里云上最早推出的数据类产品之一。


第四个阶段是从2017年开始构建全球竞争力。当时去硅谷交流学习并开始组建全球化研发团队,深刻认识到云计算将改变软件的形态而不只是软件上云。于是我们开始重构产品,实现云原生化,推进离在线一体化、存算分离等新技术和架构。到2019年,我们的团队在海外已经发展到近30人规模,产品在云原生数据仓库领域取得了显著的技术突破,特别是在性能和成本方面表现优异,我们获得了TPC-H、TPC-DS基准测试全球第一的成绩,这是中国公司首次在双榜单上登顶。同时,我们也在东南亚市场拓展业务,服务了很多国际化客户。这样逐步完成了从工具到产品,再到全球化有竞争力商品的完整演进过程。


还有两段特别的经历:一是我当时在做的数据仓库需要找最大规模、最有价值的场景,主动去担任阿里集团重大项目达摩盘架构师。达摩盘是第一个真正实现数据业务化的产品,可以在超大规模数据下构建客户数据营销平台,被写入了阿里巴巴2017 年的IPO说明书。二是作为城市大脑的架构师,主导构建超大规模上海城市大脑架构,这套云服务成功服务了中国国际进口博览会,这其中就涉及到大规模向量数据库实现非结构化与结构化数据一体化。


总的来说,我的工作主要围绕两条主线:一是完成技术从工具到产品再到全球化商品的持续演进;二是寻求在全球性的大规模应用场景实现数据价值最大化。在商业上,我们打造了中国营收最高的云原生数据产品;在技术上,我们获得了全球权威的TPC-H、TPC-DS榜单第一名。同时,组建美国团队,专门研究Data和AI的一体化融合以及其它技术创新。


ZP:从阿里离职创业是基于哪些考虑?


离哲:主要有两个考虑。第一个是行业发展趋势,我认为云计算还有很大的机会。这和大家普遍认为的"云计算已经是昨日黄花,只是大厂的规模化生意且技术发展缓慢"完全不同。云计算的发展其实已经经历了四个阶段:第一阶段是虚拟化,把传统硬件资源进行虚拟化;第二阶段是在虚拟化基础上,让传统软件适配云端环境;第三阶段是利用云的资源池化进行改造,比如容器化、存算分离等技术;第四阶段是云原生重构,软件从设计第一天就基于云的特性重新构建,而不是把现有软件简单迁移上云。未来五年,随着网络带宽发展到Tb级别,延迟到微秒级别,硬件性能持续突破,硬件规格越来越丰富,软件的形态会发生根本性变革。


比如AWS已经有超过1000种虚拟机形态,包括FPGA、GPU、ARM芯片以及专用计算单元;Amazon Elastic Container Service 每周启动近百亿次,AWS Lambda 每月处理请求近百万亿次;传统以本地化优先、一体化的架构将不再适用。这个变革就像2003年之前,人们无法想象手机会催生移动互联网的全新应用形态。现在云的体系结构变革同样处于爆发前夜,我认为这还只是刚开始。


我们可以畅想一下,基于最先进的云计算基础技术的软件会是什么样子?结合 AI 呢,那又是一个全新的想象空间,这一轮的 AI 变革会将传统 IT 技术的过程思维转向结果思维,用户如果只关心结果不关注过程,还需要有中间件吗?还需要今天复杂的软件分层吗?


第二个机会点是AI。AI会彻底改变数据的使用方式和场景,会大幅缩短业务价值探索周期。举个例子,过去大家需要懂数据库、会建表、会写SQL、建设数据中台等,但在AI时代,这些可能都不再需要——现在大家已经看到了这个趋势,但在2022年时很多人还没意识到。以前的数据分析主要服务于高管,帮助他们看报表、做运营决策;但未来,如果AI足够强大,结合数据能力,它可以直接赋能一线人员,比如零售店的店长、快餐店的店员,帮他们优化进货、个性化经营、决策、行动,真正提升生产和运营效率。


此外,AI还会大幅提升数据的价值,降低数据价值挖掘的门槛,过去我们主要处理结构化数据(我们是全球率先投入向量数据库的团队之一,最早在全球顶会发表向量数据库论文),但在AI时代,所有的视频、音频都会被数据化、AI化,数据的规模和价值将远超以往,AI 将大幅降低行业 know-how 的壁垒。基于这两点我决定出来创业。


我一直想做颠覆性的创新,做基础技术久了就会发现,真正的突破往往来自长期积累、拥抱大机遇大变革大场景。记得2011年,那时候SSD 容量不大并且单 GB 成本是 HDD 的几十倍,我当时就预判到SSD(Solid State Disk:固态硬盘)在数据分析领域会取代传统硬盘,会越来越便宜并且能给分析带来质变的效果提升,因此我们最早采用全索引技术以及分布式架构完全基于 Local SSD以及分布式存储来设计,让淘宝商家能实现万亿数据的毫秒级分析,真正实现大数据实时探索和洞察。2013年,我判断云是未来,于是带领团队把产品重构上云,成为阿里集团内第一个非阿里云 BU上云的产品。到了2017年,我们又预见到云原生会对数据仓库带来质变,于是开始做存储计算分离、湖仓一体等创新。到了2022年,我认为云和AI的结合会催生一个全新的技术和市场,这是一个前所未有的机会,值得全力以赴。做基础技术,第一要有长期主义,第二要有足够好的vision(远见)。


02 数据智能体的关键不是Chat,而是端到端的可决策、可行动


Z Potentials|对话质变科技CEO离哲:大模型决定上半场,数据和工程能力决定下半场


ZP:简要介绍一下Bloom这款产品?


离哲:Powerdrill Bloom(https://powerdrill.ai/bloom)本质上是一个面向一线用户的类人通用智能体。它的核心功能是帮助用户实现个性化、产品级的数据管理、洞察、决策和行动。


具体来说,我们想解决一个关键问题:在企业和组织中,很多人面临一个巨大的挑战,就是如何将一个模糊的目标或想法转化为可靠的行动决策。这个从想法到行动的鸿沟,传统的BI工具没能很好地解决,当然更无法服务一线员工。虽然我们以“数据智能体”的形态出现,但我们真正想做的,是一个类人通用智能体。它能够帮助用户,从一个模糊的目标/想法/期待出发,逐步走向可以落地的实际结果。在这个过程中,它不仅承担决策层的角色,也提供端到端的可决策、可行动,这就是我们产品的核心。


简单来说,我们希望打造一个类人的通用智能体:用人的思维方式,结合最新的大模型技术、自研的Multi-Agent和TableLLM以及我们多年来积累的数据工程能力和重大技术升级(质变科技即将推出下一代 AI Data Infra,MemoryLake记忆湖),帮助用户从第一步构建可靠的感知与决策能力,在此之上扩展决策行动能力,如自动生成报告、PPT,对接各类SaaS软件,真正实现精细化运营的闭环。


Z Potentials|对话质变科技CEO离哲:大模型决定上半场,数据和工程能力决定下半场


我们的目标用户是那些需要解决实际问题的企业员工和专业人士。可以是企业一线员工比如门店店长,也可以是知识工作者如分析师和管理者,或自由职业者、教授、学生等。目前典型的使用场景包括零售门店店长优化运营决策,投资人进行投资分析,学术研究者处理实验数据、网站运营优化,以及企业员工解决具体业务问题。核心特点是用户有模糊的目标,需要通过创新技术抽丝剥茧找到可靠的决策依据,并转化为实际行动方案。


ZP:Bloom产品之前,团队定位在Data Infra方向,现在重点强化了AI能力,这个转变背后的思考是什么?


离哲:这与公司的基因和发展理念相关,我们公司叫“质变科技”,这个名字就体现了我们的核心理念,量变引发质变。在当前竞争环境下,像我们这样的创业公司要想在众多大厂和海外巨头的夹缝中生存发展,必须带来真正的质变,要么实现5-10倍的效率提升,要么做到5-10倍的成本降低。


团队很多同学深耕数据领域十几年,我们一直在思考如何从数据角度实现这种质变。最初我们更多关注的是数据基础设施层面的创新,比如云原生架构、Serverless等。我们服务过很多大客户,处理过几十万亿级别的数据,在数据仓库领域确实建立了一定优势。但随着AI技术的发展,2023年我们认为AI能带来新的质变。其次,AI时代必然会产生全新的Data Infra。传统的数据仓库主要解决降本问题,而AI时代有机会从增效角度思考怎么带来质变。基于这些思考,我们决定下场打造一个面向AI时代的数据智能体。


这件事要做好,不能简单模仿像Snowflake这样的平台。它们之所以能做好,是因为背后有上千亿美金的市值,具备足够庞大的B 端大客户规模。而我们没有这样的条件,只能探索一条偏向Prosumer(专业C端客户)的能够快速积累用户并验证数据价值的路径,期待有机会在 AI 时代的 Data Infra上做到全球领先。幸运的是,这条路正在逐渐被验证:我们很快会发布全新的 AI 时代以记忆为中心的 Data Infra产品(MemoryLake),目前我们的MemoryLake已经服务了几家超大客户,有的客户数据记录数超十万亿行,有的客户文档数过亿,他们与我们在理念和愿景上高度一致。


ZP:Bloom目前的主要进展如何?过程中您觉得做对了什么?


离哲:Powerdrill Bloom在海外已经积累了近150万用户,这些用户在我们平台上提出了数千万个问题,我们帮助用户生成了超过5000万行代码,同时也服务了不少国内外大客户。


产品层面,我们主要做对了两件事:第一是坚持以Code为核心,以此为基础做到端到端的动态软件设计执行及交付。我们把每个用户需求都动态的转化为可执行的软件程序,这样既保证了分析的严肃性,又实现了结果的可解释性以及可干预性。比如发现单次生成千行代码准确率有限,转而采用"代码链"的分段生成方式效果更好。第二是注重用户规模积累,通过处理数千万用户数据查询需求以及近千万份数据文件,我们积累了宝贵的经验,并以此构建了我们自己的表格大模型以及记忆湖技术,这是壁垒。


基于这些积累,我们正在向新阶段发展,10月份将发布新一代产品,重点是从单一的AI 分析转向真正的可靠决策与行动,这个转变才刚刚开始。


ZP:当前行业的整体情况如何?


离哲:过去大家习惯用ToC和ToB来划分软件市场,但AI时代,这个划分走向融合。当前,我们用"用户容忍度"这个基准来观察行业,AI本质上是一种高度通用且强大的拟合曲线技术,这就决定了它在解决问题时必然会遇到"容忍度"的问题。比如在芯片制造这样的领域,容忍度极低,一次AI的失误可能导致上亿美金的流片损失。而在文案创作、音乐编曲等领域,容忍度就很高,因为这些场景更看重多样性而非绝对精确并且错误后果不产生重大影响。目前大模型主要应用于用户高容忍度场景,比如内容创作、考试研究等,我们认为这类应用很可能会逐渐演变成模型公司的标准化产品。


而中等容忍度的场景,如数据分析,就展现出其特殊性。数据场景有几个显著特点:首先是极高的严肃性,一个数据小数点错误、指标引用失误,可能导致整个报告失效,进而引发严重的商业决策失误。其次是交互方式的特殊性,很多人认为Chat模式(对话模式)适合所有场景,但在严肃领域往往行不通。比如在芯片设计中,一个需求标点符号的差异就可能导致良品率大幅波动,并且在严肃场景下一次性提出一个清晰、准确、好的查询需求很难,我们在服务日本和东南亚市场时发现,客户一个业务场景的描述往往超过3000字。这样的场景明显不再适用于Chat交互,经过两年产品实践和140万用户验证,我们确信Chat交互方式在严肃业务场景中存在明显局限。


除了交互方式的特殊性,数据场景还有几个重要特征:


  • 首先是可解释性和可控性的要求,比如当用户询问"连续三周下跌的子业务是什么"时,不能简单地只返回"业务A"这个结果。企业决策者和一线员工需要清楚地知道这个结论是如何得出的,是基于哪些数据指标计算而来的。否则他们很难放心地将这个结果用于重要汇报或决策。


  • 其次是可干预性,理想的数据分析应该像人类协作(Human-in-the-loop)一样,能够层层递进、逐步验证。比如先给用户一个初步结果预览,如果不合适可以立即调整重新计算,而不是让用户去修改代码或者进行复杂的参数调试。这就像我们在Excel里分析数据时,会先画直方图观察分布,次之再尝试雷达图,通过多次尝试找到最佳分析方式。


  • 第三点是数据丰富度、数据与 Domain(领域知识) 结合的挑战,虽然现在企业拥有大量数据,但在实际分析时常常面临数据维度不足的问题。比如分析100家创业公司,仅凭内部数据的字段很难做出深入判断,往往需要补充行业背景、创始人经历、竞争格局等更多外部信息。


  • 第四点是数据工程能力与个性化的挑战,企业数据规模普遍庞大与复杂,比如人类很好理解的一个 Sheet 包含十几个子区域或多层级关系的Excel、图表与表格混排的 PDF等,如动辄几十个文件或TB级的数据,肯定无法放入Context(大模型上下文),而完全依赖 LLM 驱动去找数据会陷入 Context Rot(上下文腐化)导致分析混乱。


总结来说,数据智能体领域还需要在交互方式、结果可靠性、数据融合、AI 数据工程、个性化等方面实现根本性的创新突破。


而当前行业还处于非常早期的阶段。很多产品仍停留在传统BI或简单Chat交互的层面,远未达到能够满足严肃场景可决策可行动的标准,现在整个市场还处在探索产品形态和发展方向的阶段。


ZP:目前行业竞争情况如何,Bloom的优势和差异化定位?


离哲:目前Data agent产品成熟度和标准还处于初期。海外Wisdom融资 2300万美元,Julius融资超千万美元,国内大厂也都有自己的Data agent产品。但这些产品都处于早期探索阶段,普遍做法是提供一个Chat界面,后面连接数据文件如 excel或数据库,生成简单的工作流和指标计算。但这种方式用户使用频率很低,让大部分用户准确描述数据需求非常困难。比如"消费金额"和"消费总额"差一个字,意思就完全不同。


虽然通用智能体也具备数据分析能力,比如 ChatGPT、Claude、Gemini 以及 Manus 等,但真正落地仍面临诸多挑战。首先,用户往往难以提出清晰的问题;其次,模型是否能准确理解含糊表达,也是个难点;第三,面对大规模数据,比如上传 100 个 Excel 或 500MB 文件,目前主流模型普遍难以承载;最后,很多产品只停留在输出汇总信息,无法真正解决问题,进行结果交付。


综合上述,我们有以下方面的优势:


第一,在规模化数据处理能力上,我们有Data Infra的基因优势。我们的下一代记忆湖技术在客户场景支持十万亿级别数据记录条数、近千亿向量规模,有机会成为真正可用的 AI 时代数据基础设施。


第二,在输出准确性方面,我们在意图理解和数据理解阶段的准确性有壁垒。我们有专门的 Excel 表格模型,能正确识别Excel中一个sheet里的大量子表格和复杂表头,而并非当成一个表格处理;还有我们在冷启动领域知识数据合成、多轮问答 Multi-Step GRPO激励算法的创新。支持我们在全球AI准确性基准测试如 RAG Benchmark、DataAgent Benchmark位居全球首位。


第三,在数据专属场景,我们的产品具备可解释、可干预的特色创新,针对复杂场景提供 Streamline IDE 以及行业知识管理 Studio(未来会发布 Domain 社区)。我们在海外持续积累超过 150 万用户,超过 15000 家企业在使用我们的产品。


第四,基于规模化数据处理能力、准确性上的创新以及开放的 Domain 社区,我们采用类人的沉浸式画布以及数据思维脑图方式,创新的交互方式使用户 95% 以上的场景无需键盘操作解决用户很难提出问题、提准问题、提好问题的痛点,让用户可以采用扩散、收敛、聚焦、行动的可执行模型形成可靠的行动。


总的来说,相比通用智能体和其他数据智能体,我们处理的数据准确性更高、交互最简单、实践最多、规模更大。


03 押注数据AI一体化,打通从数据理解到行动闭环的关键一步


ZP:您现在最关注的北极星指标是什么?这些指标的表现如何?


离哲:我们主要关注两个核心指标:第一,用户上传或构建数据的比例。数据是用户的核心资产,虽然很多通用智能体都支持数据分析,但问题是用户不上传或极少,我们在这方面做得不错。高质量数据的上传比例对我们很重要。


第二个指标每个数据集的平均提问次数。由于AI数据分析存在准确性问题,很多用户尝试一两次后,如果问题没解决就会放弃。目前行业平均水平是每个数据集3-4次,频次不高,基于我们的表格模型以及可解释技术我们能做到10次以上。在结果交付层面,我们关注用户是否真正采取了行动。比如是否将结果推送到SaaS系统,或者下载数据报告、PPT。下载后又回来继续提问,通常说明报告不能满足需求。很多产品在这一步的转化率很低,用户往往只是浏览而不会真正下载使用。


ZP:作为公司CEO,未来几年的计划和目标是什么?


离哲:我们有两个目标:第一,在Data agent领域,希望未来三年达到1000万用户规模。同时要在可行动决策层面,在2-3个细分场景做到全球领先。有些场景可能是跨行业的,比如职业规划、用户增长等通用性需求。第二,在Data infra(数据基础设施)方向,我们希望作为中立的AI Data Infra公司跻身全球领先的技术梯队。目前我们在数据规模处理、记忆体方面已经展现出优势。


ZP:除了产品本身,还有什么非常重要?


离哲:我们本质上是在做AI 时代的最佳实践数据云,从底层的数据存储、计算到数据的理解,再到 AI 驱动下的结果交付和自动执行,尤其涉及到分布式代码的执行能力。我们不仅具备完整的技术链条,在上层还沉淀了大量的最佳实践。


我们公司的定位可以概括为三个关键词:第一,数据基础设施(Data Infra);第二,AI-native,我们的系统为 AI 场景而生;第三,最佳实践驱动,我们在真实业务中不断迭代形成了一套高效方法论。很多公司可能有数据,但不一定有高质量的数据基础设施,更难做到真正的数据驱动。尤其在大规模、高严肃性的业务场景下,能否支撑起端到端的执行,门槛非常高。在这个定位之下,我们会长期围绕这个目标去推进,未来几年都将专注在这一方向。


ZP:在大厂工作多年后选择创业,觉得两者最主要的区别是什么?


离哲:其实在阿里的时候,我就已经有过类似创业的体验,当时从零开始创建了数据仓库等多个产品,很感谢阿里各位主管的信任,给了我很大的自主空间,基本上处于一种大厂内部的创业状态。当时客户信任是我能够坚持技术创新和价值创造最大的动力。真正创业后,最大的不同在于可以用更快的行动,做更大规模的突破性创新。与用户的距离更近了,能够直接感受到他们的需求和反馈,创新也会更 Solid。


当然,创业的挑战也明显更大。在阿里背后有近乎无限的人力和资金支持,现在每个决策都需要反复权衡,很多事情必须亲力亲为,从客户拜访、产品设计、架构、产品原型实现等都要亲自参与,也会参与一些前期原型开发。虽然压力更大,但也很有趣。


ZP:您创业这几年,最痛苦和最快乐的时刻分别是什么?


离哲:我个人比较乐观,快乐的事情挺多。非常多行业顶尖的伙伴愿意加入我们,他们选择我们,一群志同道合的人一起做突破性创新是一件有意义的事。其次就是看到产品真正帮助到客户的时候,当客户反馈我们的产品给他们带来超越预期的改变时,这种成就感是无可替代的。在 Youtube 上,有深度用户会做出很多有意思的实践,这些视频长达十几分钟,好多知名视频博主把我们定义为 Best AI Analytics Tools。


痛苦也有不少,离开阿里这样的平台后,很多事情都要从零开始。比如开拓客户,以前在阿里有成熟的销售体系支持,现在很多客户都需要自己亲自去争取,并且需要让结果/服务远超客户期待;从接触到最终落地周期变得很长。另一个点就是如何在有限的资源下做决策,对事对人对战略都要做大量的取舍,这个过程极具挑战。


ZP:十年后,您对Bloom和自己最大的期待是什么?


离哲:其实我更倾向于思考五年后的发展,我认为未来真正的机遇在于以数据为中心的结果决策、行动以及交付,大模型决定上半场,数据和工程能力决定下半场。虽然现在大家都在谈论AI的价值,但AI始终离不开数据以及很强的工程能力,从模型训练到实际应用都需要数据支撑。我期待Powerdrill Bloom能够做到以数据为中心,实现真正的决策与可靠行动。


我对Powerdrill Bloom充满信心,相信我们有机会成为在数据AI一体化领域带来最大突破和创新的公司。


04 创业路上的深思考:专注长远,快速行动


ZP:过去2-3年AI行业发展迅猛,有没有让您印象特别深刻的事件或人物?


离哲:最深刻的还是ChatGPT的发布。那天我正在休假,当时就意识到这将彻底改变未来的经济形态和数据形态。对我的冲击很大,让我确信传统数据仓库行业将面临洗牌。回来后我们马上组建团队开始研究,基本每天都在看论文和做一些原型实践,着手布局AI 时代的 Data Infra 以及Data agent方向。我们更深入思考了大模型对数据行业的全方位影响,从底层基础设施到上层交互形态。


ZP:可以分享两个您觉得有意思的AI产品吗?


离哲:第一个Claude,是我们团队用得最多的产品,很多同事都充了会员。选择Claude而不是ChatGPT有几个原因:首先我们做数据行业,对准确性和可解释性要求很高;其次Claude的理念与我们一致,它从第一天就以代码编程为核心,比任何公司都更彻底地践行自动化代码开发。在智能体领域,Claude最早把Agentic 这个词讲的最清楚,并提出了Agent workflow概念并做到很好的实践。


第二个是Guidde这个产品。它解决了一个很实际的问题:如何让用户快速上手新产品。传统方式是通过视频教程或弹窗引导,但效果很差。Guidde的创新在于:用户只需操作一遍,它就能通过多模态技术(捕捉鼠标点击位置、提取文字、动态放大重点等)自动生成高质量的使用指南。这个产品虽然不大,但是小而美,但找到了AI落地的精准场景,把文本、视频、音频等多模态技术结合得非常好,而不是一味地追求做出超越当前 AI 能力上限的事情。


ZP:推荐一本最近读过的好书或印象深刻的文章?


离哲:最近主要在看两本关于未来科技发展的书。第一本是《主权个人》,这本书很有洞见地分析了数字革命带来的深刻社会变革。作者很早期就预见了数字货币、数字身份和超级个体的发展趋势,很有想象力的讨论了几次工业革命的社会影响以及信息时代带来的社会变革。这本书虽然是 1997 年出版的,但是其中的远见依旧让人惊叹,其中的思维方法对我们理解信息时代个人与社会关系依旧具有很重要的意义。书中所展现出来那种思想上的前瞻性、冒险精神以及提出来的看来异乎寻常的预见真的太酷了。


第二本是《巴拉吉预言》,这本书主要讨论技术的价值、数字未来畅享以及如何 Build 未来,无论是作为未来规划参考还是作为创业参考都有很有意义。其中的识别真相、共赢(Win and help win)、创新新边界、全栈思维、问题导向、小团队、少无畏争论等很有意思,对创业者来说读起来会比较有共鸣。


ZP:工作之外有什么兴趣爱好可以分享吗?


离哲:工作之外的爱好不多,最近偶尔会打打桌球(打的很一般)。打桌球对视力有帮助,能让眼睛聚焦远处,有助于放松和专注。其实提升视力最好的运动是乒乓球,但乒乓球需要两个人互动,桌球可以一个人安静地打,边打边思考。


最后我想说,因为在阿里时养成了深入思考的习惯,现在创业更是如此。在AI时代,生产力极大提升,Vibe Coding 开始盛行,想法可以快速变现,但如何做长远思考反而更重要。毕竟创业选错方向后果很严重,需要“深思考,快行动”。


文章来自于微信公众号“Z Potentials”。


AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
OpenManus

【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。

项目地址:https://github.com/mannaandpoem/OpenManus


3
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


4
AIExcel公式

【开源免费】smart-excel-ai是一个输入你想要的Excel公式的描述,即可帮你生成对应公式的AI项目

项目地址:https://github.com/weijunext/smart-excel-ai

在线使用:https://www.smartexcel.cc/(付费)

5
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

6
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

7
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

8
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI