三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库
8849点击    2025-11-20 10:07

AI时代,真是啥都要快。


三行代码构建一个AI应用,现在就这样被蚂蚁OceanBase游刃有余地实现了。


三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库


熟悉数据库的朋友都知道,OceanBase是蚂蚁集团于2010年发布的一款全自研的国产企业级分布式关系数据库


历经15年迭代升级,如今它不仅在权威测评中稳居国产数据库第一梯队,其稳定性更是经过了“双十一”等高并发场景的持续验证。


悄悄补充一句,OceanBase还在现场秀出了最新成绩单——全球客户数已突破4000家,连续五年年均增速超100%,服务覆盖16个国家和地区、60多个地域、240多个可用区。


而且截至今年5月,经过四年开源实践,OceanBase已形成拥有超过25000名开发者的活跃社区,累计下载量突破百万


三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库


但随着AI时代的到来,OceanBase也迎来了新的考验:


AI时代需要怎样的数据库?OceanBase如何继续保持领先?


一切答案,都藏在刚刚落幕的2025 OceanBase年度发布会上了——


这一次,他们不是用语言,而是用实打实的产品给出最新思考。


面向AI时代的原生混合搜索数据库


具体而言,OceanBase发布并开源了其首款AI数据库——OceanBase seekdb(简称seekdb)。


发布会上的介绍是酱婶儿的:


开发者仅需三行代码,即可快速构建知识库、智能体等AI应用,轻松应对百亿级多模数据检索,真正实现“开箱即用”的AI数据基座。


三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库


MIT的一项研究显示,超95%的企业AI项目因多模态数据割裂、系统链路冗长、权限管理复杂难以落地。


而seekdb正是在这些痛点上下文章:


过去在做交易和分析时,行业主要关注数据库中的查询以及数据分析等功能,但在AI应用场景下,除了交易和分析功能外,更需要对不同类型和模块的数据进行混合检索和综合利用。


在OceanBase CTO杨传辉看来,这是与传统最大的区别,也是当前行业普遍面临的挑战。换言之:


混合搜索,正在成为AI原生数据库的“分水岭”。


于是,他们就为seekdb配备了AI原生混合搜索能力


它支持在一个查询中融合向量检索、全文搜索与标量过滤,采用“粗排+精排”多阶段检索机制,在低延迟的同时提升精度。依托成熟的事务引擎,它支持实时写入与ACID一致性,并兼容MySQL生态。


此外,seekdb支持标量、向量、文本、JSON和GIS等多模数据的统一存储与检索。例如,在反欺诈场景中,可直接查询“近7天交易超5万元、位置异常且行为类似历史欺诈样本”,无需跨系统调用,兼顾性能与安全。


三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库


而针对落地难的问题,seekdb也支持极简部署,开箱即用


据介绍,seekdb最低仅需1核CPU、2GB内存,支持pip install一键安装、秒级启动,兼容嵌入式与客户端/服务器双部署模式,可轻松集成至智能Agent、开发工具链或本地应用,大幅降低AI应用的工程门槛。


这就好比将一套企业级数据库的复杂度,降低到了像使用一个普通Python库一样简单,从而让开发者能专注于AI应用逻辑本身,而非底层基础设施的运维。


三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库


最后,OceanBase这次还把seekdb给开源了。


采用开发者友好的Apache 2.0协议,用户可自由使用、修改和扩展。


而且产品全面兼容HuggingFace、Dify、LangChain等30余种AI框架及MCP大模型协议,无缝融入AI生态;并提供SQL及PythonSDK,适配不同开发习惯。


三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库


整体而言,在OceanBase CEO杨冰看来,AI的真正瓶颈不在模型,而在数据


尤其在金融、政务等高敏场景,AI需在毫秒级完成实时推理,并安全融合私有数据。而传统架构依赖多系统拼接数据链路,不仅复杂低效,还易引发权限混乱与延迟风险。他表示:


seekdb不是传统数据库的功能叠加,而是专为AI时代重构的AI原生数据库


它继承OceanBase的代码和设计理念,更轻量、更敏捷,目标是成为大模型与私有数据融合计算的‘实时入口层’。


而且,作为OceanBase“Data×AI”战略的关键一环,seekdb既可独立使用,也可融入新发布的OceanBase 4.4一体化融合版本


三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库


该版本首次将TP(联机事务处理)、AP(联机分析处理)与AI能力集成于单一内核,兼具分布式扩展、多云部署与金融级高可用,以帮助企业避免后期架构重构。


据悉其商用LTS版本将于2026年2月2日推出。


还开源了这些


与此同时,OceanBase还开源了一系列工具。它们与seekdb一起,构成了OceanBase面向AI应用的完整工具链,覆盖数据管理、检索、解析、记忆等关键环节。


智能文档解析框架PowerRAG


PowerRAG是OceanBase基于其“混合搜索”能力打造的、源自蚂蚁内部实践的企业级RAG(检索增强生成)解决方案。


一旦开发者需要构建一个企业知识库、智能客服等AI应用,直接用PowerRAG,就可以省去自己组合多种工具(向量数据库+全文搜索引擎+关系数据库)、并反复调优以达到生产标准的繁琐过程。


三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库


分层记忆架构PowerMem


PowerMem核心解决,如何让大模型更高效、更智能地记住和管理与用户互动的上下文信息。


它充当了一个外部的、可无限扩展的“记忆仓库”,帮助AI应用(尤其是智能体Agent)存储、检索和利用海量的历史对话、用户偏好、知识片段等上下文信息。


在记忆体领域的权威评测基准LoCoMo Benchmark上,它以73.70分登顶SOTA,Token消耗降低96%,大幅节省了推理成本。


三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库


至此,通过以上这些开源发布,面对“AI时代我们需要怎样的数据架构”这一问题,OceanBase给出的答案也很清晰了——


通过“多负载+多模+混合多云”实现数据统一,并通过“弹性底座+原生多租户/混合搜索”实现智能与效率


换句话说,OceanBase正在用一套覆盖多负载、多模态、混合多云的统一数据底座,把企业里分散在不同系统、不同格式、不同云环境中的数据重新“拉”回一张桌子上;再用弹性底座、原生多租户(单集群多业务隔离)与混合搜索,让这些数据既能被安全管理,又能被AI实时高效地调用。


三行代码就能手搓一个AI应用!蚂蚁OceanBase开源其首款AI数据库


这意味着,AI时代的企业不必再为一个应用拼几十个系统,而是只需要一个能同时处理交易、分析、搜索与AI推理的统一数据库内核。就像大会过程中提到的那样:


想开发AI应用,现在只需一个数据库了。


以及动手能力强的童鞋现在就能试试,用三行代码手搓一个AI应用(doge)。


seekdb开源地址:

https://github.com/oceanbase/seekdb


文章来自于“量子位”,作者 “一水”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

4
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

5
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/