三行代码就能手搓一个AI应用！蚂蚁OceanBase开源其首款AI数据库

10783点击 2025-11-20 10:07

AI时代，真是啥都要快。

三行代码构建一个AI应用，现在就这样被蚂蚁OceanBase游刃有余地实现了。

熟悉数据库的朋友都知道，OceanBase是蚂蚁集团于2010年发布的一款全自研的国产企业级分布式关系数据库。

历经15年迭代升级，如今它不仅在权威测评中稳居国产数据库第一梯队，其稳定性更是经过了“双十一”等高并发场景的持续验证。

悄悄补充一句，OceanBase还在现场秀出了最新成绩单——全球客户数已突破4000家，连续五年年均增速超100%，服务覆盖16个国家和地区、60多个地域、240多个可用区。

而且截至今年5月，经过四年开源实践，OceanBase已形成拥有超过25000名开发者的活跃社区，累计下载量突破百万。

三行代码就能手搓一个AI应用！蚂蚁OceanBase开源其首款AI数据库

但随着AI时代的到来，OceanBase也迎来了新的考验：

AI时代需要怎样的数据库？OceanBase如何继续保持领先？

一切答案，都藏在刚刚落幕的2025 OceanBase年度发布会上了——

这一次，他们不是用语言，而是用实打实的产品给出最新思考。

面向AI时代的原生混合搜索数据库

具体而言，OceanBase发布并开源了其首款AI数据库——OceanBase seekdb（简称seekdb）。

发布会上的介绍是酱婶儿的：

开发者仅需三行代码，即可快速构建知识库、智能体等AI应用，轻松应对百亿级多模数据检索，真正实现“开箱即用”的AI数据基座。

三行代码就能手搓一个AI应用！蚂蚁OceanBase开源其首款AI数据库

MIT的一项研究显示，超95%的企业AI项目因多模态数据割裂、系统链路冗长、权限管理复杂难以落地。

而seekdb正是在这些痛点上下文章：

过去在做交易和分析时，行业主要关注数据库中的查询以及数据分析等功能，但在AI应用场景下，除了交易和分析功能外，更需要对不同类型和模块的数据进行混合检索和综合利用。

在OceanBase CTO杨传辉看来，这是与传统最大的区别，也是当前行业普遍面临的挑战。换言之：

混合搜索，正在成为AI原生数据库的“分水岭”。

于是，他们就为seekdb配备了AI原生混合搜索能力。

它支持在一个查询中融合向量检索、全文搜索与标量过滤，采用“粗排+精排”多阶段检索机制，在低延迟的同时提升精度。依托成熟的事务引擎，它支持实时写入与ACID一致性，并兼容MySQL生态。

此外，seekdb支持标量、向量、文本、JSON和GIS等多模数据的统一存储与检索。例如，在反欺诈场景中，可直接查询“近7天交易超5万元、位置异常且行为类似历史欺诈样本”，无需跨系统调用，兼顾性能与安全。

三行代码就能手搓一个AI应用！蚂蚁OceanBase开源其首款AI数据库

而针对落地难的问题，seekdb也支持极简部署，开箱即用。

据介绍，seekdb最低仅需1核CPU、2GB内存，支持pip install一键安装、秒级启动，兼容嵌入式与客户端/服务器双部署模式，可轻松集成至智能Agent、开发工具链或本地应用，大幅降低AI应用的工程门槛。

这就好比将一套企业级数据库的复杂度，降低到了像使用一个普通Python库一样简单，从而让开发者能专注于AI应用逻辑本身，而非底层基础设施的运维。

三行代码就能手搓一个AI应用！蚂蚁OceanBase开源其首款AI数据库

最后，OceanBase这次还把seekdb给开源了。

采用开发者友好的Apache 2.0协议，用户可自由使用、修改和扩展。

而且产品全面兼容HuggingFace、Dify、LangChain等30余种AI框架及MCP大模型协议，无缝融入AI生态；并提供SQL及PythonSDK，适配不同开发习惯。

三行代码就能手搓一个AI应用！蚂蚁OceanBase开源其首款AI数据库

整体而言，在OceanBase CEO杨冰看来，AI的真正瓶颈不在模型，而在数据。

尤其在金融、政务等高敏场景，AI需在毫秒级完成实时推理，并安全融合私有数据。而传统架构依赖多系统拼接数据链路，不仅复杂低效，还易引发权限混乱与延迟风险。他表示：

seekdb不是传统数据库的功能叠加，而是专为AI时代重构的AI原生数据库。

它继承OceanBase的代码和设计理念，更轻量、更敏捷，目标是成为大模型与私有数据融合计算的‘实时入口层’。

而且，作为OceanBase“Data×AI”战略的关键一环，seekdb既可独立使用，也可融入新发布的OceanBase 4.4一体化融合版本。

三行代码就能手搓一个AI应用！蚂蚁OceanBase开源其首款AI数据库

该版本首次将TP（联机事务处理）、AP（联机分析处理）与AI能力集成于单一内核，兼具分布式扩展、多云部署与金融级高可用，以帮助企业避免后期架构重构。

据悉其商用LTS版本将于2026年2月2日推出。

还开源了这些

与此同时，OceanBase还开源了一系列工具。它们与seekdb一起，构成了OceanBase面向AI应用的完整工具链，覆盖数据管理、检索、解析、记忆等关键环节。

智能文档解析框架PowerRAG：

PowerRAG是OceanBase基于其“混合搜索”能力打造的、源自蚂蚁内部实践的企业级RAG（检索增强生成）解决方案。

一旦开发者需要构建一个企业知识库、智能客服等AI应用，直接用PowerRAG，就可以省去自己组合多种工具（向量数据库+全文搜索引擎+关系数据库）、并反复调优以达到生产标准的繁琐过程。

三行代码就能手搓一个AI应用！蚂蚁OceanBase开源其首款AI数据库

分层记忆架构PowerMem：

PowerMem核心解决，如何让大模型更高效、更智能地记住和管理与用户互动的上下文信息。

它充当了一个外部的、可无限扩展的“记忆仓库”，帮助AI应用（尤其是智能体Agent）存储、检索和利用海量的历史对话、用户偏好、知识片段等上下文信息。

在记忆体领域的权威评测基准LoCoMo Benchmark上，它以73.70分登顶SOTA，Token消耗降低96%，大幅节省了推理成本。

三行代码就能手搓一个AI应用！蚂蚁OceanBase开源其首款AI数据库

至此，通过以上这些开源发布，面对“AI时代我们需要怎样的数据架构”这一问题，OceanBase给出的答案也很清晰了——

即通过“多负载+多模+混合多云”实现数据统一，并通过“弹性底座+原生多租户/混合搜索”实现智能与效率。

换句话说，OceanBase正在用一套覆盖多负载、多模态、混合多云的统一数据底座，把企业里分散在不同系统、不同格式、不同云环境中的数据重新“拉”回一张桌子上；再用弹性底座、原生多租户（单集群多业务隔离）与混合搜索，让这些数据既能被安全管理，又能被AI实时高效地调用。

三行代码就能手搓一个AI应用！蚂蚁OceanBase开源其首款AI数据库

这意味着，AI时代的企业不必再为一个应用拼几十个系统，而是只需要一个能同时处理交易、分析、搜索与AI推理的统一数据库内核。就像大会过程中提到的那样：

想开发AI应用，现在只需一个数据库了。

以及动手能力强的童鞋现在就能试试，用三行代码手搓一个AI应用（doge）。

seekdb开源地址：

https://github.com/oceanbase/seekdb

文章来自于“量子位”，作者 “一水”。

关键词: AI新闻 , AI数据库 , OceanBase , OceanBase seekdb , seekdb

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目，提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信，飞书的AI项目都基于该项目二次开发。
项目地址：https://github.com/labring/FastGPT

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI

AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架，其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址：https://github.com/InternLM/MindSearch
在线使用：https://mindsearch.openxlab.org.cn/

【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费，搜索结果包含文本，图片，视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目，测试搜索结果最好。
项目地址：https://github.com/miurla/morphic/tree/main
在线使用：https://www.morphic.sh/