Pinecone 推出 OneLake 集成方案,让 AI 智能体直连企业数据

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Pinecone 推出 OneLake 集成方案,让 AI 智能体直连企业数据
8344点击    2026-07-04 14:11

Pinecone宣布 旗下 Nexus 知识引擎将与 Microsoft OneLake 实现新的集成,从根本上改变企业 AI 智能体访问和推理企业数据的方式。这项集成在 Microsoft Build 2026 大会上正式发布,允许 AI 智能体通过预构建的结构化知识工件(非传统的检索管道)查询存储在 OneLake 中的企业信息。Pinecone 表示,此举可将大语言模型的词元消耗降低 95% 以上,任务执行速度提升高达 30 倍,并改善企业 AI 工作负载的完成率。


Pinecone 推出 OneLake 集成方案,让 AI 智能体直连企业数据

这一公告折射出企业在生产环境中部署 AI 智能体时面临的日益严峻的挑战。尽管许多企业已成功将运营数据集中存储在 Microsoft Fabric 和 OneLake 中,但 AI 系统通常需要花费大量时间和计算资源来检索、组装和解释原始信息,然后才能完成任务。Pinecone 的 Nexus 平台试图将大部分工作前置,通过提前生成结构化、任务特定的知识工件让智能体能够接收带有上下文信息和引用的响应,而非原始数据集。


该集成的核心是 Nexus,Pinecone 将其定义为专为 AI 智能体量身打造的知识引擎。Nexus 无需智能体在运行过程中检索文档并自行推理,而是动态生成适配具体任务的知识组件,内置相关数据、权限配置、上下文信息与来源引用,后续智能体可借助 Pinecone 自研的知识检索查询语言 KnowQL 对这些组件发起查询。


该方案与当下企业 AI 部署主流的 检索增强生成(RAG)架构形成显著差异。传统 RAG 系统通常需要多次检索调用、排序操作、提示词组装阶段以及昂贵的大语言模型交互才能得出答案。Pinecone 认为,这些架构在业务扩容后效率会越来越低,导致成本上升、性能不稳定,以及随着工作负载增长任务完成率下降。


该集成建立在 OneLake 作为 Microsoft Fabric 中央数据层日益普及的基础上。使用 Fabric 的企业通常会将结构化数据、商业智能资产、文档、运营记录和分析工作负载整合到 OneLake 中,为 AI 应用和数据驱动服务创建了统一的基础。Nexus 可直接连接到这一生态系统,无需企业将数据迁移到单独的向量存储或构建额外的摄取管道。


智能体执行任务时,Nexus 会直接查询 OneLake,应用基于角色与属性的权限校验,生成适配的知识组件并返回结构化响应。Pinecone 表示,每一个响应都会标注数据来源,同时针对个人身份信息,严格遵循企业既定治理策略,实现合规控制。


该公告最突出的一大亮点是对运营效率的关注。随着企业从 AI 实验转向生产部署,推理、检索和上下文生成的成本已成为核心痛点。企业普遍遇到一个问题:智能体负载在跨部门、跨业务流程扩张后,词元消耗量难以预估,基础设施成本也随之持续走高。


Pinecone 将 Nexus 定位为解决这一问题的解决方案,将知识准备与运行时推理分离。企业无需反复要求前沿模型解释原始企业数据,而是可以预组装优化后的知识结构,供智能体直接使用。Pinecone 表示,这显著降低了延迟和模型使用量,同时提高了稳定性和数据治理能力。


该公告发布的当下,业界正 关注 众多供应商提出的 AI 智能体“知识层”概念。随着企业部署越来越多的自主和半自主智能体,人们的注意力正从模型本身转向为这些模型提供精准、可控且具备上下文关联信息的配套基础设施。


各大主流技术厂商正通过不同方式朝着同一方向布局。微软一直在扩展其 Fabric 生态系统,近期推出相关方案,意在为企业智能体搭建统一上下文层。与此同时,Databricks、Snowflake 和 MongoDB 等公司一直在向量搜索、语义检索和 AI 原生数据架构方面大力投入,致力于打通企业数据存储与生成式 AI 应用之间的壁垒。


Pinecone 战略的差异化在于侧重构建可复用的结构化知识组件,而非把每一次 AI 交互都当作全新的检索任务。这也契合行业整体发展趋势:行业重心不再单纯聚焦模型性能迭代,而是转向优化智能体 AI 系统的成本效益与运行稳定性。


OneLake 集成是 Pinecone 布局“知识基础设施”的最新动作。近期发布的产品包括 Nexus、KnowQL、Marketplace 以及新的区域部署,由此可见其正从向量数据库厂商转型打造面向企业 AI 智能体的底层基础平台。


查看英文原文:


https://www.infoq.com/news/2026/06/pinecone-ai-agents-onelake/



文章来自于微信公众号 “InfoQ”,作者 “InfoQ”

AI转型,免费服务,就找AITNT
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0