一种基于融合架构的端侧RAG实现方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于融合架构的端侧RAG实现方法及系统
申请号:CN202511555268
申请日期:2025-10-29
公开号:CN121029322A
公开日期:2025-11-28
类型:发明专利
摘要
本发明提供了一种基于融合架构的端侧RAG实现方法及系统,方法包括通过用户浏览器对向量化引擎进行初始化,以得到初始化向量模型;基于初始化向量模型对本地文本知识库进行向量化处理,以得到向量知识库;获取用户下发的查询文本,基于查询文本与向量知识库进行检索查询,以输出检索结果;基于当前网络环境对全周期工作量进行智能决策,以实现动态计算卸载;对全周期数据进行加密、存储与验证,以完成端侧RAG的实现,本发明替代传统云端向量计算架构,通过纯前端计算架构实现AI工作流的零服务端成本运行,解决中心化AI平台算力贵、延迟高、隐私差三大痛点。
技术关键词
文本 工作量 周期 降级策略 生成向量 参数获取设备 生成加密密钥 加密数据 动态 位置指针 决策 适配器 处理器 网络 加密算法 云端 模块