AI资讯新闻榜单内容搜索-rag

开源免费！推荐一款基于DeepSeek大模型RAG知识库与知识图谱平台，打通飞书、企业微信、钉钉

语析Yuxi-Know 是基于大模型RAG知识库与知识图谱技术构建的智能问答平台，支持多种知识库文件格式，如PDF、TXT、MD、Docx，支持将文件内容转换为向量存储，便于快速检索。

来自主题: AI技术研报

5348 点击 2026-02-02 13:23

RAG优化不抓瞎！Milvus检索可视化，帮你快速定位嵌入、切块、索引哪有问题

最近，在GitHub上发现一个宝藏项目Project_Golem 。

来自主题: AI技术研报

9254 点击 2026-01-29 10:08

UltraRAG 3.0 发布：拒绝“盲盒”开发，让每一行推理逻辑都清晰可见

今天，清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB 、面壁智能与 AI9Stars 联合发布 UltraRAG 3.0 ，针对上述痛点，为科研工作者与开发者打造更懂开发者的技术框架，具备 3 大核心优势：

来自主题: AI资讯

10306 点击 2026-01-24 15:14

官宣，Milvus开源语义高亮模型：告别饱和检索，帮RAG、agent剪枝80%上下文

RAG与agent用到深水区，一定会遇到这个问题：明明架构很完美，私有数据也做了接入，但项目上线三天，不但token账单爆了，模型输出结果也似乎总差点意思。

来自主题: AI技术研报

9255 点击 2026-01-15 09:19

不会做RAG、agent的本地数据管理？都来学Claude Code！附深度拆解

企业级场景中，无论是做RAG还是agent，我们都会面临一个问题：出于数据隐私以及合规要求，数据必须保留在本地。但传统的本地存储方案往往存在数据隔离性差、崩溃易丢数据、配置管理混乱、操作不可撤销等问题。

来自主题: AI技术研报

8518 点击 2026-01-13 09:07

2U服务器碾压超算集群！1000美元电费算出314万亿位圆周率

2022年，Google Cloud 将π计算到100万亿位，在2025年，高性能计算界的知名评测机构 StorageReview只用了4个月的时间，花了不到一千美元电费就将π算到314万亿位，这可不是为了炫技，而是说明高性能计算也可以很节能。

来自主题: AI资讯

5763 点击 2026-01-12 09:34

都有混合检索与智能路由了，谁还在给RAG赛博哭坟？

最近一年，互联网上各种为RAG赛博哭坟的帖子不胜枚举。

来自主题: AI技术研报

9360 点击 2026-01-09 10:53

刚刚！阿里开源 Qwen3-VL-Embedding 和 Qwen3-VL-Reranker 模型！图片和视频也可以做RAG了～

今天，Qwen 家族新成员+2，我们正式发布 Qwen3-VL-Embedding 和 Qwen3-VL-Reranker 模型系列，这两个模型基于 Qwen3-VL 构建，专为多模态信息检索与跨模态理解设计，为图文、视频等混合内容的理解与检索提供统一、高效的解决方案。

来自主题: AI资讯

9245 点击 2026-01-08 23:28

检索做大，生成做轻：CMU团队系统评测RAG的语料与模型权衡

在检索增强生成中，扩大生成模型规模往往能提升准确率，但也会显著抬高推理成本与部署门槛。CMU 团队在固定提示模板、上下文组织方式与证据预算，并保持检索与解码设置不变的前提下，系统比较了生成模型规模与检索语料规模的联合效应，发现扩充检索语料能够稳定增强 RAG，并在多项开放域问答基准上让小中型模型在更大语料下达到甚至超过更大模型在较小语料下的表现，同时在更高语料规模处呈现清晰的边际收益递减。

来自主题: AI技术研报

7604 点击 2026-01-06 09:30

比SOTA提速10倍！北大DragMesh重塑3D交互，物理零失真

让静态3D模型「动起来」一直是图形学界的难题：物理模拟太慢，生成模型又不讲「物理基本法」。近日，北京大学团队提出DragMesh，通过「语义-几何解耦」范式与双四元数VAE，成功将核心生成模块的算力消耗降低至SOTA模型的1/10，同时将运动轴预测误差降低了10倍。

来自主题: AI资讯

7290 点击 2026-01-05 09:35