AI资讯新闻榜单内容搜索-向量模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 向量模型
Correlations:氛围测试你的向量模型

Correlations:氛围测试你的向量模型

Correlations:氛围测试你的向量模型

在今年 ICLR 会议上,我们被问到最多且最有意思的问题是:像 Jina AI 这样的向量搜索模型提供商,除了在 MTEB 上做基准测试,会不会做些氛围测试 (Vibe-testing)?

来自主题: AI技术研报
7950 点击    2025-05-31 15:20
智源3款向量模型发布!代码检索及多模态维度刷新多项SOTA

智源3款向量模型发布!代码检索及多模态维度刷新多项SOTA

智源3款向量模型发布!代码检索及多模态维度刷新多项SOTA

检索增强技术在代码及多模态场景中的发挥着重要作用,而向量模型是检索增强体系中的重要组成部分。

来自主题: AI资讯
8945 点击    2025-05-20 15:47
多模态检索大升级!智源三大SOTA模型,代码、图文理解能力拉满

多模态检索大升级!智源三大SOTA模型,代码、图文理解能力拉满

多模态检索大升级!智源三大SOTA模型,代码、图文理解能力拉满

就在刚刚,智源研究员联合多所高校开放三款向量模型,以大优势登顶多项测试基准。其中,BGE-Code-v1直接击穿代码检索天花板,百万行级代码库再也不用怕了!

来自主题: AI技术研报
4746 点击    2025-05-20 14:45
喝下这一碗模型汤,掌握向量模型的训练秘方

喝下这一碗模型汤,掌握向量模型的训练秘方

喝下这一碗模型汤,掌握向量模型的训练秘方

那些曾在KDD时代Kaggle上打榜刷分的老炮儿,每每提起 Bagging 与 Boosting 这两项技术嘴角都压不住笑。

来自主题: AI技术研报
6813 点击    2025-05-10 14:49
文本向量的长度偏差及其在搜索中的影响

文本向量的长度偏差及其在搜索中的影响

文本向量的长度偏差及其在搜索中的影响

向量模型的核心功能是测量语义相似度,但这个测量结果很容易受到多种干扰因素的影响。在本文中,我们将着眼于文本向量模型中一个普遍存在的偏差来源:输入内容的长度。

来自主题: AI技术研报
8915 点击    2025-04-17 14:19
长文本向量模型在4K Tokens 之外形同盲区?

长文本向量模型在4K Tokens 之外形同盲区?

长文本向量模型在4K Tokens 之外形同盲区?

2025 年 2 月发布的 NoLiMA 是一种大语言模型(LLM)长文本理解能力评估方法。不同于传统“大海捞针”(Needle-in-a-Haystack, NIAH)测试依赖关键词匹配的做法,它最大的特点是 通过精心设计问题和关键信息,迫使模型进行深层语义理解和推理,才能从长文本中找到答案。

来自主题: AI技术研报
3783 点击    2025-03-12 15:08
智源BGE-VL拍照提问即可精准搜,1/70数据击穿多模态检索天花板!

智源BGE-VL拍照提问即可精准搜,1/70数据击穿多模态检索天花板!

智源BGE-VL拍照提问即可精准搜,1/70数据击穿多模态检索天花板!

智源联手多所顶尖高校发布的多模态向量模型BGE-VL,重塑了AI检索领域的游戏规则。它凭借独创的MegaPairs合成数据技术,在图文检索、组合图像检索等多项任务中,横扫各大基准刷新SOTA。

来自主题: AI技术研报
3556 点击    2025-03-07 10:34
智源开源多模态向量模型BGE-VL:多模态检索新突破

智源开源多模态向量模型BGE-VL:多模态检索新突破

智源开源多模态向量模型BGE-VL:多模态检索新突破

BGE 系列模型自发布以来广受社区好评。近日,智源研究院联合多所高校开发了多模态向量模型 BGE-VL,进一步扩充了原有生态体系。

来自主题: AI技术研报
7069 点击    2025-03-06 17:05
向量模型的词序感知缺陷与优化策略

向量模型的词序感知缺陷与优化策略

向量模型的词序感知缺陷与优化策略

最近,LAION AI 的创始人 Christoph Schuhmann 分享了一个有趣的发现,他指出,文本向量模型似乎存在一个问题:即使句子词序被打乱,模型输出的向量与原句仍然高度相似。

来自主题: AI技术研报
7401 点击    2024-12-29 11:16
卷起来了!长文本向量模型分块策略大比拼

卷起来了!长文本向量模型分块策略大比拼

卷起来了!长文本向量模型分块策略大比拼

长文本向量模型能够将十页长的文本编码为单个向量,听起来很强大,但真的实用吗? 很多人觉得... 未必。 直接用行不行?该不该分块?怎么分才最高效?本文将带你深入探讨长文本向量模型的不同分块策略,分析利弊,帮你避坑。

来自主题: AI技术研报
7713 点击    2024-12-13 11:33