AI资讯新闻榜单内容搜索-向量

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 向量
余弦相似度可能没用?对于某些线性模型,相似度甚至不唯一

余弦相似度可能没用?对于某些线性模型,相似度甚至不唯一

余弦相似度可能没用?对于某些线性模型,相似度甚至不唯一

在机器学习和数据科学领域,余弦相似度长期以来一直是衡量高维对象之间语义相似度的首选指标。余弦相似度已广泛应用于从推荐系统到自然语言处理的各种应用中。它的流行源于人们相信它捕获了嵌入向量之间的方向对齐,提供了比简单点积更有意义的相似性度量。

来自主题: AI技术研报
7436 点击    2025-01-14 14:47
向量模型的词序感知缺陷与优化策略

向量模型的词序感知缺陷与优化策略

向量模型的词序感知缺陷与优化策略

最近,LAION AI 的创始人 Christoph Schuhmann 分享了一个有趣的发现,他指出,文本向量模型似乎存在一个问题:即使句子词序被打乱,模型输出的向量与原句仍然高度相似。

来自主题: AI技术研报
7579 点击    2024-12-29 11:16
卷起来了!长文本向量模型分块策略大比拼

卷起来了!长文本向量模型分块策略大比拼

卷起来了!长文本向量模型分块策略大比拼

长文本向量模型能够将十页长的文本编码为单个向量,听起来很强大,但真的实用吗? 很多人觉得... 未必。 直接用行不行?该不该分块?怎么分才最高效?本文将带你深入探讨长文本向量模型的不同分块策略,分析利弊,帮你避坑。

来自主题: AI技术研报
7901 点击    2024-12-13 11:33
基于向量模型的文本水印技术

基于向量模型的文本水印技术

基于向量模型的文本水印技术

在 EMNLP 2024 上,我们看到了向量模型的各种创新用法,其中最出人意料的莫过于:文本水印。

来自主题: AI技术研报
7383 点击    2024-11-28 09:17
微软将推出LazyGraphRAG,索引成本降低至GraphRAG的千分之一!|抢先解读

微软将推出LazyGraphRAG,索引成本降低至GraphRAG的千分之一!|抢先解读

微软将推出LazyGraphRAG,索引成本降低至GraphRAG的千分之一!|抢先解读

将知识图谱技术与RAG有机结合的GraphRAG可谓是今年下半年来的LLM应用领域的一个热点,借助大模型从非结构化文本数据创建知识图谱与摘要,并结合图与向量索引技术来提高对复杂用户查询的检索增强与响应质量。

来自主题: AI技术研报
7509 点击    2024-11-26 18:01
大LLM输出就一定好吗,LLM嵌入用于回归任务,斯坦福和谷歌最新突破性发现与实践指南

大LLM输出就一定好吗,LLM嵌入用于回归任务,斯坦福和谷歌最新突破性发现与实践指南

大LLM输出就一定好吗,LLM嵌入用于回归任务,斯坦福和谷歌最新突破性发现与实践指南

在人工智能领域,大语言模型(LLM)的向量嵌入能力一直被视为处理文本数据的利器。然而,斯坦福大学和Google DeepMind的研究团队带来了一个颠覆性发现:LLM的向量嵌入能力可以有效应用于回归任务。

来自主题: AI技术研报
5683 点击    2024-11-26 09:04
RAG 系统的分块难题:小型语言模型如何找到最佳断点?

RAG 系统的分块难题:小型语言模型如何找到最佳断点?

RAG 系统的分块难题:小型语言模型如何找到最佳断点?

之前我们聊过 RAG 里文档分块 (Chunking) 的挑战,也介绍了 迟分 (Late Chunking) 的概念,它可以在向量化的时候减少上下文信息的丢失。今天,我们来聊聊另一个难题:如何找到最佳的分块断点。

来自主题: AI技术研报
5481 点击    2024-11-05 16:36