AI资讯新闻榜单内容搜索-Stack

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Stack
无需训练,100%完美检索!LLM练出「火眼金睛」,InfiniRetri超长文本一针见血

无需训练,100%完美检索!LLM练出「火眼金睛」,InfiniRetri超长文本一针见血

无需训练,100%完美检索!LLM练出「火眼金睛」,InfiniRetri超长文本一针见血

LLM自身有望在无限长token下检索信息!无需训练,在检索任务「大海捞针」(Needle-in-a-Haystack)测试中,新方法InfiniRetri让有效上下文token长度从32K扩展至1000+K,让7B模型比肩72B模型。

来自主题: AI技术研报
8239 点击    2025-03-16 13:28
长文本向量模型在4K Tokens 之外形同盲区?

长文本向量模型在4K Tokens 之外形同盲区?

长文本向量模型在4K Tokens 之外形同盲区?

2025 年 2 月发布的 NoLiMA 是一种大语言模型(LLM)长文本理解能力评估方法。不同于传统“大海捞针”(Needle-in-a-Haystack, NIAH)测试依赖关键词匹配的做法,它最大的特点是 通过精心设计问题和关键信息,迫使模型进行深层语义理解和推理,才能从长文本中找到答案。

来自主题: AI技术研报
3779 点击    2025-03-12 15:08
DeepSeek R1之后,AI创业、AI投资会发生什么变化?

DeepSeek R1之后,AI创业、AI投资会发生什么变化?

DeepSeek R1之后,AI创业、AI投资会发生什么变化?

自一月以来, DeepSeek 在 AI 领域引发了极大的热度,也出现了大量分析文章。其中来自 Leonis Capital 于 2.6 发表于 Substack 上的文章:「DeepSeek: A Technical and Strategic Analysis for VCs and Startups」

来自主题: AI技术研报
6789 点击    2025-02-15 16:00
深度丨AI Agents 技术栈图谱与分析

深度丨AI Agents 技术栈图谱与分析

深度丨AI Agents 技术栈图谱与分析

Letta(由之前爆火的 MemGPT 更名)最近做了一个关于 AI Agents Stack 的研究报告。

来自主题: AI技术研报
7985 点击    2024-12-01 11:29
程序员最爱的问答网站,给ChatGPT当起了“奶妈”

程序员最爱的问答网站,给ChatGPT当起了“奶妈”

程序员最爱的问答网站,给ChatGPT当起了“奶妈”

Stack Overflow,一个类似知乎、Reddit的老牌网站,因专注于技术问答和社区运营,因此在全球程序员圈内备受欢迎。

来自主题: AI技术研报
9127 点击    2024-05-08 17:24
揭开Groq LPU神秘面纱:世界最快硬件加速器的底层架构设计!

揭开Groq LPU神秘面纱:世界最快硬件加速器的底层架构设计!

揭开Groq LPU神秘面纱:世界最快硬件加速器的底层架构设计!

Groq一夜爆火的背后,是自研的语言处理单元硬件LPU,近日,Substack的专栏作家Abhinav Upadhyay为我们一步步揭示了LPU底层架构的奥秘

来自主题: AI技术研报
3131 点击    2024-03-08 15:17
一篇文章搞懂LangChain

一篇文章搞懂LangChain

一篇文章搞懂LangChain

现在,为了实现相同的目标,我们有两个最著名的库,即 Haystack 和 LangChain,它们可以帮助我们创建基于大语言模型的端到端应用程序或流程。

来自主题: AI技术研报
5948 点击    2024-01-18 18:33
大模型无法替代码农!普林斯顿芝大惊人发现:GPT-4解决GitHub编程问题成功率为0

大模型无法替代码农!普林斯顿芝大惊人发现:GPT-4解决GitHub编程问题成功率为0

大模型无法替代码农!普林斯顿芝大惊人发现:GPT-4解决GitHub编程问题成功率为0

ChatGPT之类的AI编码工具来势汹汹,Stack Overflow又裁员了!不过,普林斯顿和芝大竟发现,面对真实世界GitHub问题,GPT-4的解决率竟是0%。

来自主题: AI技术研报
7113 点击    2023-10-17 15:14