AI资讯新闻榜单内容搜索-tokens

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: tokens
长文本向量模型在4K Tokens 之外形同盲区?

长文本向量模型在4K Tokens 之外形同盲区?

长文本向量模型在4K Tokens 之外形同盲区?

2025 年 2 月发布的 NoLiMA 是一种大语言模型(LLM)长文本理解能力评估方法。不同于传统“大海捞针”(Needle-in-a-Haystack, NIAH)测试依赖关键词匹配的做法,它最大的特点是 通过精心设计问题和关键信息,迫使模型进行深层语义理解和推理,才能从长文本中找到答案。

来自主题: AI技术研报
3779 点击    2025-03-12 15:08
优于o1预览版,推理阶段KV缓存缩减一半,LightTransfer降本还能增效

优于o1预览版,推理阶段KV缓存缩减一半,LightTransfer降本还能增效

优于o1预览版,推理阶段KV缓存缩减一半,LightTransfer降本还能增效

LLM 在生成 long CoT 方面展现出惊人的能力,例如 o1 已能生成长度高达 100K tokens 的序列。然而,这也给 KV cache 的存储带来了严峻挑战。

来自主题: AI技术研报
4676 点击    2025-03-11 09:32
LLaVA-Mini来了!每张图像所需视觉token压缩至1个,兼顾效率内存

LLaVA-Mini来了!每张图像所需视觉token压缩至1个,兼顾效率内存

LLaVA-Mini来了!每张图像所需视觉token压缩至1个,兼顾效率内存

以 GPT-4o 为代表的实时交互多模态大模型(LMMs)引发了研究者对高效 LMM 的广泛关注。现有主流模型通过将视觉输入转化为大量视觉 tokens,并将其嵌入大语言模型(LLM)上下文来实现视觉信息理解。

来自主题: AI技术研报
2710 点击    2025-02-06 15:26
DeepSeek华为火线联手!硅基流动首发即限流,全国产API白菜价,零门槛部署

DeepSeek华为火线联手!硅基流动首发即限流,全国产API白菜价,零门槛部署

DeepSeek华为火线联手!硅基流动首发即限流,全国产API白菜价,零门槛部署

国产大模型云服务平台SiliconCloud(硅基流动),首发上线了基于华为云昇腾云服务的DeepSeek-V3、DeepSeek-R1。 DeepSeek-V3:输入只需1块钱/M tokens,输出2块钱/M tokens

来自主题: AI资讯
7880 点击    2025-02-02 13:03
Qwen开源首个长文本新模型,百万Tokens处理性能超GPT-4o-mini

Qwen开源首个长文本新模型,百万Tokens处理性能超GPT-4o-mini

Qwen开源首个长文本新模型,百万Tokens处理性能超GPT-4o-mini

谈到大模型的“国货之光”,除了DeepSeek之外,阿里云Qwen这边也有新动作——首次将开源Qwen模型的上下文扩展到1M长度。

来自主题: AI资讯
7478 点击    2025-01-27 14:18
AI时代不看独角兽,看10亿Tokens日均消耗

AI时代不看独角兽,看10亿Tokens日均消耗

AI时代不看独角兽,看10亿Tokens日均消耗

创立10年内估值超过10亿美元的创新公司,被称之为独角兽,它们是市场潜力无限的绩优股,是为行业带来技术创新、模式创新的佼佼者。

来自主题: AI资讯
8280 点击    2025-01-23 13:27
日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速

日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速

日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速

如果2023年给大模型的关键词是席卷,那么在2024,这个关键词应该是渗透。最常用的软件、手机PC本身、甚至厨卫/电源开源,都在被AI重塑。主观感受中,这一年,AI更加强大,以前所未有的速度嵌入各行各业。

来自主题: AI资讯
6843 点击    2025-01-20 16:46