AI资讯新闻榜单内容搜索-128K

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 128K
LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍

LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍

LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍

大型语言模型(LLM)往往会追求更长的「上下文窗口」,但由于微调成本高、长文本稀缺以及新token位置引入的灾难值(catastrophic values)等问题,目前模型的上下文窗口大多不超过128k个token

来自主题: AI技术研报
7588 点击    2024-04-29 20:31
极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

从国际顶流 GPT-4 128K、Claude 200K 到国内「当红炸子鸡」支持 200 万字上下文的 Kimi Chat,大语言模型(LLM)在长上下文技术上不约而同地卷起来了

来自主题: AI技术研报
5395 点击    2024-04-16 18:08
开源11天,马斯克再发Grok-1.5!128K代码击败GPT-4

开源11天,马斯克再发Grok-1.5!128K代码击败GPT-4

开源11天,马斯克再发Grok-1.5!128K代码击败GPT-4

【新智元导读】马斯克「搞笑」模型刚刚升级到Grok-1.5,推理性能暴涨,支持128k长上下文。最重要的是,Grok-1.5的数学和代码能力大幅提升。

来自主题: AI技术研报
8124 点击    2024-03-29 16:34
阶跃星辰官网悄然更新,两款底座+两款应用抢先体验。

阶跃星辰官网悄然更新,两款底座+两款应用抢先体验。

阶跃星辰官网悄然更新,两款底座+两款应用抢先体验。

首先先来看看模型底座,阶跃星辰发布了两款,分别是Step-1V和Step-2。其中Step-1V具有千亿参数,支持多模态能力,和GPT4-Turbo一样,128K上下文,不过这款不算惊艳,只能算主流大模型中的正常水平。

来自主题: AI资讯
5285 点击    2024-03-16 11:35
陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存

陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存

陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存

陈丹琦团队刚刚发布了一种新的LLM上下文窗口扩展方法:它仅用8k大小的token文档进行训练,就能将Llama-2窗口扩展至128k。

来自主题: AI技术研报
9048 点击    2024-02-29 13:27
OpenAI首届AI春晚,创业公司屠杀夜!GPT-4炸裂更新,API跳楼价大甩卖

OpenAI首届AI春晚,创业公司屠杀夜!GPT-4炸裂更新,API跳楼价大甩卖

OpenAI首届AI春晚,创业公司屠杀夜!GPT-4炸裂更新,API跳楼价大甩卖

OpenAI的CEO Altman在分享了GPT-4的数十项新增功能和改进,并降低了平台许多服务的定价: 新的GPT-4 Turbo模型,功能更强大、更便宜并支持128K上下文窗口。 最为关键的是,发布了GPTs功能,能让每个用户自己制作自己「定制化的ChatGPT」,还能通过即将发布的「GPT Store」来让自己定制的GPT为自己挣钱!

来自主题: AI资讯
5691 点击    2023-11-07 16:20
ChatGPT王炸升级!更强版GPT-4上线,API定价打骨折,发布现场掌声没停过

ChatGPT王炸升级!更强版GPT-4上线,API定价打骨折,发布现场掌声没停过

ChatGPT王炸升级!更强版GPT-4上线,API定价打骨折,发布现场掌声没停过

OpenAI在首届开发者日上,正式公布自定义GPT。与此同时,现有的GPT-4也迎来一大波更新。 新版本GPT-4 Turbo,支持128k上下文,知识截止更新到2023年4月,视觉能力、DALL·E3,文字转语音TTS等等全都对API开放…… API价格还打了3-5折。

来自主题: AI资讯
35575 点击    2023-11-07 09:03