AI资讯新闻榜单内容搜索-Tokenizati

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Tokenizati

Discrete Tokenization：多模态大模型的关键基石，首个系统化综述发布

Discrete Tokenization：多模态大模型的关键基石，首个系统化综述发布

Discrete Tokenization：多模态大模型的关键基石，首个系统化综述发布

近年来，大语言模型（LLM）在语言理解、生成和泛化方面取得了突破性进展，并广泛应用于各种文本任务。随着研究的深入，人们开始关注将 LLM 的能力扩展至非文本模态，例如图像、音频、视频、图结构、推荐系统等。

来自主题: AI技术研报

7253 点击 2025-08-06 12:18

无Tokenizer时代真要来了？Mamba作者再发颠覆性论文，挑战Transformer

无Tokenizer时代真要来了？Mamba作者再发颠覆性论文，挑战Transformer

无Tokenizer时代真要来了？Mamba作者再发颠覆性论文，挑战Transformer

最近，Mamba 作者之一 Albert Gu 又发新研究，他参与的一篇论文《 Dynamic Chunking for End-to-End Hierarchical Sequence Modeling 》提出了一个分层网络 H-Net，其用模型内部的动态分块过程取代 tokenization，从而自动发现和操作有意义的数据单元。

来自主题: AI技术研报

7914 点击 2025-07-13 11:37

「Tokens是胡扯」，Mamba作者抛出颠覆性观点，揭露Transformer深层缺陷

「Tokens是胡扯」，Mamba作者抛出颠覆性观点，揭露Transformer深层缺陷

「Tokens是胡扯」，Mamba作者抛出颠覆性观点，揭露Transformer深层缺陷

「Tokenization（分词）是 Transformer 模型为弥补自身缺陷不得不戴上的枷锁。」

来自主题: AI技术研报

6568 点击 2025-07-10 13:16

Tokenization，再见！Meta提出大概念模型LCM，1B模型干翻70B？

Tokenization，再见！Meta提出大概念模型LCM，1B模型干翻70B？

Tokenization，再见！Meta提出大概念模型LCM，1B模型干翻70B？

Meta提出大概念模型，抛弃token，采用更高级别的「概念」在句子嵌入空间上建模，彻底摆脱语言和模态对模型的制约。

来自主题: AI技术研报

10542 点击 2025-01-07 18:11

从2019年到现在，是时候重新审视Tokenization了

从2019年到现在，是时候重新审视Tokenization了

从2019年到现在，是时候重新审视Tokenization了

2019 年问世的 GPT-2，其 tokenizer 使用了 BPE 算法，这种算法至今仍很常见，但这种方式是最优的吗？来自 HuggingFace 的一篇文章给出了解释。

来自主题: AI技术研报

9761 点击 2025-01-04 14:20

Tokenization不存在了？Meta最新研究，无需Tokenizer的架构来了

Tokenization不存在了？Meta最新研究，无需Tokenizer的架构来了

Tokenization不存在了？Meta最新研究，无需Tokenizer的架构来了

BLT 在许多基准测试中超越了基于 token 的架构。

来自主题: AI技术研报

6525 点击 2024-12-17 16:44

视频生成无损提速：删除多余token，训练时间减少30%，帧率越高效果越好 | NeurIPS

视频生成无损提速：删除多余token，训练时间减少30%，帧率越高效果越好 | NeurIPS

视频生成无损提速：删除多余token，训练时间减少30%，帧率越高效果越好 | NeurIPS

卡内基梅隆大学提出了视频生成模型加速方法Run-Length Tokenization（RLT），被NeurIPS 2024选为Spotlight论文。在精度几乎没有损失的前提下，RLT可以让模型训练和推理速度双双提升。

来自主题: AI技术研报

7214 点击 2024-11-17 14:10

字节豆包全新图像Tokenizer：生成图像最低只需32个token，最高提速410倍

字节豆包全新图像Tokenizer：生成图像最低只需32个token，最高提速410倍

字节豆包全新图像Tokenizer：生成图像最低只需32个token，最高提速410倍

在生成式模型的迅速发展中，Image Tokenization 扮演着一个很重要的角色，例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokenizers会将图像编码至一个更为紧凑的隐空间（latent space），使得生成高分辨率图像更有效率。

来自主题: AI技术研报

11248 点击 2024-06-22 23:00

大神Karpathy强推，分词领域必读：自动钓鱼让大模型“发疯”的token，来自Transformer作者创业公司

大神Karpathy强推，分词领域必读：自动钓鱼让大模型“发疯”的token，来自Transformer作者创业公司

大神Karpathy强推，分词领域必读：自动钓鱼让大模型“发疯”的token，来自Transformer作者创业公司

关于大模型分词（tokenization），大神Karpathy刚刚推荐了一篇必读新论文。

来自主题: AI技术研报

11489 点击 2024-05-13 17:28

上一页当前第1页,共1页下一页