AI资讯新闻榜单内容搜索-Token

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Token

Token化一切，甚至网络！北大&谷歌&马普所提出TokenFormer，Transformer从来没有这么灵活过！

Token化一切，甚至网络！北大&谷歌&马普所提出TokenFormer，Transformer从来没有这么灵活过！

Token化一切，甚至网络！北大&谷歌&马普所提出TokenFormer，Transformer从来没有这么灵活过！

新一代通用灵活的网络结构 TokenFormer: Rethinking Transformer Scaling with Tokenized Model Parameters 来啦！

来自主题: AI技术研报

7445 点击 2024-11-14 14:13

它来了，剑桥最新LLM提示词压缩调查报告

它来了，剑桥最新LLM提示词压缩调查报告

它来了，剑桥最新LLM提示词压缩调查报告

别说Prompt压缩不重要，你可以不在乎Token成本，但总要考虑内存和LLM响应时间吧？一个显著的问题逐渐浮出水面：随着任务复杂度增加，提示词（Prompt）往往需要变得更长，以容纳更多详细需求、上下文信息和示例。这不仅降低了推理速度，还会增加内存开销，影响用户体验。

来自主题: AI资讯

10105 点击 2024-10-29 12:28

MIT韩松团队长上下文LLM推理高效框架DuoAttention：单GPU实现330万Token上下文推理

MIT韩松团队长上下文LLM推理高效框架DuoAttention：单GPU实现330万Token上下文推理

MIT韩松团队长上下文LLM推理高效框架DuoAttention：单GPU实现330万Token上下文推理

TL;DR：DuoAttention 通过将大语言模型的注意力头分为检索头（Retrieval Heads，需要完整 KV 缓存）和流式头（Streaming Heads，只需固定量 KV 缓存），大幅提升了长上下文推理的效率，显著减少内存消耗、同时提高解码（Decoding）和预填充（Pre-filling）速度，同时在长短上下文任务中保持了准确率。

来自主题: AI技术研报

4697 点击 2024-10-24 11:33

Ilya观点得证！仅靠预测下一个token统一图像文本视频，智源发布原生多模态世界模型Emu3

Ilya观点得证！仅靠预测下一个token统一图像文本视频，智源发布原生多模态世界模型Emu3

Ilya观点得证！仅靠预测下一个token统一图像文本视频，智源发布原生多模态世界模型Emu3

OpenAI前首席科学家、联合创始人Ilya Sutskever曾在多个场合表达观点：只要能够非常好的预测下一个token，就能帮助人类达到通用人工智能（AGI）。

来自主题: AI资讯

6430 点击 2024-10-21 14:39

视频、图像、文本，只需基于下一个Token预测：智源Emu3发布，验证多模态模型新范式

视频、图像、文本，只需基于下一个Token预测：智源Emu3发布，验证多模态模型新范式

视频、图像、文本，只需基于下一个Token预测：智源Emu3发布，验证多模态模型新范式

OpenAI 前首席科学家、联合创始人 Ilya Sutskever 曾在多个场合表达观点：只要能够非常好的预测下一个 token，就能帮助人类达到通用人工智能（AGI）。

来自主题: AI资讯

4476 点击 2024-10-21 14:23

谷歌&MIT何恺明团队：视觉大模型像LLM一样高效Scaling，指路连续token+随机生成顺序

谷歌&MIT何恺明团队：视觉大模型像LLM一样高效Scaling，指路连续token+随机生成顺序

谷歌&MIT何恺明团队：视觉大模型像LLM一样高效Scaling，指路连续token+随机生成顺序

来自主题: AI技术研报

5832 点击 2024-10-20 17:34

大模型在装傻！谷歌苹果最新发现：LLM知道但不告诉你，掌握知识比表现出来的多

大模型在装傻！谷歌苹果最新发现：LLM知道但不告诉你，掌握知识比表现出来的多

大模型在装傻！谷歌苹果最新发现：LLM知道但不告诉你，掌握知识比表现出来的多

近日，来自谷歌和苹果的研究表明：AI模型掌握的知识比表现出来的要多得多！这些真实性信息集中在特定的token中，利用这一属性可以显著提高检测LLM错误输出的能力。

来自主题: AI技术研报

4191 点击 2024-10-20 17:16

单靠推理Scaling Law无法成就o1！无限推理token，GPT-4o依然完败

单靠推理Scaling Law无法成就o1！无限推理token，GPT-4o依然完败

单靠推理Scaling Law无法成就o1！无限推理token，GPT-4o依然完败

CoT铸就了o1推理王者。它开创了一种推理scaling新范式——随着算力增加、更长响应时间，o1性能也随之增长。

来自主题: AI资讯

3159 点击 2024-09-29 16:56

ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

本论文第一作者倪赞林是清华大学自动化系 2022 级直博生，师从黄高副教授，主要研究方向为高效深度学习与图像生成。他曾在 ICCV、CVPR、ECCV、ICLR 等国际会议上发表多篇学术论文。

来自主题: AI技术研报

7028 点击 2024-09-19 11:14

o1方法性能无上限！姚班马腾宇等数学证明：推理token够多，就能解决任意问题

o1方法性能无上限！姚班马腾宇等数学证明：推理token够多，就能解决任意问题

o1方法性能无上限！姚班马腾宇等数学证明：推理token够多，就能解决任意问题

OpenAI用o1开启推理算力Scaling Law，能走多远？

来自主题: AI资讯

7872 点击 2024-09-17 21:41

上一页当前第24页,共38页下一页