AI资讯新闻榜单内容搜索-token

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: token

字节发布通用游戏智能体！5000亿token训练，用鼠标键盘吊打GPT-5！

字节发布通用游戏智能体！5000亿token训练，用鼠标键盘吊打GPT-5！

字节发布通用游戏智能体！5000亿token训练，用鼠标键盘吊打GPT-5！

Game-TARS基于统一、可扩展的键盘—鼠标动作空间训练，可在操作系统、网页与模拟环境中进行大规模预训练。依托超5000亿标注量级的多模态训练数据，结合稀疏推理（Sparse-Thinking）与衰减持续损失（decaying continual loss），大幅提升了智能体的可扩展性和泛化性。

来自主题: AI技术研报

7075 点击 2025-11-01 09:42

内存直降50%，token需求少56%！用视觉方式处理长文本

内存直降50%，token需求少56%！用视觉方式处理长文本

内存直降50%，token需求少56%！用视觉方式处理长文本

在NeurIPS 2025论文中，来自「南京理工大学、中南大学、南京林业大学」的研究团队提出了一个极具突破性的框架——VIST（Vision-centric Token Compression in LLM），为大语言模型的长文本高效推理提供了全新的「视觉解决方案」。值得注意的是，这一思路与近期引起广泛关注的DeepSeek-OCR的核心理念不谋而合。

来自主题: AI技术研报

7893 点击 2025-11-01 09:23

重新定义跨模态生成的流匹配范式，VAFlow让视频「自己发声」

重新定义跨模态生成的流匹配范式，VAFlow让视频「自己发声」

重新定义跨模态生成的流匹配范式，VAFlow让视频「自己发声」

在多模态生成领域，由视频生成音频（Video-to-Audio，V2A）的任务要求模型理解视频语义，还要在时间维度上精准对齐声音与动态。早期的 V2A 方法采用自回归（Auto-Regressive）的方式将视频特征作为前缀来逐个生成音频 token，或者以掩码预测（Mask-Prediction）的方式并行地预测音频 token，逐步生成完整音频。

来自主题: AI技术研报

6934 点击 2025-10-31 15:00

扩散语言模型新发现：其计算潜力正在被浪费？

扩散语言模型新发现：其计算潜力正在被浪费？

扩散语言模型新发现：其计算潜力正在被浪费？

按从左到右的顺序依次生成下一个 token 真的是大模型生成方式的最优解吗？最近，越来越多的研究者对此提出质疑。其中，有些研究者已经转向一个新的方向 —— 掩码扩散语言模型（MDLM）。

来自主题: AI技术研报

9011 点击 2025-10-31 09:50

Cursor 2.0 发布首个编程大模型Composer！代码生成250tokens/秒，强化学习+MoE架构

Cursor 2.0 发布首个编程大模型Composer！代码生成250tokens/秒，强化学习+MoE架构

Cursor 2.0 发布首个编程大模型Composer！代码生成250tokens/秒，强化学习+MoE架构

最新进展，Cursor 2.0正式发布，并且首次搭载了「内部」大模型。没错，不是GPT、不是Claude，如今模型栏多了个新名字——Composer。实力相当炸裂：据官方说法，Composer仅需30秒就能完成复杂任务，比同行快400%

来自主题: AI资讯

7385 点击 2025-10-30 09:14

前天猫精灵总裁彭超创业，想从运动AI硬件实现通用智能

前天猫精灵总裁彭超创业，想从运动AI硬件实现通用智能

前天猫精灵总裁彭超创业，想从运动AI硬件实现通用智能

彭超曾在华为印度、阿里任消费硬件业务1号位；联合创始人齐炜祯为Multi-token架构开创学者，被Deepseek、Qwen引入预训练方法。

来自主题: AI资讯

5969 点击 2025-10-28 10:43

NVIDIA港大MIT联合推出Fast-dLLM v2：端到端吞吐量提升2.5倍

NVIDIA港大MIT联合推出Fast-dLLM v2：端到端吞吐量提升2.5倍

NVIDIA港大MIT联合推出Fast-dLLM v2：端到端吞吐量提升2.5倍

自回归（AR）大语言模型逐 token 顺序解码的范式限制了推理效率；扩散 LLM（dLLM）以并行生成见长，但过去难以稳定跑赢自回归（AR）模型，尤其是在 KV Cache 复用、和可变长度支持上仍存挑战。

来自主题: AI技术研报

6944 点击 2025-10-27 16:46

智谱运气是差一点点，视觉Token研究又和DeepSeek撞车了

智谱运气是差一点点，视觉Token研究又和DeepSeek撞车了

智谱运气是差一点点，视觉Token研究又和DeepSeek撞车了

太卷了，DeepSeek-OCR刚发布不到一天，智谱就开源了自家的视觉Token方案——Glyph。既然是同台对垒，那自然得请这两天疯狂点赞DeepSeek的卡帕西来鉴赏一下：

来自主题: AI技术研报

7769 点击 2025-10-22 23:58

ChatGPT千亿tokens，干掉麦肯锡5000名顾问

ChatGPT千亿tokens，干掉麦肯锡5000名顾问

ChatGPT千亿tokens，干掉麦肯锡5000名顾问

魔幻啊魔幻。全球顶级咨询公司麦肯锡，居然收到了OpenAI最近给Tokens消耗大客户颁发的奖牌。麦肯锡自己还怪自豪的，第一时间就把奖牌po到了领英上。

来自主题: AI资讯

6047 点击 2025-10-21 16:42

推理提速4倍！莫纳什、浙大提出动态拼接，大小模型智能协作

推理提速4倍！莫纳什、浙大提出动态拼接，大小模型智能协作

推理提速4倍！莫纳什、浙大提出动态拼接，大小模型智能协作

针对「大模型推理速度慢，生成token高延迟」的难题，莫纳什、北航、浙大等提出R-Stitch框架，通过大小模型动态协作，衡量任务风险后灵活选择：简单任务用小模型，关键部分用大模型。实验显示推理速度提升最高4倍，同时保证高准确率。

来自主题: AI技术研报

6032 点击 2025-10-18 12:21

上一页当前第1页,共32页下一页