AI资讯新闻榜单内容搜索-128K

多模态长文本理解测评首发：46款模型无一攻克128K难关

来自香港科技大学、腾讯西雅图AI Lab、爱丁堡大学、Miniml.AI、英伟达的研究者联合提出了MMLongBench，旨在全面评估多模态模型的长文本理解能力。

来自主题: AI技术研报

8611 点击 2025-05-23 14:52

手机流畅处理128K长文本，vivo端侧新算法突破内存限制 | ACL 2025

在端侧设备上处理长文本常常面临计算和内存瓶颈。

来自主题: AI技术研报

10556 点击 2025-05-20 14:54

ICML 2025 | 长视频理解新SOTA！蚂蚁&人大开源ViLAMP-7B，单卡可处理3小时视频

在视觉语言模型（Vision-Language Models，VLMs）取得突破性进展的当下，长视频理解的挑战显得愈发重要。以标准 24 帧率的标清视频为例，仅需数分钟即可产生逾百万的视觉 token，这已远超主流大语言模型 4K-128K 的上下文处理极限。

来自主题: AI技术研报

6468 点击 2025-05-13 08:54

400万token新SOTA！英伟达UIUC联手：兼顾长短上下文顶尖性能

来自英伟达和UIUC的华人团队提出一种高效训练方法，将LLM上下文长度从128K扩展至惊人的400万token SOTA纪录！基于Llama3.1-Instruct打造的UltraLong-8B模型，不仅在长上下文基准测试中表现卓越，还在标准任务中保持顶尖竞争力。

来自主题: AI技术研报

8489 点击 2025-05-01 13:54

微软首个多模态Phi-4问世，56亿参数秒杀GPT-4o！LoRA华人大佬带队

Phi-4系列模型上新了！56亿参数Phi-4-multimodal集语音、视觉、文本多模态于一体，读图推理性能碾压GPT-4o；另一款38亿参数Phi-4-mini在推理、数学、编程等任务中超越了参数更大的LLM，支持128K token上下文。

来自主题: AI技术研报

6424 点击 2025-02-28 14:11

传统PC巨头IBM发布了最新的Granite3.1模型，跑分超过Llama3.1、Qwen2.5 和谷歌的 Gemma2

IBM 正式发布了其新一代开源大语言模型 Granite 3.1，这是一组轻量级、先进的开源基础模型，支持多语言、代码生成、推理和工具使用，能够在有限的计算资源上运行。这一系列模型具备 128K 的扩展上下文长度、嵌入模型、内置的幻觉检测功能以及性能的显著提升。

来自主题: AI资讯

10231 点击 2024-12-25 09:57

“不发模型、不上新功能”的OpenAI DevDay，开发者们还能期待啥

去年，OpenAI在旧金山举办了一场引发业界轰动的开发者大会（DevDay 2023），推出了一系列新产品和工具，包括支持128K上下文的GPT-4 Turbo，API价格下调，新的Assistants API，具备视觉功能的GPT-4 Turbo，DALL·E 3 API，以及大幅改进的JSON模型，还有命运多舛的GPTs和类App Store平台GPT Store。

来自主题: AI资讯

6700 点击 2024-10-01 14:04