AI资讯新闻榜单内容搜索-MiniCPM

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: MiniCPM
技术Blog-4 | 新一代InfLLM:可训练的稀疏注意力机制

技术Blog-4 | 新一代InfLLM:可训练的稀疏注意力机制

技术Blog-4 | 新一代InfLLM:可训练的稀疏注意力机制

本文深入剖析 MiniCPM4 采用的稀疏注意力结构 InfLLM v2。作为新一代基于 Transformer 架构的语言模型,MiniCPM4 在处理长序列时展现出令人瞩目的效率提升。传统Transformer的稠密注意力机制在面对长上下文时面临着计算开销迅速上升的趋势,这在实际应用中造成了难以逾越的性能瓶颈。

来自主题: AI技术研报
5941 点击    2025-06-16 15:24
iPad 里跑“GPT-4o”:面壁新模型,低调开源

iPad 里跑“GPT-4o”:面壁新模型,低调开源

iPad 里跑“GPT-4o”:面壁新模型,低调开源

昨天,面壁低调(没媒体曝光)发布了 新模型 MiniCPM-o 2.6:【开源】【端侧】比肩 GPT-4o,只有 8B,非常强!

来自主题: AI资讯
8326 点击    2025-01-16 13:22
清华厦大等提出“无限长上下文”技术,100万大海捞针全绿,Llama\Qwen\MiniCPM都能上分

清华厦大等提出“无限长上下文”技术,100万大海捞针全绿,Llama\Qwen\MiniCPM都能上分

清华厦大等提出“无限长上下文”技术,100万大海捞针全绿,Llama\Qwen\MiniCPM都能上分

大模型的记忆限制被打破了,变相实现“无限长”上下文。最新成果,来自清华、厦大等联合提出的LLMxMapReduce长本文分帧处理技术。

来自主题: AI技术研报
3766 点击    2024-11-09 15:38
4B小模型掀翻大模型牌桌!性能超GPT-3.5,无限长文本性能超Kimi...

4B小模型掀翻大模型牌桌!性能超GPT-3.5,无限长文本性能超Kimi...

4B小模型掀翻大模型牌桌!性能超GPT-3.5,无限长文本性能超Kimi...

你敢相信 4B 参数小模型,性能却超越千亿量级的 GPT-3.5 !OpenAI、谷歌、微软、苹果等一众海内外巨头还没做到的事,被一家中国大模型公司抢先了!

来自主题: AI资讯
3221 点击    2024-09-06 15:20
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染

多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染

多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染

随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现出了越来越接近闭源的性能。

来自主题: AI技术研报
10278 点击    2024-08-21 14:28
我用AI鉴宝,在潘家园被店主围攻了!

我用AI鉴宝,在潘家园被店主围攻了!

我用AI鉴宝,在潘家园被店主围攻了!

事情是这样的,前两天面壁刚刚推出了“小钢炮” MiniCPM-V 2.6 模型,据说视频理解能力直接对标GPT-4V,最重要的是能直接部署在iPad 上。

来自主题: AI资讯
6202 点击    2024-08-10 12:15