AI资讯新闻榜单内容搜索-Mamba

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Mamba

英伟达提出首个Mamba-Transformer视觉骨干网络！打破精度/吞吐瓶颈 | CVPR 2025

英伟达提出首个Mamba-Transformer视觉骨干网络！打破精度/吞吐瓶颈 | CVPR 2025

英伟达提出首个Mamba-Transformer视觉骨干网络！打破精度/吞吐瓶颈 | CVPR 2025

CVPR 2025，混合新架构MambaVision来了！Mamba+Transformer混合架构专门为CV应用设计。MambaVision 在Top-1精度和图像吞吐量方面实现了新的SOTA，显著超越了基于Transformer和Mamba的模型。

来自主题: AI技术研报

10506 点击 2025-03-08 13:10

Mamba作者带斯坦福同学、导师创业，Cartesia获2700万美元种子轮融资

Mamba作者带斯坦福同学、导师创业，Cartesia获2700万美元种子轮融资

Mamba作者带斯坦福同学、导师创业，Cartesia获2700万美元种子轮融资

Mamba 这种状态空间模型（SSM）被认为是 Transformer 架构的有力挑战者。近段时间，相关研究成果接连不断。而就在不久前，Mamba 作者 Albert Gu 与 Karan Goel、Chris Ré、Arjun Desai、Brandon Yang 一起共同创立的 Cartesia 获得 2700 万美元种子轮融资。

来自主题: AI技术研报

9906 点击 2024-12-13 17:21

从线性注意力视角揭秘视觉Mamba，清华、阿里合作提出全新MILA模型

从线性注意力视角揭秘视觉Mamba，清华、阿里合作提出全新MILA模型

从线性注意力视角揭秘视觉Mamba，清华、阿里合作提出全新MILA模型

Mamba 是一种具有线性计算复杂度的状态空间模型，它能够以线性计算复杂度实现对输入序列的有效建模，在近几个月受到了广泛的关注。

来自主题: AI技术研报

9100 点击 2024-12-11 09:33

轻量化MobileMamba视觉模型来了｜浙大/腾讯优图/华中科大联合出品

轻量化MobileMamba视觉模型来了｜浙大/腾讯优图/华中科大联合出品

轻量化MobileMamba视觉模型来了｜浙大/腾讯优图/华中科大联合出品

浙大、腾讯优图、华中科技大学的团队，提出轻量化MobileMamba！既良好地平衡了效率与效果，推理速度远超现有基于Mamba的模型。

来自主题: AI技术研报

9870 点击 2024-12-01 14:27

不是RNN的锅！清华团队深入分析长上下文建模中的状态崩溃，Mamba作者点赞

不是RNN的锅！清华团队深入分析长上下文建模中的状态崩溃，Mamba作者点赞

不是RNN的锅！清华团队深入分析长上下文建模中的状态崩溃，Mamba作者点赞

RNN模型在长上下文中表现不佳？近日，来自清华的研究团队对此进行了深入的实验分析，结果表明：不是RNN的锅。

来自主题: AI技术研报

10777 点击 2024-11-27 17:10

北大林宙辰团队全新混合序列建模架构MixCon：性能远超Mamba

北大林宙辰团队全新混合序列建模架构MixCon：性能远超Mamba

北大林宙辰团队全新混合序列建模架构MixCon：性能远超Mamba

在自然语言处理、语音识别和时间序列分析等众多领域中，序列建模是一项至关重要的任务。然而，现有的模型在捕捉长程依赖关系和高效建模序列方面仍面临诸多挑战。

来自主题: AI技术研报

8464 点击 2024-10-15 19:22

陈丹琦等人组织的COLM奖项公布：被ICLR拒稿的Mamba入选杰出论文

陈丹琦等人组织的COLM奖项公布：被ICLR拒稿的Mamba入选杰出论文

陈丹琦等人组织的COLM奖项公布：被ICLR拒稿的Mamba入选杰出论文

会议组织者都是 NLP 头部科学家，在语言建模方面有着相当的成果。

来自主题: AI技术研报

10062 点击 2024-10-08 17:48

惨遭拒稿的Mamba，7个月后拿下首届COLM杰出论文，华为俄罗斯实验室等4篇入选

惨遭拒稿的Mamba，7个月后拿下首届COLM杰出论文，华为俄罗斯实验室等4篇入选

惨遭拒稿的Mamba，7个月后拿下首届COLM杰出论文，华为俄罗斯实验室等4篇入选

顶流新会议首届COLM成功举办，Mamba等4篇论文获得杰出论文奖。

来自主题: AI资讯

11446 点击 2024-10-08 17:36

首个Mamba+Transformer混合架构多模态大模型来了，实现单卡千图推理

首个Mamba+Transformer混合架构多模态大模型来了，实现单卡千图推理

首个Mamba+Transformer混合架构多模态大模型来了，实现单卡千图推理

扩展多模态大语言模型（MLLMs）的长上下文能力对于视频理解、高分辨率图像理解以及多模态智能体至关重要。这涉及一系列系统性的优化，包括模型架构、数据构建和训练策略，尤其要解决诸如随着图像增多性能下降以及高计算成本等挑战。

来自主题: AI技术研报

9906 点击 2024-09-21 18:19

LIama 3+Mamba强强联手！蒸馏到线性RNN，推理速度提升1.6倍

LIama 3+Mamba强强联手！蒸馏到线性RNN，推理速度提升1.6倍

LIama 3+Mamba强强联手！蒸馏到线性RNN，推理速度提升1.6倍

把Llama 3蒸馏到Mamba，推理速度最高可提升1.6倍！

来自主题: AI资讯

9159 点击 2024-09-10 14:10

上一页当前第3页,共7页下一页