首个基于Mamba的MLLM来了!模型权重、训练代码等已全部开源
首个基于Mamba的MLLM来了!模型权重、训练代码等已全部开源近年来,多模态大型语言模型(MLLM)在各个领域的应用取得了显著的成功。然而,作为许多下游任务的基础模型,当前的 MLLM 由众所周知的 Transformer 网络构成,这种网络具有较低效的二次计算复杂度。
近年来,多模态大型语言模型(MLLM)在各个领域的应用取得了显著的成功。然而,作为许多下游任务的基础模型,当前的 MLLM 由众所周知的 Transformer 网络构成,这种网络具有较低效的二次计算复杂度。
几天前,由 Linux 基金会主办的北美开源峰会(Open Source Summit North America)在华盛顿西雅图闭幕。
过去几年来,扩散模型强大的图像合成能力已经得到充分证明。研究社区现在正在攻克一个更困难的任务:视频生成。近日,OpenAI 安全系统(Safety Systems)负责人 Lilian Weng 写了一篇关于视频生成的扩散模型的博客。
拖动式图像编辑是一种新型的、用户交互式的图像编辑方法。
如果你手头有一个价值100亿美元的AI模型,通过了安全测试且让所有人受益,你愿意将它开源吗?
《国家科技传播中心讲坛》为中国科协打造的新型演讲类新知栏目,以科学精神,科技探索和科技产业为主要讲述内容,汇集相关领域顶尖科技工作者讲述科技创新故事,传播前沿创新成果,弘扬科学家精神。本文摘选部分以飨读者。
2024年AI(人工智能)大模型行业的第一场竞争热潮,从长文本开始。
大家相互薅羊毛,要用,但要小心用,一不小心就尴尬了。 一位国产大模型算法工程师在接受「甲子光年」采访时的吐槽,可以说是非常到位了。 它准确地阐述 AI 业内一个所有人「心照不宣」的公开秘密。
2023年12月,宁德时代低调宣布在香港设立国际研发中心; 2024年3月11日,作为中国科学院在香港设立的首个国家级信息研发机构,中国科学院香港创新研究院人工智能与机器人创新中心发布了医疗多模态大模型CARES Copilot 1.0;
过去几年里,基于文本来生成图像的扩散模型得到了飞速发展,生成能力有了显著的提升,可以很容易地生成逼真的肖像画,以及各种天马行空的奇幻画作。