
模型合并就进化,直接拿下SOTA!Transformer作者创业新成果火了
模型合并就进化,直接拿下SOTA!Transformer作者创业新成果火了把Huggingface上的现成模型拿来“攒一攒”—— 直接就能组合出新的强大模型?!日本大模型公司sakana.ai脑洞大开(正是“Transformer八子”之一所创办的公司),想出了这么一个进化合并模型的妙招。
把Huggingface上的现成模型拿来“攒一攒”—— 直接就能组合出新的强大模型?!日本大模型公司sakana.ai脑洞大开(正是“Transformer八子”之一所创办的公司),想出了这么一个进化合并模型的妙招。
“据我了解,国内多个一线大模型机构,都已经突破了兆级的长文本能力。”以上,是“2024全球开发者先锋大会”大模型前沿论坛会间隙,上海人工智能实验室领军科学家林达华与量子位的交谈剪影。
有了 Suno 这个「作曲助手」,人人都可以创建自己想听的歌曲。自从 ChatGPT 在 2022 年底爆火以来,我们已经看到 AI 生成的诸多艺术创作成果:ChatGPT 写出过情节引人入胜的网文,Midjourney 生成过肉眼难辨的人像。
去年 8 月,两位著名的前谷歌研究人员 David Ha、Llion Jones 宣布创立一家人工智能公司 Sakana AI,总部位于日本东京。
自香农在《通信的数学原理》一书中提出「下一个 token 预测任务」之后,这一概念逐渐成为现代语言模型的核心部分。最近,围绕下一个 token 预测的讨论日趋激烈。
PreFLMR模型是一个通用的预训练多模态知识检索器,可用于搭建多模态RAG应用。模型基于发表于 NeurIPS 2023 的 Fine-grained Late-interaction Multi-modal Retriever (FLMR) 并进行了模型改进和 M2KR 上的大规模预训练。
最近,华中科技大学和金山的研究人员在多模态大模型 Monkey [1](Li et al., CVPR2024)工作的基础上提出 TextMonkey。在多个场景文本和文档的测试基准中,TextMonkey 处于国际领先地位,有潜力带来办公自动化、智慧教育、智慧金融等行业应用领域的技术变革。
最近,Kimi Chat 的上下文长度从 20 万汉字升级到了 200 万汉字,10 倍的差距已经足够产生一次质变,做很多之前做不了的事情。感谢月之暗面给了提前测试的机会,我们直接开测!
说到三星的超大杯影像旗舰,就不得不让人联想到另一个词——演唱会神器。
排位赛还未到来,业界公认,2024年是AIPC元年。AI似乎给PC产业注入了一支肾上腺素,被业界视为新一轮的重要增长机遇。
Mistral 可以说是欧洲目前最有代表性的 AI 公司,开源小模型、MoE、专注欧洲多语言市场等等,都让它与美国的几家大模型公司如 OpenAI、Anthropic 截然不同。
如果用 AI 把已经去世的亲人 “ 复活 ” ,你愿意吗?就在几天前,已故明星乔任梁被 AI “ 复活 ” 的事儿在网上闹得沸沸扬扬。
拒绝赛博朋克,千呼万唤始出来。为了兑现牛逼,马斯克最近下了血本:Grok-1宣布开源。据官方信息,这是一个参数高达3140亿的混合专家模型,是目前所有开源模型中规模最大的。
这一专属于智慧生物的独特性,也要被人工智能(AI)学会了?发散性思维(divergent thinking)被认为是创造性思维的核心指标,是人类创造性的体现。
蛋白质设计,充满无限可能。蛋白质设计领域又迎来了一项里程碑式的时刻——“上帝之手”、华盛顿大学生物化学教授 David Baker 团队及其合作者,首次利用生成式人工智能(AI)技术从零开始设计出了一种新型抗体,将抗体疗法推向了一个全新的高度。
加上此次CEO的辞职,Stability AI已经相继失去了十几位技术人才。又一知名的AI独角兽发生了管理层变动。当地时间3月23日,估值超40亿美元的独角兽AI公司Stability AI称,CEO Emad Mostaque辞去了CEO以及董事会职务,去追求去中心化的AI了。
AGI时代,越来越近了。本月,中国初创AGI(通用人工智能)公司月之暗面宣布旗下大模型工具Kimi Chat正式升级到200万字参数量,与五个月前该大模型初次亮相时的20万字相比,提升十倍。Kimi Chat的升级彻底引爆市场,同时也引起长文本大模型(Long-LLM)细分赛道更加激烈的竞争。
我们就是奔着AGI去的,不然这群人聚在一起干嘛?2024年2月,在准备一场分享会的PPT中,前微软全球副总裁、如今的阶跃星辰CEO姜大昕,把他看到的一句评论放进了自我介绍: 在微软混得风生水起,怎么想不开创业?
今天,中国的移动互联网发展得非常成功,世界领先,而移动互联网很有可能是人工智能发展的最大敌人。
“Sora最快今年内开放公测。” 在一场访谈中,OpenAI CTO Mira Murati亲自透露了这一消息。
今年的AI妖股,都知道英伟达,却少有人知道它——股价一年飙升900%、一脚踏进标普500,直接把英伟达都给秒了……
2024年,是被寄予希望的「AIGC应用元年」。从年初开始,AIGC又有了不少新动作:Sora凭借雨后东京街头视频一举成名,AI PC、AI手机陆续登场,AI程序员Devin通过面试,OpenAI大模型加持人形机器人Figure 01亮相…
物体姿态估计在许多现实世界应用中起到至关重要的作用,例如具身智能、机器人灵巧操作和增强现实等。
视频理解因大量时空冗余和复杂时空依赖,同时克服两个问题难度巨大,CNN 和 Transformer 及 Uniformer 都难以胜任,Mamba 是个好思路,让我们看看本文是如何创造视频理解的 VideoMamba。
刚刚,Mistral AI 的模型又更新了。 这次开源一如既往地「突然」,是在一个叫做 Cerebral Valley 的黑客松活动上公布的。
以后的爆款歌曲可能要被AI承包了!最近,AI初创公司Suno震撼推出V3音乐生成模型,惊艳了全世界。只需几秒,即可生成2分钟动听的音频。网友纷纷表示:音乐的ChatGPT时刻来临!
Claude 3不但数据集跑分领先,用户体验上也将成为最强大的LLM,GPT-5在哪里?
特斯拉创始人埃隆·马斯克推出了开源大语言模型Grok-1,该模型参数量高达3140亿,是迄今为止参数量最大的开源大模型。
本文讨论了当前市场上的AI手机,并分析了其功能和销售情况。文章提到AI手机主要包括AIGC消除和AI通话摘要等功能,但目前这些功能还不足以支持AI手机成为真正颠覆性的产品。此外,文章还提到了AI手机面临的硬件挑战和消费者购买意愿的问题。
"财跃F1":千亿参数金融大模型首发。国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”今天(3月23日)在2024全球开发者先锋大会(GDC)上首发。