从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述
从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述大规模语言模型(LLMs)在很多关键任务中展现出显著的能力,比如自然语言理解、语言生成和复杂推理,并对社会产生深远的影响。然而,这些卓越的能力伴随着对庞大训练资源的需求(如下图左)和较长推理时延(如下图右)。因此,研究者们需要开发出有效的技术手段去解决其效率问题。
大规模语言模型(LLMs)在很多关键任务中展现出显著的能力,比如自然语言理解、语言生成和复杂推理,并对社会产生深远的影响。然而,这些卓越的能力伴随着对庞大训练资源的需求(如下图左)和较长推理时延(如下图右)。因此,研究者们需要开发出有效的技术手段去解决其效率问题。
算力不足仍然是制约通用人工智能发展的重要因素。GPU Utils 今年 8 月的一份数据显示,全球目前 H100 等效算力的供给缺口达到 43 万张。在解决算力不足的问题上,除了抢购和囤积英伟达,更多的方案正在浮出水面。
AGI 到底离我们还有多远?在 ChatGPT 引发的新一轮 AI 爆发之后,伯克利和香港大学的马毅教授领导的一个研究团队给出了自己的最新研究结果:包括 GPT-4 在内的当前 AI 系统所做的正是压缩。
联想发布首款AI PC!AI PC能够创建个性化的本地知识库,通过模型压缩技术运行个人大模型,实现AI自然交互。这意味着AI PC不仅可以自动化完成许多繁琐的任务,提高工作效率,还能根据用户的需求和习惯进行个性化定制,让工作变得更加智能、便捷。
大自然花了数十亿年才演化出第一种能够行走的物种,但新算法将进化过程压缩到了极速——在短短几秒钟内设计出了一个成功行走的机器人。
Deep Render是一家利用AI解决数十年之久的计算机压缩问题的初创公司。它开发了纯人工智能视频压缩技术,据称可以将视频文件大小缩小 5 倍,目标是提高 50 倍。
有效的压缩就是要找到模式,在不丢失信息的情况下将数据变小。当一种算法或模型能准确猜出序列中的下一条数据时,就表明它善于发现这些模式。