7B新王登基!Zamba 2完胜同级模型,推理效率比Llama 3提升20%,内存用量更少
7B新王登基!Zamba 2完胜同级模型,推理效率比Llama 3提升20%,内存用量更少Zamba2-7B是一款小型语言模型,在保持输出质量的同时,通过创新架构实现了比同类模型更快的推理速度和更低的内存占用,在图像描述等任务上表现出色,能在各种边缘设备和消费级GPU上高效运行。
Zamba2-7B是一款小型语言模型,在保持输出质量的同时,通过创新架构实现了比同类模型更快的推理速度和更低的内存占用,在图像描述等任务上表现出色,能在各种边缘设备和消费级GPU上高效运行。
2023年8月18日,字节跳动旗下AI对话产品Grace,更名为「豆包」。
TL;DR:DuoAttention 通过将大语言模型的注意力头分为检索头(Retrieval Heads,需要完整 KV 缓存)和流式头(Streaming Heads,只需固定量 KV 缓存),大幅提升了长上下文推理的效率,显著减少内存消耗、同时提高解码(Decoding)和预填充(Pre-filling)速度,同时在长短上下文任务中保持了准确率。
10月23日,此前因被创始人“抛弃”而不再怎么被提及的AI陪伴产品鼻祖Character.ai,在x官方账号上发布了一条声明
过去 24 小时内发布或更新的 AI 服务包括但不限于 Stable Diffusion 3.5 最强模型全家桶、能操作用户电脑的 Claude 3.5 Sonnet、Genmo 开源的可商用的 Mochi 1 DiT、Runway 推出的一款生成式角色表演工具…… 以及我们这里要介绍 Ideogram Canvas,一款基于 AI 的无限创意画板服务,可用于组织、生成、编辑和组合图像。
科技不再只是工具,而是我们心灵的回响。 2013年,电影《Her》为大众描绘了一个人与AI相依相恋的美妙故事。
新版Claude 3.5可以像人一样使用计算机,可把咱人类给兴奋坏了! 毕竟,这意味着新竞赛的开始:AI不再只盯着对话和生成能力,更强调执行和操作。
智能戒指加上 AI,是不是个好主意? 沉寂了3年的智能穿戴设备公司 Oura 正式推出了其最新款智能戒指 Oura Ring 4,让人不得不注意的是,这是一款更合时宜,加入 AI 功能的智能戒指。
来了!Claude 发布新版本的 3.5 Sonnet 和新发布的 3.5 Haiku,能力都有大进步。
CuspAI 预言到 2050 年,碳捕获行业价值将达到 4 万亿美元