马斯克开源Grok-1:3140亿参数迄今最大,权重架构全开放,磁力下载
马斯克开源Grok-1:3140亿参数迄今最大,权重架构全开放,磁力下载说到做到,马斯克承诺的开源版大模型 Grok 终于来了!
说到做到,马斯克承诺的开源版大模型 Grok 终于来了!
AI对字节广告和云业务的影响,比想象中更大。
哈工大联合度小满推出针对多模态模型的自适应剪枝算法 SmartTrim,论文已被自然语言处理顶级会议 COLING 24 接收。
人类设计 prompt 的效率其实很低,效果也不如 AI 模型自己优化。2022 年底,ChatGPT 上线,同时引爆了一个新的名词:提示工程(Prompt Engineering)。
近日,来自MIT的研究人员发表了关于大模型能力增速的研究,结果表明,LLM的能力大约每8个月就会翻一倍,速度远超摩尔定律!硬件马上就要跟不上啦!
左手融钱,右手投资,还刚刚发布了过去一年与商业化博弈的成果。这就是智谱AI在发布ChatGLM千亿对话模型一周年之际,对外界的一顿狂轰乱炸。
在 AI 落地如何 ToB 业务上,有赞是属于「跑得快」的一批玩家。在 2024 年 1 月 FounderPark 的一场直播中,有赞创始人兼 CEO 白鸦就从 SaaS 产品经理的角度,聊了聊大模型时代的产品应该怎么做。而在最近的一场直播中,白鸦则详细分享了有赞如何用 AI 改造他们的 SaaS 服务流程。
早在 2020 年,陶大程团队就发布了《Knowledge Distillation: A Survey》,详细介绍了知识蒸馏在深度学习中的应用,主要用于模型压缩和加速。随着大语言模型的出现,知识蒸馏的作用范围不断扩大,逐渐扩展到了用于提升小模型的性能以及模型的自我提升。
首先先来看看模型底座,阶跃星辰发布了两款,分别是Step-1V和Step-2。其中Step-1V具有千亿参数,支持多模态能力,和GPT4-Turbo一样,128K上下文,不过这款不算惊艳,只能算主流大模型中的正常水平。
在WiNEX Copilot病历文书助手的加持之下,医生们可以一键生成符合医疗规范和匹配患者个人病情的病历文书段落,大幅减少病历记录书写工作量,可以让他们更专注于诊断和治疗。