斯坦福大学公布 "基础模型透明度指数”,LLaMA 2排名第一,GPT-4排在第三
斯坦福大学公布 "基础模型透明度指数”,LLaMA 2排名第一,GPT-4排在第三斯坦福大学的研究人员公布了一套 "基础模型透明度指数"评分系统,目的是让大家对AI模型有更深的了解
斯坦福大学的研究人员公布了一套 "基础模型透明度指数"评分系统,目的是让大家对AI模型有更深的了解
这两天,FlashAttention团队推出了新作: 一种给Transformer架构大模型推理加速的新方法,最高可提速8倍。 该方法尤其造福于长上下文LLM,在64k长度的CodeLlama-34B上通过了验证
在目前阶段,超算与AI计算的融合是大势所趋。为了将AI模型与AI计算融入超算体系,一轮新的超算变革正在酝酿发生。
在2023中国移动全球合作伙伴大会主论坛上,中国移动重磅发布“九天•众擎基座大模型”。
为了抓住人工智能热潮,云服务提供商Cloudflare推出了一系列帮助客户在网络边缘构建、部署和运行AI模型的新产品和应用。
昨天,Baichuan2-53B正式发布!首次开放API,意味着百川大模型开始正式进军商用了。另外,模型的数学和逻辑推理能力都大幅飙升,对于幻觉的处理,已经在国内遥遥领先。
来自清华大学的研究团队提出了一个深度强化学习算法的模型。基于 15 分钟城市概念,该模型可以进行复杂的城市空间规划。
大规模语言模型在众多下游任务中展现了惊人的能力,但它们在使用中仍然暴露了一些问题。其中,幻觉是目前影响大模型落地的重要问题之一。
《华尔街日报》报道,Meta 公司一直在抢购人工智能训练芯片并建立数据中心,以创建一个与chatGPT 4.0一样强大的新AI。
一家华人女科学家的创业公司晋升为独角兽,英伟达等机构投资超2亿美元。该公司手握1万块H100显卡!