卷积网络又行了?DeepMind推翻Transformer最强传说,LeCun怒赞
卷积网络又行了?DeepMind推翻Transformer最强传说,LeCun怒赞DeepMind最新研究发现,只要模型设计上没有缺陷,决定模型性能的核心可能是训练计算量和数据。在相同计算量下,卷积神经网络模型和视觉Transformers模型的性能居然能旗鼓相当!
来自主题: AI技术研报
7234 点击 2023-10-29 10:24
DeepMind最新研究发现,只要模型设计上没有缺陷,决定模型性能的核心可能是训练计算量和数据。在相同计算量下,卷积神经网络模型和视觉Transformers模型的性能居然能旗鼓相当!
开源生态系统中出现了大量新兴参与者、模型和使用案例。未来当我们回顾过去时,很可能会将这段时期定位为两种AI类型——专有模型和开源模型——竞争公开化的决定性节点。
谷歌DeepMind的研究人员最近开发了一种技术,通过使用其他人工智能模型来改进提示词,进而提高 ChatGPT 等人工智能语言模型的数学能力
谷歌DeepMind公司的研究人员利用人工智能预测人类基因中的突变是否可能有害,这是人工智能技术帮助加速诊断由基因变异引起的疾病的首批实例之一。
谷歌DeepMind团队最新发现,用这个新“咒语”(Take a deep breath)结合大家已经熟悉的“一步一步地想”(Let’s think step by step),大模型在GSM8K数据集上的成绩就从71.8提高到80.2分。