AI资讯新闻榜单内容搜索-SALA

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: SALA

9B端侧开源模型跑通百万上下文，面壁全新稀疏-线性混合注意力架构SALA立功了！

9B端侧开源模型跑通百万上下文，面壁全新稀疏-线性混合注意力架构SALA立功了！

9B端侧开源模型跑通百万上下文，面壁全新稀疏-线性混合注意力架构SALA立功了！

最强的大模型，已经把scaling卷到了一个新维度：百万级上下文。

来自主题: AI技术研报

10804 点击 2026-02-12 10:35

一行代码训练成本再降30%，AI大模型混合精度训练再升级｜开源

一行代码训练成本再降30%，AI大模型混合精度训练再升级｜开源

一行代码训练成本再降30%，AI大模型混合精度训练再升级｜开源

FP8通过其独特的数值表示方式，能够在保持一定精度的同时，在大模型训练中提高训练速度、节省内存占用，最终降低训练成本。

来自主题: AI技术研报

5177 点击 2024-09-26 11:57

上一页当前第1页,共1页下一页