
用神经架构搜索给LLM瘦身,模型变小,准确度有时反而更高
用神经架构搜索给LLM瘦身,模型变小,准确度有时反而更高大型语言模型(LLM)的一个主要特点是「大」,也因此其训练和部署成本都相当高,如何在保证 LLM 准确度的同时让其变小就成了非常重要且有价值的研究课题。
来自主题: AI技术研报
8528 点击 2024-06-11 10:06
大型语言模型(LLM)的一个主要特点是「大」,也因此其训练和部署成本都相当高,如何在保证 LLM 准确度的同时让其变小就成了非常重要且有价值的研究课题。