OpenAI新论文拆解语言模型内部机制:用「稀疏电路」解释模型行为
OpenAI新论文拆解语言模型内部机制:用「稀疏电路」解释模型行为就在今天,OpenAI 发布了一项新研究,使用新方法来训练内部机制更易于解释的小型稀疏模型,其神经元之间的连接更少、更简单,从而观察它们的计算过程是否更容易被人理解。
来自主题: AI技术研报
7901 点击 2025-11-15 17:47
搜索
就在今天,OpenAI 发布了一项新研究,使用新方法来训练内部机制更易于解释的小型稀疏模型,其神经元之间的连接更少、更简单,从而观察它们的计算过程是否更容易被人理解。