AI资讯新闻榜单内容搜索-反向传播

清华光学AI登Nature！物理神经网络，反向传播不需要了

用光训练神经网络，清华成果最新登上了Nature！

来自主题: AI技术研报

11387 点击 2024-08-09 13:57

自从大型 Transformer 模型逐渐成为各个领域的统一架构，微调就成为了将预训练大模型应用到下游任务的重要手段

来自主题: AI技术研报

11532 点击 2024-07-12 17:47

生物神经网络有一个重要的特点是高度可塑性，这使得自然生物体具有卓越的适应性，并且这种能力会影响神经系统的突触强度和拓扑结构。

来自主题: AI技术研报

9320 点击 2024-07-09 17:15

开源大语言模型（LLM）百花齐放，为了让它们适应各种下游任务，微调（fine-tuning）是最广泛采用的基本方法。基于自动微分技术（auto-differentiation）的一阶优化器（SGD、Adam 等）虽然在模型微调中占据主流，然而在模型越来越大的今天，却带来越来越大的显存压力。

来自主题: AI技术研报

11782 点击 2024-07-04 13:35