一个8×8矩阵,让大模型「记住」长对话:Mind Lab联合NTU、复旦推出δ-mem,参数仅0.12%
一个8×8矩阵,让大模型「记住」长对话:Mind Lab联合NTU、复旦推出δ-mem,参数仅0.12%不扩上下文窗口、不换骨干架构、不做全参数微调 —— 只需要一个 8×8 的在线状态矩阵,就能让冻结的 Transformer 拥有真正的长期记忆。
来自主题: AI技术研报
9432 点击 2026-06-08 14:50
搜索
不扩上下文窗口、不换骨干架构、不做全参数微调 —— 只需要一个 8×8 的在线状态矩阵,就能让冻结的 Transformer 拥有真正的长期记忆。