什么是 灾难性遗忘(Catastrophic Forgetting)?

灾难性遗忘(Catastrophic Forgetting)是模型在新数据上训练或微调后,先前学到的能力丢失或退化的现象。

工作原理

灾难性遗忘是微调中的核心风险。模型如果过度适配狭窄数据集,可能在目标样本上更好,却丢失更广泛的语言能力、安全行为、推理、多语言表现或格式能力。它可能由高学习率、训练步数过多、数据狭窄、混合不佳,或覆盖有用表示的全参数更新引起。团队通常用验证套件、更小更新、PEFT、数据混合、正则化和基线能力回归测试来缓解。

主要特点

  • 在新数据训练后退化旧能力
  • 常出现在微调数据狭窄或训练过激时
  • 可能影响安全、推理、多语言、格式或领域知识
  • 如果评估只看新目标任务,问题可能被隐藏
  • 需要对基线能力和留出能力做回归测试

常见用途

  1. 评估 SFT 是否损害通用指令遵循
  2. 检查领域微调是否降低安全拒答能力
  3. 比较全量微调与 LoRA 等 PEFT 方法
  4. 在发布调优模型前运行回归套件
  5. 设计保留通用能力的数据混合方案

示例

loading...
Loading code...

常见问题

如何发现灾难性遗忘?

在微调前后运行覆盖基线能力、安全行为、格式和领域任务的回归评估。

PEFT 能防止灾难性遗忘吗?

它可以降低风险,因为变化的基础权重更少,但不能完全消除遗忘或行为回退。

灾难性遗忘的原因是什么?

常见原因包括数据集狭窄、学习率过高、训练步数过多、数据混合不佳和缺少回归检查。

如何缓解灾难性遗忘?

可以使用精选混合数据、更小更新、PEFT、正则化、早停和覆盖广泛的验证套件。

相关工具

相关术语

相关文章