什么是灾难性遗忘（Catastrophic Forgetting）？

灾难性遗忘（Catastrophic Forgetting）是模型在新数据上训练或微调后，先前学到的能力丢失或退化的现象。

工作原理

灾难性遗忘是微调中的核心风险。模型如果过度适配狭窄数据集，可能在目标样本上更好，却丢失更广泛的语言能力、安全行为、推理、多语言表现或格式能力。它可能由高学习率、训练步数过多、数据狭窄、混合不佳，或覆盖有用表示的全参数更新引起。团队通常用验证套件、更小更新、PEFT、数据混合、正则化和基线能力回归测试来缓解。

主要特点

在新数据训练后退化旧能力
常出现在微调数据狭窄或训练过激时
可能影响安全、推理、多语言、格式或领域知识
如果评估只看新目标任务，问题可能被隐藏
需要对基线能力和留出能力做回归测试

常见用途

评估 SFT 是否损害通用指令遵循
检查领域微调是否降低安全拒答能力
比较全量微调与 LoRA 等 PEFT 方法
在发布调优模型前运行回归套件
设计保留通用能力的数据混合方案

示例

loading...

Loading code...

常见问题

如何发现灾难性遗忘？

在微调前后运行覆盖基线能力、安全行为、格式和领域任务的回归评估。

PEFT 能防止灾难性遗忘吗？

它可以降低风险，因为变化的基础权重更少，但不能完全消除遗忘或行为回退。

灾难性遗忘的原因是什么？

常见原因包括数据集狭窄、学习率过高、训练步数过多、数据混合不佳和缺少回归检查。

如何缓解灾难性遗忘？

可以使用精选混合数据、更小更新、PEFT、正则化、早停和覆盖广泛的验证套件。

相关工具

JSON 格式化

免费在线JSON格式化(Format)与美化解析工具，一键快速格式化、语法校验和压缩任意复杂的JSON数据字符串。支持直观的代码语法高亮显示、可折叠的交互式树形视图(Tree View)、最近格式化历史记录保存和一键快速复制结果。广泛适用于前后端API接口调试、日志数据分析、以及各类系统配置文件编辑。无需注册登录，100%纯前端本地处理，绝不泄露您的数据隐私。

文本分析器

免费在线全能文本分析与高级字数统计工具。提供极其详尽的字数、总字符数、句子数、段落数精确统计功能，全面支持多语言智能分词(包含中文字符与英文字词独立识别统计)。提供核心高频关键词提取分析、用户平均阅读时间预估和文本排版特征深度检测。专为职业作家、文案编辑、自媒体运营和学生群体设计的文本内容优化辅助神器，即开即用。

代码对比

免费在线代码对比(Code Diff)与差异比较工具，支持多种代码语法高亮对比两段文本或代码文件。全面支持 JavaScript、Python、Java、C++ 等 20+ 种主流编程语言。提供类似 GitHub 风格的直观差异视图，支持字符级深度的差异高亮显示，完美适合程序员进行代码审查(Code Review)、版本迭代比较和线上调试排错。

相关术语

微调

微调（Fine-tuning）是一种迁移学习技术，通过在较小的特定任务数据集上继续训练过程，将预训练的机器学习模型适配到特定任务或领域。这种方法利用预训练模型中已捕获的通用知识，同时为专业应用定制其行为。

监督微调（SFT）

监督微调（SFT）是一种监督训练阶段，它在精选的提示词-回答样本上微调预训练语言模型。

PEFT

PEFT（Parameter-Efficient Fine-Tuning，参数高效微调）是一系列技术，通过仅训练一小部分参数来使大型预训练模型适应下游任务，在保持竞争性能的同时大幅降低计算需求。

数据集策划（Dataset Curation）

数据集策划（Dataset Curation）是选择、清洗、组织、标注、去重和验证数据，使其适合模型训练或评估的过程。

相关文章

LLM微调方法对比：全量微调、LoRA与QLoRA怎么选

全面系统地掌握现代大语言模型微调(LLM Fine-Tuning)核心底层技术。深度解析全量参数微调(Full Fine-Tuning)、LoRA 及其量化进阶版 QLoRA 等 PEFT(参数高效微调)算法模型的实现原理。本文包含基于 Hugging Face 框架的完整实战训练代码、私有高质量数据集准备清洗指南、以及微调技术与 RAG(检索增强生成)的优劣对比选择策略，助你低成本、高效率地训练定制专属的行业垂直领域 AI 大模型。

LoRA微调实战：QLoRA配置与PEFT高效微调指南

深入硬核理解 AI 大模型 LoRA（Low-Rank Adaptation/低秩微调）核心前沿技术的底层数学原理。详尽剖析基于低秩矩阵分解的参数更新机制、Alpha(α)与 Rank(r)等关键超参数的科学调优配置策略。结合最新的 QLoRA 量化模型优化技术与主流的 PEFT 训练库，手把手带您完成实战代码编写，彻底掌握如何将模型微调训练的 GPU 显存门槛大幅降低 90% 以上，在消费级显卡上实现专业级别的定制化模型效果。

RAG vs 微调 (Fine-tuning)：大模型企业级落地该如何选型？【2026】

深入对比检索增强生成 (RAG) 与模型微调 (Fine-tuning)。了解它们在成本、幻觉抑制、数据更新机制上的核心差异，以及在企业级 AI 落地中该如何做出正确的技术选型。