Question 1

微调语言模型需要多少数据？

Accepted Answer

数据量因任务和方法而异。对于指令微调，质量比数量更重要——即使是 1,000-10,000 个高质量示例也能显著提升性能。LoRA 等参数高效方法可以使用较小的数据集（数百到数千个示例），而全参数微调通常受益于更大的数据集。始终优先考虑数据质量而非数量。

Question 2

LoRA 和全参数微调有什么区别？

Accepted Answer

全参数微调更新所有模型参数，需要大量计算和内存，但可能达到最佳性能。LoRA（低秩适配）只训练添加到注意力层的小型适配器矩阵，通常只更新 0.1-1% 的参数。LoRA 使用更少内存，训练更快，生成更小的检查点文件，同时达到全参数微调 90-95% 的质量。

Question 3

微调会让模型忘记原有能力吗？

Accepted Answer

是的，这被称为灾难性遗忘。在狭窄数据上进行激进的微调可能会降低通用能力。为缓解这一问题，可以使用较低的学习率、包含多样化的训练数据、应用正则化技术，或使用保留大部分原始权重的参数高效方法如 LoRA。将一些通用数据与领域特定数据混合也有帮助。

Question 4

什么时候应该选择微调而不是小样本提示？

Accepted Answer

当你需要大规模一致的行为、有特定的格式或风格要求、想降低每次查询的成本（更短的提示）、需要在专业任务上提升性能，或需要嵌入领域知识时，选择微调。小样本提示更适合快速原型、需求经常变化的任务，或缺乏训练数据时。

Question 5

微调大语言模型需要什么硬件？

Accepted Answer

硬件需求取决于方法和模型大小。7B+ 模型的全参数微调通常需要多个高端 GPU（A100、H100），每个至少 40GB 显存。QLoRA 可以在 24GB 显存的消费级 GPU（RTX 3090/4090）上微调 7B-13B 模型。对于超大模型（70B+），即使是 QLoRA 也需要多个 GPU 或具有大量内存的云实例。

全称	Fine-tuning
创建时间	随 BERT（2018）和 GPT 模型普及
规范文档	官方规范

什么是微调？

快速了解

工作原理

主要特点

常见用途

示例

常见问题

微调语言模型需要多少数据？

LoRA 和全参数微调有什么区别？

微调会让模型忘记原有能力吗？

什么时候应该选择微调而不是小样本提示？

微调大语言模型需要什么硬件？

相关工具

JSON 格式化

CSV转JSON工具

相关术语

LoRA

PEFT

RLHF

DPO

相关文章

LLM微调方法对比：全量微调、LoRA与QLoRA怎么选

LoRA微调实战：QLoRA配置与PEFT高效微调指南

RAG vs 微调 (Fine-tuning)：大模型企业级落地该如何选型？【2026】