什么是 LoRA 秩(LoRA Rank)?

LoRA 秩(LoRA Rank)是 LoRA 适配器中使用的低秩维度,用于控制向冻结基础模型添加多少可训练容量。

工作原理

LoRA 用低秩矩阵近似权重更新。rank 决定这些矩阵的大小:更高 rank 增加可训练参数和表达能力,更低 rank 成本更低、体积更小。选择 rank 是实际工程取舍,而不是通用规则。较小 rank 可能无法拟合复杂任务;较大 rank 可能增加显存、训练时间、存储和过拟合。rank 应结合验证数据、目标模块、数据集大小和部署约束调优。

主要特点

  • 控制 LoRA 适配器更新的可训练容量
  • 更高 rank 通常增加显存、存储和适配能力
  • 更低 rank 成本更低,但可能欠拟合困难或宽泛任务
  • 会与目标模块、alpha 缩放、dropout 和数据质量相互作用
  • 应通过任务验证选择,而不是盲目复制默认值

常见用途

  1. 为领域指令遵循调优 LoRA 适配器
  2. 在 GPU 显存和微调质量之间平衡
  3. 比较 r=8、r=16 和 r=64 的适配器实验
  4. 为大量客户变体减少适配器存储
  5. 诊断 PEFT 实验中的欠拟合或过拟合

示例

loading...
Loading code...

常见问题

LoRA rank 应该从多少开始?

常见实验会从 8 或 16 等适中 rank 开始,再根据任务质量、显存和过拟合情况验证。

rank 越高质量一定越好吗?

不是。更高 rank 增加容量,但如果任务或数据集不需要,可能浪费资源或过拟合。

LoRA rank 如何影响部署?

更高 rank 会增加适配器大小,并可能影响显存和加载成本,尤其是服务许多适配器时。

rank 是 LoRA 唯一重要参数吗?

不是。目标模块、alpha、dropout、学习率、数据质量和训练步数也很重要。

相关工具

相关术语

相关文章

LoRA微调实战:QLoRA配置与PEFT高效微调指南

深入硬核理解 AI 大模型 LoRA(Low-Rank Adaptation/低秩微调)核心前沿技术的底层数学原理。详尽剖析基于低秩矩阵分解的参数更新机制、Alpha(α)与 Rank(r)等关键超参数的科学调优配置策略。结合最新的 QLoRA 量化模型优化技术与主流的 PEFT 训练库,手把手带您完成实战代码编写,彻底掌握如何将模型微调训练的 GPU 显存门槛大幅降低 90% 以上,在消费级显卡上实现专业级别的定制化模型效果。

2026-02-21

LLM微调方法对比:全量微调、LoRA与QLoRA怎么选

全面系统地掌握现代大语言模型微调(LLM Fine-Tuning)核心底层技术。深度解析全量参数微调(Full Fine-Tuning)、LoRA 及其量化进阶版 QLoRA 等 PEFT(参数高效微调)算法模型的实现原理。本文包含基于 Hugging Face 框架的完整实战训练代码、私有高质量数据集准备清洗指南、以及微调技术与 RAG(检索增强生成)的优劣对比选择策略,助你低成本、高效率地训练定制专属的行业垂直领域 AI 大模型。

2026-02-21

小模型崛起:2B/8B 参数模型如何在边缘设备上替代大模型

深度解析小语言模型(SLM)的崛起趋势。对比 Microsoft Phi-4、Google Gemma 3、Qwen3、Llama 3.2 等主流小模型,涵盖边缘设备部署方案、INT4/INT8 量化优化、LoRA 微调实战,以及使用 Ollama 本地部署的完整代码示例。

2026-04-22