Question 1

什么是小语言模型？

Accepted Answer

小语言模型（SLM）是参数数量显著少于大型语言模型的语言模型，通常低于 100 亿参数。SLM 专为在手机和笔记本电脑等资源受限设备上高效部署而设计，同时仍提供有用的 AI 能力。

Question 2

SLM 与 LLM 在性能上如何比较？

Accepted Answer

SLM 以一些能力换取效率。虽然它们在复杂推理任务上可能无法匹敌 LLM，但现代 SLM 在许多实际任务上表现出色。经过微调后，它们在特定领域表现优异，并提供更快的推理、更低的成本和本地运行的能力。

Question 3

有哪些流行的小语言模型？

Accepted Answer

流行的 SLM 包括微软的 Phi-3（38 亿参数）、谷歌的 Gemma-2B、Meta 的 Llama-3.2-3B、阿里巴巴的 Qwen2.5-3B 和 HuggingFace 的 SmolLM。这些模型证明了在高质量数据上精心训练可以用更少的参数实现强大的结果。

Question 4

小语言模型有哪些优势？

Accepted Answer

SLM 的优势包括：无需 GPU 即可在消费级硬件上运行、更快的推理和更低的延迟、降低运营成本、无需云依赖的离线能力、通过本地保存数据获得更好的隐私，以及更容易在边缘设备和移动平台上部署。

Question 5

小语言模型是如何训练的？

Accepted Answer

SLM 使用以下技术训练：从更大模型进行知识蒸馏、精心策划高质量训练数据、高效架构和专门的训练目标。一些 SLM 使用由更大模型生成的合成数据来提高训练效率。

全称	Small Language Model (SLM)
创建时间	2023-2024 年随 Phi、Gemma、SmolLM 等模型兴起

什么是小语言模型？

快速了解