Question 1

无监督学习和监督学习的主要区别是什么？

Accepted Answer

监督学习使用带标签的数据进行训练，模型学习输入和已知输出之间的映射关系。无监督学习则使用未标记的数据，模型自主发现数据中的隐藏模式和结构，无需预定义的目标输出。监督学习适合分类和回归任务，无监督学习适合聚类和降维任务。

Question 2

无监督学习有哪些常见的算法？

Accepted Answer

常见的无监督学习算法包括：聚类算法（K-Means、层次聚类、DBSCAN）、降维算法（PCA 主成分分析、t-SNE、UMAP）、异常检测算法（孤立森林、LOF）、以及生成模型（高斯混合模型、自编码器）。不同算法适用于不同的数据分析场景。

Question 3

什么时候应该使用无监督学习？

Accepted Answer

当遇到以下情况时适合使用无监督学习：1）没有标记数据或标记成本过高；2）需要探索数据的内在结构；3）进行客户分群或市场细分；4）检测异常或欺诈行为；5）需要对高维数据进行可视化或压缩。

Question 4

如何评估无监督学习模型的效果？

Accepted Answer

由于没有标签，无监督学习的评估比监督学习更具挑战性。常用的评估方法包括：轮廓系数（Silhouette Score）衡量聚类质量、Davies-Bouldin 指数、肘部法则确定最佳聚类数、以及通过可视化检查结果的合理性。有时也需要结合领域专家的判断。

Question 5

无监督学习在实际业务中有哪些应用？

Accepted Answer

无监督学习在商业中广泛应用：电商平台用于客户分群和个性化推荐；金融机构用于信用卡欺诈检测；医疗领域用于疾病亚型发现；社交媒体用于话题发现和内容聚类；制造业用于设备异常检测和预测性维护。

什么是无监督学习？

快速了解