Question 1

什么是 GAN 中的模式崩溃，如何防止？

Accepted Answer

模式崩溃发生在生成器只学会产生有限种类的输出，忽略训练数据的完整多样性时。防止策略包括使用 Wasserstein 损失（WGAN）、实现小批量判别、向判别器输入添加噪声、使用渐进式增长技术，或采用谱归一化等架构改进。

Question 2

GAN 与扩散模型在图像生成方面相比如何？

Accepted Answer

扩散模型由于训练更稳定、模式覆盖更好和输出质量更高，已在高质量图像生成方面大体上取代了 GAN。然而，GAN 在需要实时生成（单次前向传递 vs. 迭代去噪）、视频合成以及推理速度至关重要的应用中仍然表现出色。

Question 3

为什么 GAN 训练被认为是不稳定的？

Accepted Answer

GAN 训练涉及生成器和判别器之间的微妙平衡——如果一方变得太强，训练就会失败。判别器可能变得太擅长检测假样本（导致生成器的梯度消失），或者生成器可能找到欺骗判别器的捷径而不产生高质量输出。这需要仔细调整超参数和架构选择。

Question 4

有哪些流行的 GAN 变体及其用途？

Accepted Answer

StyleGAN/StyleGAN2 擅长具有可控属性的高分辨率人脸生成。CycleGAN 实现无配对的图像到图像转换（如照片到绘画）。Pix2Pix 处理配对的图像转换任务。SRGAN 专注于图像超分辨率。BigGAN 大规模生成高质量多样化图像。每个变体都解决了原始 GAN 架构的特定局限性。

Question 5

GAN 可以用于机器学习中的数据增强吗？

Accepted Answer

可以，GAN 在合成数据增强方面很有效，特别是当真实数据稀缺、昂贵或涉及隐私时。它们可以为医学成像、罕见事件检测和隐私保护应用生成额外的训练样本。但要确保生成的样本具有多样性，且不会放大原始训练数据中存在的偏见。

创建时间	2014 年由 Ian Goodfellow 等人提出
规范文档	官方规范

什么是生成对抗网络？

快速了解