什么是 卷积神经网络?
卷积神经网络(CNN,Convolutional Neural Network)是一类专门用于处理图像等结构化网格数据的深度神经网络,通过卷积层使用可学习的滤波器自动学习空间层次特征,从而检测边缘、纹理和复杂对象等模式。
快速了解
| 创建时间 | 1989 年由 Yann LeCun 等人提出(LeNet) |
|---|---|
| 规范文档 | 官方规范 |
工作原理
卷积神经网络的设计灵感来源于生物视觉皮层,彻底革新了计算机视觉领域。其架构通常由三种主要类型的层组成:用于提取特征的卷积层、用于降低空间维度同时保留重要信息的池化层,以及用于执行高级推理和分类的全连接层。CNN 的关键创新在于通过卷积核实现参数共享,这大大减少了与全连接网络相比的参数数量,同时保持了检测输入中任意位置特征的能力。这种平移不变性使 CNN 在图像相关任务中特别有效。
主要特点
- 局部感受野能够捕获输入数据中的空间关系
- 通过卷积核实现参数共享,降低模型复杂度
- 平移不变性使特征检测不受位置影响
- 从低级边缘到高级对象的层次化特征提取
- 池化操作提供空间不变性和降维功能
- 稀疏连接相比全连接网络减少过拟合风险
常见用途
- 图像分类与识别(ImageNet、CIFAR-10)
- 目标检测与定位(YOLO、Faster R-CNN)
- 人脸识别与验证系统
- 医学图像分析(肿瘤检测、X 光诊断)
- 自动驾驶车辆感知与场景理解
示例
Loading code...常见问题
什么是深度学习中的 CNN?
CNN(卷积神经网络)是一种专为处理图像等网格状数据设计的深度学习架构。它使用带有可学习滤波器的卷积层自动提取边缘、纹理和复杂对象等空间特征,以层次化的方式进行学习。
CNN 是如何工作的?
CNN 通过三种主要层类型工作:卷积层应用滤波器检测特征,池化层减少空间维度同时保留信息,全连接层执行分类。滤波器在输入上滑动,无论位置在哪都能检测模式。
CNN 和 RNN 有什么区别?
CNN 专为空间数据(图像)设计,使用卷积操作;RNN 处理序列数据(文本、时间序列),使用循环连接。CNN 擅长检测局部模式;RNN 捕获时间依赖。CNN 可以并行处理输入;RNN 顺序处理。
有哪些流行的 CNN 架构?
流行的架构包括 LeNet(原始)、AlexNet(突破性)、VGGNet(深度堆叠)、ResNet(跳跃连接)、Inception/GoogLeNet(多尺度)、EfficientNet(复合缩放)和 MobileNet(移动端优化)。每个都引入了推动领域发展的创新。
CNN 有哪些常见应用?
CNN 用于图像分类、目标检测(YOLO、Faster R-CNN)、人脸识别、医学图像分析(肿瘤检测、X光)、自动驾驶感知、视频分析,甚至使用一维卷积的文本分类等非图像任务。