Модели

Свёрточная нейросеть (CNN)

Свёрточная нейросеть (CNN) — архитектура глубокого обучения, применяющая обучаемые фильтры (ядра свёртки) для извлечения локальных признаков из пространственно структурированных данных, прежде всего изображений; основа большинства производственных систем компьютерного зрения.

Свёрточная нейросеть (CNN) — класс нейронных сетей, в которых вместо полносвязных матриц используются операции свёртки: небольшое ядро (обычно 3×3 или 5×5) скользит по входному тензору, вычисляя скалярное произведение с каждым локальным патчем. Веса ядра разделяются по всей поверхности входа (parameter sharing), что кардинально сокращает число обучаемых параметров и обеспечивает инвариантность к пространственным сдвигам признаков.

Типичная CNN строится из чередующихся слоёв: свёрточные (Conv) извлекают локальные паттерны, нелинейные активации (ReLU) обеспечивают нелинейность, слои субдискретизации (MaxPooling или stride=2) уменьшают пространственное разрешение, формируя иерархию признаков от краёв и текстур в ранних слоях до объектных частей и категорий в глубоких. Знаковые архитектуры: LeNet-5 (LeCun et al., 1998), AlexNet (Krizhevsky, Sutskever, Hinton, 2012 — победитель ImageNet), ResNet (He et al., 2015, остаточные соединения до 152 слоёв), EfficientNet (Tan и Le, 2019).

CNN произвели переворот в компьютерном зрении: на конкурсе ImageNet-2012 AlexNet снизила топ-5 ошибку с ~26% до ~16%, что ознаменовало начало эры глубокого обучения. Архитектурные идеи — локальная связность, разделяемые веса, иерархические признаки — распространились за пределы зрения: 1D-свёртки применяются в NLP и аудио, 3D-свёртки — в видео и медицинской томографии (КТ, МРТ).

К 2026 году CNN по-прежнему широко используются в производственных системах: детекция объектов (семейства YOLO, EfficientDet), медицинская сегментация (U-Net), встроенные системы с ограниченными ресурсами (MobileNet, EfficientNet-Lite). В задачах, требующих глобального контекста, CNN конкурируют с гибридами: ConvNeXt и архитектуры на базе ViT сочетают свёрточные блоки с механизмами внимания. В генеративных моделях свёртки остаются основой кодировщиков и декодеров изображений в VAE и диффузионных моделях.

Пример

Система контроля качества на производстве использует ResNet-50 для классификации дефектов на изображениях деталей с конвейера: ранние свёрточные слои выделяют края и текстуры, глубокие — паттерны царапин и сколов, а финальный классификатор автоматически отбраковывает бракованные детали.

Связанные термины

← Глоссарий