Модели

Глубокое обучение

Глубокое обучение — подраздел машинного обучения, в котором используются многослойные нейронные сети для автоматического извлечения иерархических признаков из сырых данных без ручного проектирования признаков.

Глубокое обучение — направление машинного обучения, отличительная черта которого — нейронные сети с большим числом обрабатывающих слоёв. «Глубина» позволяет сети строить иерархию представлений: ранние слои фиксируют низкоуровневые признаки (края, частоты, отдельные символы), средние — структурные паттерны, поздние — абстрактные понятия и семантические отношения. Это устраняет необходимость в ручном проектировании признаков (feature engineering), доминировавшем в классическом машинном обучении до начала 2010-х годов.

Практический расцвет глубокого обучения начался в 2012 году, когда свёрточная сеть AlexNet снизила топ-5 ошибку классификации ImageNet с примерно 26 % до примерно 15 %, почти вдвое превзойдя предыдущие методы. Ключевые архитектуры: свёрточные сети (CNN) для изображений, рекуррентные сети (LSTM, GRU) для последовательностей, трансформеры для текста и мультимодальных задач, диффузионные модели для генерации контента. Обучение крупных моделей требует кластеров из тысяч GPU или TPU и занимает от нескольких недель до нескольких месяцев.

Глубокое обучение стало основой для прорывов в распознавании речи (Whisper от OpenAI), машинном переводе (DeepL), синтезе изображений (Stable Diffusion), предсказании структуры белков (AlphaFold 3 от Google DeepMind) и системах автономного управления транспортом. Ключевые ограничения — низкая интерпретируемость результатов, высокое энергопотребление при обучении и зависимость от больших размеченных датасетов.

К 2026 году акцент сместился в сторону вычислительной эффективности: дистилляция знаний (knowledge distillation), квантование весов (int8, int4) и разреженные архитектуры позволяют запускать мощные модели на потребительских устройствах. Самообучение (self-supervised learning) и обучение с подкреплением от обратной связи людей (RLHF) снижают зависимость от дорогостоящей ручной разметки.

Пример

В рамках проекта AlphaFold 3 система глубокого обучения Google DeepMind в 2024 году предсказала структуры белков и их взаимодействий с лигандами — задача, прежде требовавшая месяцев экспериментальной работы в лаборатории.

Связанные термины

← Глоссарий