Модели

Нейронная сеть

Нейронная сеть — вычислительная модель из слоёв взаимосвязанных узлов (нейронов), которая учится распознавать паттерны в данных, автоматически подстраивая числовые веса связей между узлами в процессе обучения.

Нейронная сеть — математическая модель обработки информации, архитектурно вдохновлённая биологическим мозгом. Она состоит из входного слоя, одного или нескольких скрытых слоёв и выходного слоя. Каждый слой содержит нейроны, соединённые взвешенными рёбрами. Сигнал проходит по сети: на каждом нейроне вычисляется взвешенная сумма входных значений, к которой применяется нелинейная функция активации (ReLU, sigmoid, tanh), после чего результат передаётся дальше.

Обучение происходит путём минимизации функции потерь с помощью алгоритма обратного распространения ошибки (backpropagation) в сочетании со стохастическим градиентным спуском (SGD) или его модификациями — Adam, AdaGrad. На каждой итерации веса корректируются пропорционально их вкладу в ошибку предсказания. Для борьбы с переобучением применяются dropout, batch normalization и weight decay.

Нейронные сети лежат в основе современного машинного обучения: они используются в компьютерном зрении, обработке естественного языка, системах рекомендаций и генерации медиа. Без них невозможны GPT-4o, DALL-E 3, AlphaFold 3 и промышленные системы распознавания дефектов на производстве.

К 2026 году нейронные сети охватывают диапазон от нескольких тысяч параметров (для встраиваемых устройств) до сотен миллиардов. Доминирующий тренд — разреженные архитектуры Mixture of Experts (MoE), в которых на каждый запрос активируется лишь подмножество нейронов, что снижает вычислительные затраты при сохранении высокого качества.

Пример

Нейронная сеть, обученная на миллионах медицинских снимков, помогает радиологам обнаруживать злокачественные образования на маммограммах с точностью, сопоставимой с врачом-специалистом, сокращая время анализа в несколько раз.

Связанные термины

← Глоссарий