Habr AI→ оригинал

ML на заводе: почему автоматизация хаоса порождает только хаос

Внедрение ML в промышленность часто напоминает попытку построить небоскрёб на болоте. В центре внимания — кейс расчёта трудоёмкости операций, где нейросети стол

ML на заводе: почему автоматизация хаоса порождает только хаос
Источник: Habr AI. Коллаж: Hamidun News.

Представьте, что вы решили построить идеальный график работы огромного завода, но вместо фундамента у вас — зыбучий песок из записок на салфетках и фантазий мастеров цеха за последние десять лет. Именно в такую ловушку попадают многие IT-директора, когда решают, что машинное обучение — это магическая палочка, способная мгновенно посчитать трудоёмкость производства. В теории всё выглядит красиво: скармливаем модели данные о прошлых заказах, и она выдаёт идеальное время на каждую операцию. На практике же выясняется, что ИИ не просто ошибается, а делает это с пугающей уверенностью, масштабируя бардак, который копился десятилетиями.

Проблема расчёта трудоёмкости в машиностроении — это не просто вопрос математики, это вопрос выживания бизнеса. От этих цифр зависит всё: от себестоимости детали до загрузки станков и финальной цены для заказчика. Традиционно этим занимаются нормировщики, но их работа часто субъективна и медленна. Желание заменить их алгоритмом понятно, но оно игнорирует фундаментальный закон работы с данными: мусор на входе — мусор на выходе. Если ваши исторические данные отражают не реальное время работы, а то, которое мастер «нарисовал» в отчёте для получения премии, то ML-модель научится именно «рисовать», а не считать.

Когда команда энтузиастов берется за обучение моделей на «грязных» данных, они быстро обнаруживают, что классические алгоритмы начинают галлюцинировать. Вероятностные модели отлично находят закономерности там, где их нет, или, что ещё хуже, принимают системные ошибки за истину. В итоге получается «ускоритель ошибок». Там, где человек мог бы засомневаться, увидев странную цифру, автоматизированная система просто проглатывает её и выдаёт результат, который выглядит солидно, но не имеет ничего общего с реальностью цеха. Это создаёт иллюзию контроля, которая обходится компании дороже, чем полное отсутствие автоматизации.

Почему так происходит? В индустрии сложился опасный разрыв между теми, кто пишет код, и теми, кто стоит у станка. Дата-сайентисты часто воспринимают завод как набор таблиц в SQL-базе, не задумываясь о том, как эти цифры туда попали. А попали они туда через руки людей, у которых были свои стимулы, страхи и лень. Если в компании нет культуры сбора чистых данных и единой методологии нормирования, то любая попытка прикрутить сверху ИИ — это просто дорогостоящий способ пустить пыль в глаза руководству. Вы не решаете проблему, вы её консервируете в цифровом виде.

Настоящий прорыв в промышленном ИИ случится не тогда, когда мы изобретём новую архитектуру трансформеров, а когда компании осознают важность «гигиены процессов». Прежде чем обучать модель, нужно выстроить систему объективного контроля, убрать человеческий фактор из фиксации времени и, возможно, выкинуть 90% накопленного цифрового мусора. Это скучная, долгая и неблагодарная работа, которую нельзя продать как «инновационный прорыв», но именно она отделяет работающие решения от красивых презентаций, которые никогда не покинут пределы пилотного проекта.

Главное: Машинное обучение не лечит кривые процессы, оно их масштабирует. Готовы ли вы признать, что ваши данные — это мусор, прежде чем тратить миллионы на их автоматизацию?

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…