Как с помощью дата-майнинга мы уменьшали брак на металлообрабатывающем заводе — на установке охлаждения +50



Производственная линия

Одна огромная российская производственная компания куёт сталь, которой знаменита наша страна. Эта сталь идёт на строительство судов и на менее романтичные вещи в промышленности вроде труб. У них установлена современная линия — прокатный стан, комплекс для производства крупнолистового проката.

Линия управляется вендорской коробкой типа «чёрный ящик», которая знает усреднённые значения параметров для в среднем оптимального получения результата. Но все заготовки разные, и некоторые результаты выходят с линии бракованными. Их пытаются править с помощью мужика с болгаркой или отправляют назад в переплавку в зависимости от типа брака.

Самая больная точка — устройство контролируемого охлаждения (один из 14 этапов линии). Мы пришли туда со своей математикой для двух задач:

  1. Поиска заготовок, которые надо снимать с линии, — с ними при охлаждении в любом случае получится брак.
  2. Подбора индивидуальных параметров охлаждения под каждую заготовку.

Результат — из тех нескольких процентов брака мы умеем «спасать» 42% заготовок и знаем про заведомый брак (до окончания обработки на линии) на ещё примерно 35% заготовок. Это 10 миллионов рублей на партию.

Что происходит на линии


Первоначально заготовка (обрезанный сляб) загружается в нагревательную печь, где разогревается до температуры порядка 1300 °C. Греется сляб примерно 6 часов. Затем он очищается от окалины гидравлическим сбивом, проходит через клеть с усилием 12 тысяч тонн и установку предварительной правки. Получается лист. Затем в установке контролируемого охлаждения за счёт сверхточных режимов термомеханической обработки раскат приобретает равномерные свойства и микроструктуру по всей длине и ширине листа. После механической правки и участка замедленного охлаждения листы поступают на инспекцию геометрии и в устройство ультразвукового контроля внутренних дефектов. После чего признанные качественными листы подвергаются окончательной резке и сортировке.



Постановка задачи


Лист может быть бракован в следующих случаях:

  1. Неверные геометрические параметры (что-то пошло не так, и его перекосило).
  2. Плены (расслоения металла), трещины, пузыри, раковины и прочие дефекты, вызванные газами в нагретом состоянии металла.

Именно минимизация повреждений из-за действия газов в раскалённой заготовке позволяет больше всего повлиять на снижение брака. Редко когда заготовка приходит сразу бракованной — обычно лист повреждается при охлаждении.

На входе у нас есть набор датчиков, который позволяет всесторонне оценить заготовку. На выходе есть данные контроля качества, которые также дают хорошую картину результата.

Гипотеза в том, что, анализируя первое, второе и режимы работы агрегатов, можно выявить закономерности в том, что именно происходит не так. Напомню, линия уже хороша в состоянии от вендора, но автоматика просто использует некую эвристику «так лучше всем листам» без учёта их индивидуального состояния.

Поскольку интеграция всего этого — процесс длительный, специалисты предприятия сказали следующее: если мы сможем предсказывать брак заранее без ложноположительных срабатываний, то этого будет достаточно для того, чтобы доказать им, что дата-майнинг может быть использован на производстве. Честно говоря, они нам не очень-то доверяли поначалу: это абсолютно нормально, что на тяжёлых производствах металлурги считают тех, кто не видел всего этого вживую несколько лет, немного клоунами.

Результаты первого этапа:

— Модель прогноза аномалий (брака).
— Оценка степени влияния отдельных признаков (параметров) на нарушение температурного режима.
— Оценка степени влияния различных комбинаций признаков на нарушение температурного режима.
— Абсолютную величину влияния изменений каждого единичного признака на температуру (коэффициенты модели линейной регрессии).

Что дал завод


Завод предоставил нам огромный массив данных.

  • Полные исторические данные АСУ ТП первого уровня о параметрах и сигналах для 1000 произведённых листов (в т. ч. показания 2000 датчиков SCADA, используемой заводом).
  • Усреднённые и нормализованные данные второго уровня АСУ ТП, сформированные в базу данных Oracle.
  • Примеры данных термосканера.
  • Отчёты третьего уровня АСУ ТП.

Задача попала в нашу команду R&D. Мы вооружились очень быстро, развернули свой движок машинного обучения в своём же облаке (быстрое прототипирование за 2 недели для доказательства коммерческих гипотез — это наш конёк).

Утром мы получили массив, вечером над ним уже работали скрипты, отлаженные в нашей же среде для разработчиков облака.

Для выполнения задачи первого этапа пилота опробованы различные методы машинного обучения для проведения анализа важности признаков. В результате была выбрана модель линейной регрессии, показавшая наилучший предсказательный эффект:

— достоверность классификации (Precision) — 90%;
— точность попаданий (Recall) — 60%.

Выяснилось, что очень многое зависит от того, с какой температурой лист покидает установку контролируемого охлаждения (УКО). Если он чуть более холодный, чем требуется, почти гарантированно будет брак. Выявили ещё ряд параметров, с которыми корреляция была больше 0,7.

Второй вопрос был такой: а почему некоторые листы выходят из УКО чуть более холодными? Изученная выборка состояла из данных первого уровня IBA, данных второго уровня АСУТП, данных логов управляющей модели SMS-Siemag и данных третьего уровня. Потом мы обсудили свои гипотезы с экспертами завода, которые интуитивно знают, где будет брак, а где нет. Их интуитивные эмпирические модели оказались достаточно точными. В итоговой обучающей выборке осталось 197 различных параметров после удаления малозначимых (отсеянных на первом этапе) и редких.

На предыдущем этапе анализа данных большее внимание было уделено моделированию процесса охлаждения и построению регрессионных моделей. На втором этапе задача решалась как классификация (прогноз возникновения брака) по различным сценариям:

— Классы +25°, -25°, +40°, -40° без объединения и удачные охлаждения.
— Классы +25°, -25° и удачные охлаждения.
— Классы +40°, -40° и удачные охлаждения.

Наилучшим методом, опробованным нами для классификации, показал себя метод XGBoost:

— достоверность классификации (Precision) — 98,8%;
— точность попаданий (Recall) — 42,1%.

Эти параметры в дальнейшем могут быть улучшены благодаря обучению модели на новых данных в процессе использования.

Получилось!


Когда по конвейеру едет заготовка, которая в конце окажется браком (50 листов на тысячу), мы детектируем её заранее в 42% случаев (21 лист из тысячи). Ложноположительных срабатываний пока нет.

Практический результат — экономия более 10 миллионов рублей с одной партии металлических листов.

Результат — готовое ядро промышленной системы, способной в случае высокой вероятности брака самостоятельно выставлять нужные параметры охлаждения. Следующая задача — законченное комплексное решение, которое можно будет тиражировать на предприятиях данного типа. То есть интеграция с узлами линии.


Логическая схема целевой комплексной системы предиктивного анализа

Хочется отметить, что мы сознательно проектировали решение таким образом, чтобы сделать его максимально гибким и независимым от информационной инфраструктуры предприятия. Для этого сетевой уровень может быть представлен любой глобальной сетью внешнего оператора связи, а уровень процессинга — облачным сервисом. Хотя весь комплекс можно реализовать на самом предприятии.

Итак, на уровне процессинга в безопасном и отказоустойчивом облаке размещается кластер «озера данных» (Data Lake), куда стекаются все собранные с объекта управления необходимые нам данные. То есть никаких чёрных ящиков с хардкодом — всё можно менять «на лету», в том числе чистить данные.

Итого: 3 недели на доказательство и первые коммерческие результаты.

Где ещё это применимо


Такие же проекты мы можем быстро сделать для снижения уровня брака на основе анализа входных параметров изделий для аграрных предприятий, производства автомобилей, производителей двигателей и турбин, самолётостроения, судостроительной сферы, станкостроения. Лучше всего дата-майнинг подходит для оценки обработки деталей, обточки, выплавки, закалки, сборки двигателей, сборки деталей. Везде можно существенно снизить брак, оценивая параметры с помощью датчиков на входе и имея обучающую выборку.

И да, мы можем за пару дней оценить возможный коммерческий эффект (это бесплатно) и собрать ядро по типу, как описано выше (это платно, но довольно быстро и доступно в сравнении с интеграцией). Если интересно получить оценку по вашему производству, пишите на GShatirov@technoserv.com.

И да, мы как разработчики очень любим такие проекты. Потому что они быстрые, результативные и удивительно хорошие для нашей личной кармы — видно, как математика экономит огромные деньги.




К сожалению, не доступен сервер mySQL