О ДЕТЕКЦИИ БРАКА НА ПРОИЗВОДСТВЕННОМ ПРЕДПРИЯТИИ С ИСПОЛЬЗОВАНИЕМ НЕЙРОСЕТЕЙ (НА ПРИМЕРЕ ООО «АЛАТОЙС»)

Талалаев М.В. 1, 2

1 ООО «Алатойс»

2 ФГБОУ ВО «Марийский государственный университет»

Цель исследования – разработка и апробация нейросетевой модели для детекции брака на производственном предприятии, осуществляющем выпуск продукции для детей дошкольного возраста, на базе предобученной модели YOLOv8. Данное решение было предложено для реализации в связи с регулярным получением отзывов с торговых площадок, связанных с теми или иными недокомплектами, что, в свою очередь, образуется ввиду использования ручного труда на предприятии. Попытки решить данный производственный вопрос без применения искусственного интеллекта успехом не увенчались ввиду значительного объема выпускаемых изделий и отсутствием технологий, способных на 100 % исключить данный фактор (брак при ручной сборке). Для проверки гипотезы был создан минимально жизнеспособный продукт, в основе которого был использован собственный размеченный датасет для обучения нейросети, состоящий из изображений выпускаемых изделий с детектируемыми объектами, в течение недели была обучена сама нейросеть на размеченных данных, а также была проведена адаптация результата для конечных пользователей с помощью написания простейшего фронтенда и реализации подключения видеокамеры в режиме реального времени. Модель в своей работе в режиме реального времени показала отличные результаты. Предложенное решение подтвердило первичную гипотезу, а также возможность успешного использования нейросетей на предприятиях Российской Федерации, выпускающих детскую продукцию.

Статья в формате PDF

2350 KB

нейросеть

компьютерное зрение

искусственный интеллект

датасет

детекция брака

ОТК

промышленное предприятие

деревянные игрушки

промышленность

контроль качества

дети

обрабатывающие производства

малый бизнес

1. Всероссийский бизнес-рейтинг. [Электронный ресурс]. URL: https://lider-otrasli.ru/reiting-predpriyatiy.html (дата обращения: 14.10.2024).

2. Как в 1999-м. В России зафиксировали рекордно низкий уровень рождаемости. [Электронный ресурс]. URL: https://360.ru/news/obschestvo/kak-v-1999-m-v-rossii-zafiksiro vali-rekordno-nizkij-uroven-rozhdaemosti/ (дата обращения: 14.10.2024).

3. Сычугов А.Н., Михейчиков В.Н., Чернышов М.В. Применение нейронных сетей для распознавания объектов на железнодорожном транспорте // Известия Петербургского университета путей сообщения. СПб.: ПГУПС, 2023. Т. 20. Вып. 2. C. 478–491.

4. Open Data Annotation Platform. [Электронный ресурс]. URL: https://www.cvat.ai (дата обращения: 14.10.2024).

5. COCO to YOLO converter for instance segmentation (YOLOv8-seg) and oriented bounding box detection (YOLOv8-obb). [Электронный ресурс]. URL: https://github.com/Koldim2001/COCO_to_YOLOv8 (дата обращения: 14.10.2024).

6. Ultralytics YOLOv8. [Электронный ресурс]. URL: https://docs.ultralytics.com/models/yolov8/ (дата обращения: 14.10.2024).

7. OpenCV. [Электронный ресурс]. URL: https://docs.opencv.org/4.x/d6/d00/tutorial_py_root.html (дата обращения: 14.10.2024).

8. tkinter – Python interface to Tcl/Tk. [Электронный ресурс]. URL: https://docs.python.org/3/library/tkinter.html#module- tkinter (дата обращения: 14.10.2024).

Введение

Отрасль создания игрушек является уникальной, в том числе потому, что в ней практически не существует стандартизированных решений в области автоматизации ручного труда. Каждый производитель зачастую занимается собственным конструированием и производством оборудования под конкретную производственную задачу.

Компания «Алатойс» является одним из лидеров страны в области производства детских развивающих игрушек из дерева [1]. В деятельности компании присутствует ручной труд, который при высоких показателях выпуска идентичной продукции в единицу времени непременно приводит к браку в виде недокомплектов изделий, что подтверждается отзывами на маркетплейсах.

С учетом событий начала 2022 г., а также самых низких показателей рождаемости с 1999 г. [2] данные тенденции в целом продолжат негативным образом сказываться на рынке труда и на емкости отрасли. В этой связи вопросы автоматизации труда, повышения его интенсификации и эффективности являются сверхактуальными абсолютно для всех участников рынка исследуемой отрасли промышленности. Особенно с учетом того фактора, что научные труды по использонию компьютерного зрения в области производства деревянных развивающих игрушек отсутствуют.

Автором работы в целях решения поставленной задачи были изучены основные нейронные сети, применяемые в компьютерном зрении (в основном сверточные). Они представлены как одноуровневыми, так и двухуровневыми моделями. Широкую распространенность в компьютерном зрении приобрели следующие нейросети: R-CNN (Region-based Convolutional Neural Networks), EfficientNets, VGG (Visual Geometry Group), ResNets, YOLO (You Only Look Once) [3, с. 478–491]. Выбор последней в качестве одного из инструментов для решения поставленной задачи обусловлен в первую очередь скоростью и точностью ее работы при потреблении незначительных вычислительных ресурсов.

Цель исследования – разработка и апробация нейросетевой модели для детекции брака на производственном предприятии, осуществляющем выпуск продукции для детей дошкольного возраста, на базе предобученной модели YOLOv8.

Материалы и методы исследования

Написание кода осуществлялось на языке Python в интерпретаторе VSCode. Гиперпараметры обучения модели:

− epochs = 500,

− imgsz = 640,

− batch = 32,

− patience = 200.

В рамках исследования был использован собственный датасет, представленный 240 снимками и разделенный в следующих пропорциях:

192 единицы – обучающая выборка,

48 единиц – валидационная.

Разметка снимков проводилась вручную с помощью сервиса CVAT.ai [4]. Для разметки были выделены три уникальных идентификатора в каждом из артикулов, взятых для разметки: «карточки», «фишки», «подставки». Указанные артикулы выбраны ввиду их наибольшей распространенности по недокомплектам в отзывах от покупателей. Разметка проводилась методом «Polygon Shape».

Для преобразования полученных файлов использовался репозиторий c GitHub, расположенный по ссылке: https://github.com/Koldim2001/COCO_to_YOLOv8 [5]. По итогам отработки кода была получена следующая структура рабочей папки:

− файл data.yaml;

− папка train;

− папка validation.

Папки train и validation, в свою очередь, состояли из папок images и labels, а также файла labels.cache. Папка images представлена файлами с расширением *.jpg, папка labels – с расширением *.txt.

Для обучения были выбраны два размера модели YOLOv8 от Ultralitics [6]: yolov8s-seg и yolov8m-seg. Параметры моделей представлены на рис. 1.

Обучение производилось на локальной машине с операционной системой MacOS на чипе m1 и встроенной видеокартой. Как показала практика, выбор аппаратного средства не являлся оптимальным ввиду низкой адаптации ноутбуков на базе указанного чипа под решение аналогичных задач. Обучение меньшей по размеру модели (yolov8s-seg) заняло более 3 суток, большей по размеру (yolov8m-seg) – более 7 суток.

missing image file

Рис. 1. Параметры предобученной модели YOLOv8

missing image file

Рис. 2. Графики метрик качества при детекции box’ов

Результаты исследования и их обсуждение

В результате обучения модели были получены следующие данные, представленные на рис. 2. Первый блок полученных параметров представлен графиками «box»’ов, то есть границ детектируемых объектов и корректности определения их классов (меток).

График в левом верхнем углу отражает f1-меру, то есть гармоническое среднее точности (precision) и полноты (recall). Максимум для всех классов (0,92) метрика принимает при значении парметра confidence (уверенность) в 0,086. В то же время скорость «снижения» графика при росте показателя уверенности предсказания является незначительной. Однозначно можно сделать вывод, что при уверенности более 0,9 модель выдает метрику f1 более 0,8, что говорит о высоком качестве ее работы.

Остальные три графика характеризуют уверенность (confidence) работы модели на метриках точности (precision) и полноты (recall). Можно сделать вывод, что модель уверенно ведет себя при определении точности (значение метрика = 1,0 при confidence = 1,0), то есть 100 % точность работы модели. При этом график Precision – Recall curve (правый верхний график) демонстрирует значение точности более 0,9 при полноте более 0,8 с условием treshhold = 0,5 по метрике mAP. Метрику полноты (recall) для всех классов снижает возможность определения метки «подставка», что говорит о необходимости расширения датасета в целях обучения модели для детекции именно их.

Отметим, что графики метрик качества для определения масок предметов показывают идентичные результаты, поэтому в настоящей статье данный блок графиков будет упущен.

Следующий блок изображений представлен матрицами ошибок (нормализованной и обычной), корреляционной матрицей меток и описанием представленных меток. Группировка изображена на рис. 3.

missing image file

Рис. 3. Графики матриц, полученных в ходе обучения ошибок и меток

missing image file

Рис. 4. Графики ошибок, а также средних значений средней точности при различных пороговых значениях IoU, варьирующихся от 0,5 до 0,95

Представленные графики подтверждают гипотезу худшей отработки модели (по сравнению с остальными метками) для определения метки «подставки». Можно увидеть, что при обучении модель «путает» подставку с фоном изображения, либо, наоборот, определяет подставку там, где на фоне ее нет. В свою очередь, по верхнему правому графику можно сделать предположение, что модель отрабатывает подобным образом ввиду наименьшего количества меток «подставка» в изображениях, вошедших в обучающую выборку, и для последующего получения лучших резльтатов следует дополнить ее именно изображениями с метками «подставка». Но даже с учетом вышенаписанного показатели детекции находятся на высоком уровне (метрика обнуружения объекта с меткой «подставка» равна 0,78).

Одним из основополагающих файлов с точки зрения отслеживания процесса обучения модели является файл с изображениями графиков снижения ошибки при обучении, а также графиков средних значений средней точности при различных пороговых значениях IoU, варьирующихся от 0,5 до 0,95. Все метрики, заложенные разработчиками в модель (определение точности построения прямоугольника координат объекта (box), сегментация объекта (seg), определение вероятности отнесения объекта к той или иной метке (cls), определение объекта при его деформации (dfl), а также метрики средней точности при перекрытии объекта от 50 до 95 % (mAP)), показывают уверенное снижение (в зону нуля) показателей ошибки, а также увеличение значений точности (в зону единицы) с ростом количества эпох обучения. Результаты представлены на рис. 4.

На рис. 5 представлены примеры детекции объектов в рамках обучения описанной выше модели.

missing image file

Рис. 5. Пример изображений, получаемых в ходе обучения модели на базе YOLOv8

missing image file

Рис. 6. Пользовательский интерфейс, в который обернута разработанная модель

После обучения модели на языке Python был написан модуль подключения видеокамеры, в том числе беспроводной, для осуществления детекции и блока упрощенного фронтенда для взаимодействия с пользователем с помощью библиотек cv2 [7] и tkinter [8]. На рис. 6 представлен скриншот фронтенда, в рамках которого пользователь выбирает артикул выпускаемого изделия. В рамках работы конвейера при обнаружении детектируемого объекта код считывает количество обнаруженных меток, на которые обучена модель, и сравнивает их количество с количеством единиц выпущенного продукта (они должны совпадать). Оператор станка запайки сравнивает их и при выявлении расхождений проводит повторную проверку партии.

Заключение

По результатам проведенных экспериментов можно сделать однозначный вывод о том, что разработанный прототип показывает достаточно высокую эффективность при использовании на производстве. Подтверждается гипотеза о возможности использования компьютерного зрения на промышленных предприятиях, оуществляющих разработку продукции для детей. И если в целом компьютерное зрение находит свое применение в крупных отраслях промышленности, то разработанное решение вполне может изменить ситуацию с ручным трудом и отслеживанием брака и в малых формах хозяйствования без потребления значительных ресурсов, что особенно актуально в условиях более жестких мер правительства по борьбе с инфляцией, когда и без того недостаточный доступ к оборотным ресрусам предпринимателей грозит значительным сокращением их общего количества.

Кроме того, обучение предлагаемой модели доказало высокую зависимость от набора данных, из которых происходит формирование исходного датасета. При дальнейшей адаптации продукта к выпуску в промышленное применение требуется дообучить модель для детекции метки «подставка», а также продумать, какие аппаратные средства целесообразно использовать для работы модели непосредственно в рамках конвейерных линий. Таким образом, формируются дальнейшие этапы для научного изыскания.

Библиографическая ссылка

Талалаев М.В. О ДЕТЕКЦИИ БРАКА НА ПРОИЗВОДСТВЕННОМ ПРЕДПРИЯТИИ С ИСПОЛЬЗОВАНИЕМ НЕЙРОСЕТЕЙ (НА ПРИМЕРЕ ООО «АЛАТОЙС») // Современные наукоемкие технологии. 2024. № 11. С. 119-125;
URL: https://top-technologies.ru/ru/article/view?id=40217 (дата обращения: 11.12.2025).
DOI: https://doi.org/10.17513/snt.40217

Научный журнал
Современные наукоемкие технологии

ISSN 1812-7320

"Перечень" ВАК

ИФ РИНЦ = 1,279

О ДЕТЕКЦИИ БРАКА НА ПРОИЗВОДСТВЕННОМ ПРЕДПРИЯТИИ С ИСПОЛЬЗОВАНИЕМ НЕЙРОСЕТЕЙ (НА ПРИМЕРЕ ООО «АЛАТОЙС»)

Библиографическая ссылка

Современные наукоемкие технологии
Научный журнал | ISSN 1812-7320 | ПИ №77-63399