
Технологии компьютерного зрения становятся неотъемлемой частью современной жизни, трансформируя управление транспортными потоками и обеспечение общественной безопасности. Важнейшим аспектом этой области выступает идентификация и отслеживание объектов. Несмотря на внешнюю простоту, такие системы требуют применения комплексных алгоритмов, способных преодолевать множество технических ограничений.
Специалисты МТУСИ разработали инновационный метод усовершенствования систем распознавания объектов. Исследователи применили передовые технологические решения, включая платформу Google Colab и программный язык Python. Особую роль сыграло использование пакетов Super Gradients с интеграцией YOLO-NAS и Filterpy для создания эффективных алгоритмов мониторинга. Главной целью стала разработка системы одновременного отслеживания множества динамических объектов с применением алгоритмов SORT и DeepSORT.
Эксперты отмечают, что базовый алгоритм SORT демонстрирует высокую скорость обработки данных, но сталкивается с трудностями при сложных сценариях, таких как пересечение траекторий объектов или смена направления движения. Усовершенствованный алгоритм DeepSORT, использующий нейросетевые технологии, показывает значительно более высокую точность даже в неблагоприятных условиях. SORT включает четыре ключевых элемента: детекцию, анализ, сопоставление информации и управление идентификаторами треков.
В рамках практического исследования команда провела тестирование на видеоматериале с движущимся автотранспортом. Намеренно усложненные условия съемки, включая нестандартное положение камеры и частичное перекрытие обзора, позволили выявить ограничения алгоритма SORT. Интеграция технологии глубокой сортировки существенно улучшила точность идентификации движущихся объектов.
Применение современной модели YOLO-NAS позволило присваивать каждому объекту уникальный идентификатор, а последующее отслеживание с помощью DeepSORT обеспечило надежную идентификацию всех транспортных средств, включая частично перекрытые объекты. Тем не менее, исследователи обнаружили некоторые неточности в классификации типов транспортных средств, что может быть исправлено расширением обучающей выборки.
Учитывая реальные ограничения оборудования, исследователи провели серию экспериментов с различной частотой кадров. Анализ показал прямую зависимость эффективности идентификации от мощности детектора. Хотя SORT изначально демонстрирует более высокую скорость обработки, DeepSORT в комбинации с оптимизированной моделью и выборочной обработкой кадров обеспечивает оптимальный баланс скорости и надежности работы.
Проведенные испытания подтвердили эффективность усовершенствованного алгоритма глубокой сортировки для задач мониторинга и идентификации объектов. Особенно впечатляющие результаты достигаются в сложных условиях с временным исчезновением объектов из поля зрения и их взаимным перекрытием. Система сохраняет высокую точность даже при ограниченных вычислительных ресурсах.
Данная разработка открывает широкие перспективы практического применения. Усовершенствованные алгоритмы найдут применение в системах безопасности, беспилотном транспорте, промышленной автоматизации и других сферах, требующих надежного отслеживания объектов в режиме реального времени. Исследование демонстрирует значительный прогресс в развитии технологий компьютерного зрения и их практического применения.
Источник: naked-science.ru





