YOLOv6-3.0 против DAMO-YOLO: техническое сравнение для обнаружения объектов
Выбор оптимальной модели обнаружения объектов — критически важное решение в проектах компьютерного зрения. На этой странице представлено подробное техническое сравнение между YOLOv6-3.0 и DAMO-YOLO, двумя известными моделями, признанными за их эффективность и точность в задачах обнаружения объектов. Мы рассмотрим их архитектурные нюансы, эталонные показатели производительности и пригодность для различных приложений, чтобы помочь вам в выборе.
Обзор YOLOv6-3.0
YOLOv6-3.0, разработанная компанией Meituan, представляет собой структуру обнаружения объектов, предназначенную в первую очередь для промышленных приложений. Выпущенная в начале 2023 года, она ориентирована на обеспечение надежного баланса между высокой скоростью логического вывода и конкурентоспособной точностью, что делает ее подходящей для реальных сценариев развертывания.
- Авторы: Чуйи Ли, Лулу Ли, Ифэй Генг, Хунлян Цзян, Мэн Чэн, Бо Чжан, Зайдан Ке, Сяомин Сюй и Сянсян Чу
- Организация: Meituan
- Дата: 13.01.2023
- Arxiv: https://arxiv.org/abs/2301.05586
- GitHub: https://github.com/meituan/YOLOv6
- Документация: https://docs.ultralytics.com/models/yolov6/
Архитектура и ключевые особенности
YOLOv6-3.0 акцентирует внимание на аппаратном дизайне нейронной сети для максимальной эффективности. Его архитектура оптимизирована для скорости и практичности.
- Эффективный Reparameterization Backbone: Эта конструкция оптимизирует структуру сети после обучения, что значительно ускоряет скорость инференса без ущерба для репрезентативной мощности модели.
- Гибридная канальная стратегия: Модель использует гибридную канальную стратегию в своем neck, балансируя точность и вычислительную эффективность в слоях извлечения признаков.
- Оптимизированная стратегия обучения: YOLOv6-3.0 включает в себя расширенный режим обучения, в том числе самодистилляцию, для улучшения сходимости модели и общей производительности во время фазы обучения.
Производительность и варианты использования
YOLOv6-3.0 особенно хорошо подходит для промышленных сценариев, требующих сочетания скорости и точности. Его оптимизированная конструкция делает его эффективным для:
- Промышленная автоматизация: Выполнение контроля качества и мониторинга процессов в производстве.
- Умная розничная торговля: Обеспечение работы систем управления запасами и автоматизированных систем оформления заказов.
- Развертывание на периферийных устройствах: Запуск приложений на устройствах с ограниченными ресурсами, таких как интеллектуальные камеры или NVIDIA Jetson.
Преимущества:
- Ориентация на промышленность: Разработан для решения задач реального промышленного развертывания.
- Balanced Performance: Предлагает отличный компромисс между скоростью и точностью.
- Оптимизация оборудования: Разработан для эффективной работы на различных аппаратных платформах.
Слабые стороны:
- Компромисс в точности: Может отдавать приоритет скорости и эффективности по сравнению с достижением абсолютно наивысшей точности по сравнению с более специализированными или новыми моделями.
- Сообщество и экосистема: Будучи открытым исходным кодом, он имеет меньшее сообщество и меньше ресурсов по сравнению с моделями в рамках комплексной экосистемы Ultralytics, такой как Ultralytics YOLOv8.
Обзор DAMO-YOLO
DAMO-YOLO, разработанная Alibaba Group, — это быстрый и точный метод обнаружения объектов, который представляет несколько новых технологий. Он направлен на расширение границ компромисса между скоростью и точностью за счет использования передовых архитектурных компонентов и стратегий обучения.
- Авторы: Сяньчжэ Сюй, Ици Цзян, Вэйхуа Чэнь, Илунь Хуан, Юань Чжан и Сююй Сунь
- Организация: Alibaba Group
- Дата: 23.11.2022
- Arxiv: https://arxiv.org/abs/2211.15444v2
- GitHub: https://github.com/tinyvision/DAMO-YOLO
- Документация: https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md
Архитектура и ключевые особенности
Архитектура DAMO-YOLO представляет собой набор инновационных компонентов, разработанных для обеспечения превосходной производительности.
- NAS-Powered Backbone: Использует backbone, созданный с помощью Neural Architecture Search (NAS), который автоматически находит оптимальную структуру для извлечения признаков.
- Эффективный RepGFPN Neck: Модель включает в себя новую обобщенную пирамидальную сеть признаков (GFPN) с репараметризацией, эффективно улучшающую многомасштабное слияние признаков.
- ZeroHead: DAMO-YOLO представляет упрощенную структуру с нулевым количеством параметров, которая снижает вычислительные затраты и разделяет задачи классификации и регрессии.
- Назначение меток AlignedOTA: Используется динамическая стратегия назначения меток под названием AlignedOTA, которая лучше согласовывает цели классификации и регрессии для повышения стабильности и точности обучения.
- Улучшение дистилляции: Модель использует дистилляцию знаний для передачи знаний от большей обучающей модели к меньшей обучаемой модели, повышая производительность без увеличения стоимости логического вывода.
Производительность и варианты использования
DAMO-YOLO превосходно подходит для сценариев, требующих высокой точности и масштабируемости. Различные размеры моделей позволяют развертывать их на различном оборудовании, что делает его универсальным для различных приложений.
- Автономное вождение: Высокая точность более крупных моделей DAMO-YOLO полезна для точного обнаружения, необходимого в автономных транспортных средствах.
- Высококлассные системы безопасности: Для приложений, где высокая точность имеет решающее значение для выявления потенциальных угроз, например, в умных городах.
- Прецизионный промышленный контроль: В производстве DAMO-YOLO можно использовать для контроля качества и обнаружения дефектов, где точность имеет первостепенное значение.
Преимущества:
- Высокая точность: Достигает превосходных показателей mAP, особенно со своими более крупными вариантами.
- Масштабируемая архитектура: Предлагает ряд размеров моделей (от Tiny до Large) для соответствия различным вычислительным возможностям.
- Инновационные компоненты: Интегрирует передовые методы, такие как NAS и расширенное назначение меток.
Слабые стороны:
- Сложность: Сочетание нескольких передовых методов может сделать архитектуру более сложной для понимания и модификации.
- Интеграция с экосистемой: Отсутствует бесшовная интеграция, обширная документация и активная поддержка сообщества, которые есть в экосистеме Ultralytics.
- Универсальность задач: В основном ориентирован на обнаружение объектов, в отличие от многозадачных моделей, таких как YOLO11, которые обрабатывают сегментацию, классификацию и оценку позы в рамках единого фреймворка.
Анализ производительности: YOLOv6-3.0 против DAMO-YOLO
Ниже приведено сравнение производительности YOLOv6-3.0 и DAMO-YOLO на наборе данных COCO val2017.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Из таблицы вытекает несколько ключевых выводов:
- Точность: YOLOv6-3.0l достигает самого высокого mAP в 52,8, превосходя все варианты DAMO-YOLO. Однако DAMO-YOLOs демонстрирует небольшое преимущество над YOLOv6-3.0s (46,0 против 45,0 mAP).
- Скорость: Модели YOLOv6-3.0, как правило, быстрее, при этом YOLOv6-3.0n является самой быстрой моделью в целом с задержкой 1,17 мс.
- Эффективность: Модели DAMO-YOLO, как правило, более эффективны по параметрам. Например, DAMO-YOLOl достигает 50,8 mAP с меньшим количеством параметров и FLOPs, чем YOLOv6-3.0l. И наоборот, YOLOv6-3.0n является самой легкой моделью с точки зрения параметров и FLOPs.
Выбор зависит от конкретных требований проекта. Для максимальной скорости на периферийных устройствах YOLOv6-3.0n — явный победитель. Для максимальной точности лучшую производительность показывает YOLOv6-3.0l. DAMO-YOLO предлагает убедительный баланс, особенно в среднем диапазоне, где он обеспечивает хорошую точность при меньших вычислительных затратах.
Заключение и рекомендации
И YOLOv6-3.0, и DAMO-YOLO — это мощные детекторы объектов, которые продвинули эту область. YOLOv6-3.0 — отличный выбор для промышленных приложений, где скорость и надежный баланс точности и эффективности имеют решающее значение. DAMO-YOLO выделяется своей инновационной архитектурой и высокой точностью, что делает его подходящим для приложений, где точность является главным приоритетом.
Однако для разработчиков и исследователей, ищущих современную модель, сочетающую в себе высокую производительность с исключительной простотой использования и универсальностью, мы рекомендуем изучить модели из серии Ultralytics YOLO, такие как YOLOv8 и последняя версия YOLO11.
Модели Ultralytics предлагают несколько ключевых преимуществ:
- Хорошо поддерживаемая экосистема: Они являются частью надежной экосистемы с активной разработкой, обширной документацией и мощной поддержкой сообщества через GitHub и Discord.
- Универсальность: Единая структура поддерживает множество задач, включая обнаружение, сегментацию экземпляров, оценку позы, классификацию и обнаружение ориентированных ограничивающих прямоугольников.
- Простота использования: Оптимизированный API, понятные руководства и интеграция с Ultralytics HUB упрощают обучение, валидацию и развертывание.
- Баланс производительности: Модели Ultralytics разработаны для обеспечения оптимального компромисса между скоростью и точностью, что делает их подходящими для широкого спектра реальных сценариев, от периферийных устройств до облачных серверов.
В конечном счете, хотя YOLOv6-3.0 и DAMO-YOLO являются сильными конкурентами, всесторонняя поддержка, многозадачные возможности и удобный характер платформы Ultralytics обеспечивают превосходный опыт разработки.
Изучите другие модели
Если вам интересно, как DAMO-YOLO соотносится с другими современными моделями, ознакомьтесь с этими другими страницами сравнения:
- DAMO-YOLO против YOLOv8
- DAMO-YOLO против YOLOv7
- DAMO-YOLO против YOLOX
- DAMO-YOLO vs. RT-DETR
- DAMO-YOLO vs. PP-YOLOE+