YOLO против YOLOX: подробное техническое сравнение
Модели обнаружения объектов необходимы для различных приложений компьютерного зрения, и выбор правильной модели зависит от конкретных потребностей проекта. На этой странице представлено техническое сравнение YOLO и YOLOX, двух современных моделей обнаружения объектов, с анализом их архитектуры, производительности и областей применения.
DAMO-YOLO
YOLO - это быстрая и точная модель обнаружения объектов, разработанная компанией Alibaba Group. В ней реализовано несколько новых технологий, включая магистрали NAS и эффективный RepGFPN, направленных на достижение высокой производительности в задачах обнаружения объектов.
Архитектура и ключевые особенности
Архитектура YOLO включает в себя несколько инновационных компонентов:
- Магистраль NAS: Используется основа нейронной архитектуры поиска (NAS) для оптимизации извлечения признаков.
- RepGFPN: Использует эффективную репараметризованную градиентную сеть пирамид признаков (GFPN) для улучшения слияния признаков.
- ZeroHead: Для снижения вычислительных нагрузок используется облегченная головка обнаружения ZeroHead.
- AlignedOTA: использует выровненное оптимальное назначение транспорта (OTA) для улучшения назначения меток во время обучения.
Показатели производительности
YOLO демонстрирует сильный баланс между скоростью и точностью, предлагая различные размеры моделей для удовлетворения различных вычислительных потребностей.
- mAP: Достижение конкурентоспособной средней точности (mAP) на таких наборах данных, как COCO.
- Скорость вывода: Разработан для быстрого вывода, что делает его подходящим для приложений реального времени.
- Размер модели: Доступны разные размеры (маленький, маленький, средний, большой) с разным количеством параметров и FLOP-ов.
Сильные и слабые стороны
Сильные стороны:
- Высокая точность: Получает отличные показатели mAP, что свидетельствует о высокой точности обнаружения.
- Эффективная архитектура: Инновационные компоненты, такие как RepGFPN и ZeroHead, способствуют повышению эффективности.
- Возможность работы в режиме реального времени: Разработана для обеспечения высокой скорости вычислений, подходящей для систем реального времени.
Слабые стороны:
- Сложность: Расширенные архитектурные компоненты могут создавать сложности при настройке и внедрении.
- Ограниченное сообщество: По сравнению с более устоявшимися моделями, сообщество и ресурсы могут быть меньше.
Примеры использования
YOLO хорошо подходит для приложений, требующих высокой точности и работы в режиме реального времени, таких как:
- Передовая робототехника: Обеспечение точного обнаружения объектов для решения сложных робототехнических задач.
- Наблюдение с высоким разрешением: Обработка видеопотоков высокой четкости для детального распознавания объектов.
- Промышленный контроль качества: Обнаружение мелкозернистых дефектов в производственных процессах.
YOLOX
YOLOX, разработанный компанией Megvii, представляет собой безъякорную версию YOLO, отличающуюся простотой и высокой производительностью. Благодаря своей эффективной конструкции она призвана преодолеть разрыв между научными исследованиями и промышленными приложениями.
Архитектура и ключевые особенности
YOLOX выделяется своим безъякорным подходом и обтекаемой архитектурой:
- Обнаружение без якорей: Упрощает конвейер обнаружения, устраняя необходимость в якорных ящиках, снижая сложность и уменьшая настройку гиперпараметров.
- Decoupled Head: разделяет головки классификации и регрессии для повышения производительности и эффективности обучения.
- Назначение меток SimOTA: Использует стратегию назначения меток SimOTA (Simplified Optimal Transport Assignment) для более эффективного обучения.
- Сильные дополнения: Использует передовые методы дополнения данных для повышения надежности и обобщения модели.
Показатели производительности
YOLOX предлагает оптимальный баланс между точностью и скоростью, при этом доступны модели различных размеров.
- mAP: Достижение конкурентоспособных результатов mAP на эталонных наборах данных, таких как COCO, часто превосходящих предыдущие версии YOLO .
- Скорость вывода: Обеспечивает высокую скорость вычислений, подходящую для развертывания в режиме реального времени.
- Размер модели: Предлагает различные размеры моделей (Nano, Tiny, s, m, l, x), чтобы учесть различные ограничения по ресурсам.
Сильные и слабые стороны
Сильные стороны:
- Простота: Безъякорная конструкция упрощает модель и снижает необходимость в сложной настройке.
- Высокая производительность: Достигает превосходной точности и скорости, часто превосходя модели YOLO , основанные на якоре.
- Простота внедрения: Хорошо документирована и относительно проста в реализации и развертывании.
Слабые стороны:
- Вычислительные затраты: Большие модели YOLOX могут требовать больших вычислительных затрат и ресурсов.
- Оптимизация под конкретное оборудование: Может потребоваться оптимизация для развертывания на очень ограниченных по ресурсам пограничных устройствах по сравнению с очень легкими моделями.
Примеры использования
YOLOX универсален и подходит для широкого спектра задач по обнаружению объектов, включая:
- Видеонаблюдение в реальном времени: Эффективная обработка видеоданных для обеспечения безопасности и мониторинга.
- Автономное вождение: Обеспечение надежного и быстрого обнаружения объектов для автономных транспортных средств.
- Развертывание на границе: Развертывание небольших моделей YOLOX на пограничных устройствах для приложений с ограниченными ресурсами.
Сравнительная таблица моделей
Модель | размер (пикселей) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4TensorRT10 (мс) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
YOLO и YOLOX - это мощные модели обнаружения объектов. YOLO делает акцент на точности и эффективности благодаря архитектурным инновациям, а YOLOX - на простоте и высокой производительности благодаря безъякорной конструкции. Выбор между ними зависит от конкретных требований приложения, учитывая такие факторы, как точность, скорость и условия развертывания.
Пользователи, заинтересованные в других высокопроизводительных моделях обнаружения объектов, также могут рассмотреть Ultralytics YOLOv8, YOLOv10, и YOLO11. Для сравнения с этими и другими моделями обратитесь к документуUltralytics Model Comparison Docs.