Техническое сравнение: YOLOX против EfficientDet для обнаружения объектов
Модели Ultralytics YOLO известны своей скоростью и точностью в задачах обнаружения объектов. На этой странице представлено подробное техническое сравнение двух известных моделей обнаружения объектов: YOLOX и EfficientDet. Мы рассмотрим их архитектурные решения, эталоны производительности, методики обучения и оптимальные области применения, чтобы помочь вам выбрать наиболее подходящую модель для ваших задач компьютерного зрения.
YOLOX: высокопроизводительный безъякорный детектор
YOLOX ("You Only Look Once X") - это передовой безъякорный детектор объектов, разработанный компанией Megvii. Он отличается простотой и высокой производительностью, преодолевая разрыв между научными исследованиями и практическим промышленным применением.
Архитектура и ключевые особенности
YOLOX отличается парадигмой безъякорного обнаружения, упрощающей архитектуру и повышающей эффективность. Ключевые архитектурные особенности включают:
- Безъякорная конструкция: Устраняет сложность якорных блоков, что приводит к более простой реализации и потенциально лучшей обобщенности, особенно для объектов с различным соотношением сторон.
- Decoupled Head: разделяет головки классификации и локализации, улучшая оптимизацию для каждой задачи и повышая общую точность.
- Передовые стратегии обучения: Используются такие методы, как назначение меток SimOTA и сильное дополнение данных (MixUp и Mosaic), чтобы обеспечить надежное обучение и повысить производительность.
Авторы: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, and Jian Sun Организация: Megvii Дата: 2021-07-18 Ссылка на Arxiv: https://arxiv.org/abs/2107.08430 Ссылка на GitHub: https://github.com/Megvii-BaseDetection/YOLOX Ссылка на документацию: https://yolox.readthedocs.io/en/latest/
Показатели производительности
Модели YOLOX предлагают привлекательный баланс скорости и точности. Как показано в сравнительной таблице, YOLOX достигает конкурентоспособных показателей mAP, сохраняя при этом высокую скорость вывода, что делает его подходящим для приложений реального времени. Подробные данные о производительности моделей различных размеров приведены в таблице ниже.
Примеры использования
- Обнаружение объектов в реальном времени: Идеально подходит для приложений, требующих быстрого обнаружения, таких как системы безопасности и видеоаналитика в реальном времени.
- Граничные устройства: Эффективная производительность на устройствах с ограниченными ресурсами, таких как NVIDIA Jetson и мобильные платформы.
- Автономные системы: Хорошо подходит для робототехники и автономных транспортных средств, где быстрое и точное восприятие имеет решающее значение.
Сильные и слабые стороны
Сильные стороны:
- Высокая скорость вывода: Безъякорная архитектура и оптимизированный дизайн способствуют быстрой обработке данных.
- Простота: Обтекаемая конструкция упрощает обучение и развертывание по сравнению с моделями на основе якорей.
- Хороший баланс между точностью и скоростью: Обеспечивает конкурентоспособную точность без ущерба для скорости вывода.
Слабые стороны:
- mAP: Несмотря на высокую эффективность, в определенных сценариях она может быть чуть менее точной, чем некоторые более крупные и сложные модели.
EfficientDet: Масштабируемое и эффективное обнаружение объектов
EfficientDet, разработанный Google Research, известен своей масштабируемостью и эффективностью в обнаружении объектов. В нем используется семейство моделей, которые достигают наивысшей точности при значительно меньшем количестве параметров и FLOP по сравнению с предыдущими детекторами.
Архитектура и ключевые особенности
В EfficientDet реализовано несколько инноваций для повышения эффективности и точности:
- BiFPN (Bi-directional Feature Pyramid Network): Позволяет эффективно объединять разномасштабные признаки, позволяя сети эффективно использовать признаки с разным разрешением.
- Составное масштабирование: Равномерно масштабирует все измерения сети (магистраль, BiFPN и сеть предсказания ящиков/классов) с помощью одного коэффициента соединения, упрощая процесс масштабирования и оптимизируя производительность.
- Эффективная опорная сеть: В качестве опорной сети используется EfficientNet, известная своей эффективностью и широкими возможностями извлечения признаков.
Авторы: Mingxing Tan, Ruoming Pang, and Quoc V. Le Организация: Google Дата: 2019-11-20 Ссылка на Arxiv: https://arxiv.org/abs/1911.09070 Ссылка на GitHub: https:google Ссылка на документацию: https:google
Показатели производительности
Модели EfficientDet разработаны для обеспечения высокой эффективности в различных масштабах и предлагают ряд моделей от d0 до d7. Они достигают отличных показателей mAP при относительно небольшом количестве параметров и FLOP, что делает их пригодными для развертывания в средах с ограниченными ресурсами. Подробные показатели приведены в сравнительной таблице.
Примеры использования
- Мобильное и пограничное развертывание: Небольшие размеры модели EfficientDet и высокая эффективность делают ее идеальной для мобильных устройств и пограничных вычислительных сценариев.
- Приложения, требующие высокой точности при ограниченных ресурсах: Подходит для приложений, где точность имеет первостепенное значение, но вычислительные ресурсы ограничены, например, для проверки качества краевых устройств.
- Устройства с питанием от батарей: Энергоэффективная конструкция позволяет использовать устройства с питанием от батарей и приложения IoT.
Сильные и слабые стороны
Сильные стороны:
- Высокая эффективность: Достижение современной точности при меньшем количестве параметров и FLOP, что приводит к ускорению вывода и снижению вычислительных затрат.
- Масштабируемость: Метод комбинированного масштабирования позволяет легко масштабировать модель для удовлетворения различных требований к точности и ресурсам.
- Точность: Высокие показатели по mAP, особенно для малых и средних моделей.
Слабые стороны:
- Скорость вывода: Несмотря на свою эффективность, EfficientDet может быть медленнее, чем модели, специально оптимизированные для скорости, такие как YOLOv10 или YOLOv8особенно для больших вариантов.
Узнайте больше об EfficientDet
Сравнительная таблица производительности
Модель | размер (пикселей) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4TensorRT10 (мс) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Похожие сравнения
Ознакомьтесь с другими полезными сравнениями моделей обнаружения объектов, доступными в документах Ultralytics Docs:
- YOLOv8 vs YOLOX: Сравнение между Ultralytics YOLOv8 и YOLOX.
- YOLOv7 vs YOLOX: подробный анализ архитектур и производительности YOLOv7 и YOLOX.
- YOLOv5 vs YOLOX: Сравнение эффективности и гибкости YOLOv5 и YOLOX.
- YOLOX vs YOLO11: Техническое сравнение между YOLOX и Ultralytics YOLO11.
- EfficientDet vs YOLOv5: Оценка эффективности EfficientDet в сравнении с YOLOv5.
- EfficientDet против YOLOv7: Сравнение производительности между EfficientDet и YOLOv7.
- EfficientDet против YOLOv8: Анализ сильных и слабых сторон EfficientDet и YOLOv8.
- EfficientDet против YOLOv10: Сравнение последних моделей, EfficientDet и YOLOv10.