Перейти к содержанию

Техническое сравнение: YOLOX против EfficientDet для обнаружения объектов

Модели Ultralytics YOLO известны своей скоростью и точностью в задачах обнаружения объектов. На этой странице представлено подробное техническое сравнение двух известных моделей обнаружения объектов: YOLOX и EfficientDet. Мы рассмотрим их архитектурные решения, эталоны производительности, методики обучения и оптимальные области применения, чтобы помочь вам выбрать наиболее подходящую модель для ваших задач компьютерного зрения.

YOLOX: высокопроизводительный безъякорный детектор

YOLOX ("You Only Look Once X") - это передовой безъякорный детектор объектов, разработанный компанией Megvii. Он отличается простотой и высокой производительностью, преодолевая разрыв между научными исследованиями и практическим промышленным применением.

Архитектура и ключевые особенности

YOLOX отличается парадигмой безъякорного обнаружения, упрощающей архитектуру и повышающей эффективность. Ключевые архитектурные особенности включают:

  • Безъякорная конструкция: Устраняет сложность якорных блоков, что приводит к более простой реализации и потенциально лучшей обобщенности, особенно для объектов с различным соотношением сторон.
  • Decoupled Head: разделяет головки классификации и локализации, улучшая оптимизацию для каждой задачи и повышая общую точность.
  • Передовые стратегии обучения: Используются такие методы, как назначение меток SimOTA и сильное дополнение данных (MixUp и Mosaic), чтобы обеспечить надежное обучение и повысить производительность.

Авторы: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, and Jian Sun Организация: Megvii Дата: 2021-07-18 Ссылка на Arxiv: https://arxiv.org/abs/2107.08430 Ссылка на GitHub: https://github.com/Megvii-BaseDetection/YOLOX Ссылка на документацию: https://yolox.readthedocs.io/en/latest/

Показатели производительности

Модели YOLOX предлагают привлекательный баланс скорости и точности. Как показано в сравнительной таблице, YOLOX достигает конкурентоспособных показателей mAP, сохраняя при этом высокую скорость вывода, что делает его подходящим для приложений реального времени. Подробные данные о производительности моделей различных размеров приведены в таблице ниже.

Примеры использования

  • Обнаружение объектов в реальном времени: Идеально подходит для приложений, требующих быстрого обнаружения, таких как системы безопасности и видеоаналитика в реальном времени.
  • Граничные устройства: Эффективная производительность на устройствах с ограниченными ресурсами, таких как NVIDIA Jetson и мобильные платформы.
  • Автономные системы: Хорошо подходит для робототехники и автономных транспортных средств, где быстрое и точное восприятие имеет решающее значение.

Сильные и слабые стороны

Сильные стороны:

  • Высокая скорость вывода: Безъякорная архитектура и оптимизированный дизайн способствуют быстрой обработке данных.
  • Простота: Обтекаемая конструкция упрощает обучение и развертывание по сравнению с моделями на основе якорей.
  • Хороший баланс между точностью и скоростью: Обеспечивает конкурентоспособную точность без ущерба для скорости вывода.

Слабые стороны:

  • mAP: Несмотря на высокую эффективность, в определенных сценариях она может быть чуть менее точной, чем некоторые более крупные и сложные модели.

Узнайте больше о YOLOX

EfficientDet: Масштабируемое и эффективное обнаружение объектов

EfficientDet, разработанный Google Research, известен своей масштабируемостью и эффективностью в обнаружении объектов. В нем используется семейство моделей, которые достигают наивысшей точности при значительно меньшем количестве параметров и FLOP по сравнению с предыдущими детекторами.

Архитектура и ключевые особенности

В EfficientDet реализовано несколько инноваций для повышения эффективности и точности:

  • BiFPN (Bi-directional Feature Pyramid Network): Позволяет эффективно объединять разномасштабные признаки, позволяя сети эффективно использовать признаки с разным разрешением.
  • Составное масштабирование: Равномерно масштабирует все измерения сети (магистраль, BiFPN и сеть предсказания ящиков/классов) с помощью одного коэффициента соединения, упрощая процесс масштабирования и оптимизируя производительность.
  • Эффективная опорная сеть: В качестве опорной сети используется EfficientNet, известная своей эффективностью и широкими возможностями извлечения признаков.

Авторы: Mingxing Tan, Ruoming Pang, and Quoc V. Le Организация: Google Дата: 2019-11-20 Ссылка на Arxiv: https://arxiv.org/abs/1911.09070 Ссылка на GitHub: https:google Ссылка на документацию: https:google

Показатели производительности

Модели EfficientDet разработаны для обеспечения высокой эффективности в различных масштабах и предлагают ряд моделей от d0 до d7. Они достигают отличных показателей mAP при относительно небольшом количестве параметров и FLOP, что делает их пригодными для развертывания в средах с ограниченными ресурсами. Подробные показатели приведены в сравнительной таблице.

Примеры использования

  • Мобильное и пограничное развертывание: Небольшие размеры модели EfficientDet и высокая эффективность делают ее идеальной для мобильных устройств и пограничных вычислительных сценариев.
  • Приложения, требующие высокой точности при ограниченных ресурсах: Подходит для приложений, где точность имеет первостепенное значение, но вычислительные ресурсы ограничены, например, для проверки качества краевых устройств.
  • Устройства с питанием от батарей: Энергоэффективная конструкция позволяет использовать устройства с питанием от батарей и приложения IoT.

Сильные и слабые стороны

Сильные стороны:

  • Высокая эффективность: Достижение современной точности при меньшем количестве параметров и FLOP, что приводит к ускорению вывода и снижению вычислительных затрат.
  • Масштабируемость: Метод комбинированного масштабирования позволяет легко масштабировать модель для удовлетворения различных требований к точности и ресурсам.
  • Точность: Высокие показатели по mAP, особенно для малых и средних моделей.

Слабые стороны:

  • Скорость вывода: Несмотря на свою эффективность, EfficientDet может быть медленнее, чем модели, специально оптимизированные для скорости, такие как YOLOv10 или YOLOv8особенно для больших вариантов.

Узнайте больше об EfficientDet

Сравнительная таблица производительности

Модель размер
(пикселей)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4TensorRT10
(мс)
params
(M)
FLOPs
(B)
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0

Ознакомьтесь с другими полезными сравнениями моделей обнаружения объектов, доступными в документах Ultralytics Docs:

📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии