Перейти к содержанию

YOLOX в сравнении с YOLO11: техническое сравнение

Выбор подходящей модели обнаружения объектов — это критически важное решение, которое уравновешивает требования к точности, скорости и вычислительным ресурсам. На этой странице представлено подробное техническое сравнение YOLOX, высокопроизводительной модели без привязки к якорям от Megvii, и Ultralytics YOLO11, новейшей современной модели от Ultralytics. Мы углубимся в их архитектурные различия, показатели производительности и идеальные варианты использования, чтобы помочь вам выбрать лучшую модель для вашего проекта компьютерного зрения.

YOLOX: Высокопроизводительный детектор без привязки к якорям

YOLOX был представлен компанией Megvii как anchor-free версия YOLO, разработанная для упрощения конвейера обнаружения при сохранении высокой производительности. Он был нацелен на устранение разрыва между академическими исследованиями и промышленными приложениями путем устранения сложности предопределенных anchor boxes.

Технические детали:

Архитектура и ключевые особенности

YOLOX представил несколько ключевых инноваций в семейство YOLO:

  • Дизайн без Anchor: Устраняя anchor boxes, YOLOX уменьшает количество параметров проектирования и упрощает процесс обучения, что может привести к лучшему обобщению.
  • Разделенная Head: Она использует отдельные prediction heads для задач классификации и регрессии. Это разделение может улучшить скорость сходимости и повысить точность модели по сравнению с объединенными heads, используемыми в более ранних версиях YOLO.
  • Продвинутые стратегии обучения: YOLOX включает в себя передовые методы, такие как SimOTA (упрощенная стратегия оптимального назначения транспорта) для динамического назначения меток во время обучения, а также мощные методы аугментации данных.

Сильные и слабые стороны

Преимущества:

  • Высокая точность: Модели YOLOX, особенно более крупные варианты, достигают конкурентоспособных показателей mAP на стандартных бенчмарках, таких как набор данных COCO.
  • Простота Anchor-Free (Anchor-Free Simplicity): Конструкция упрощает конвейер обнаружения, устраняя необходимость настройки якорных прямоугольников, что является распространенной проблемой в других детекторах.
  • Устоявшаяся модель: Будучи моделью, выпущенной в 2021 году, она имеет сообщество последователей с различными доступными примерами развертывания.

Слабые стороны:

  • Устаревшая производительность: Несмотря на высокую производительность для своего времени, его скорость и точность были превзойдены более новыми моделями, такими как YOLO11.
  • Ограниченная универсальность: YOLOX в основном ориентирован на обнаружение объектов. Ему не хватает встроенной поддержки других задач компьютерного зрения, таких как сегментация экземпляров, оценка позы или классификация, которые являются стандартными в современных фреймворках, таких как Ultralytics.
  • Внешняя экосистема: Она не является частью интегрированной экосистемы Ultralytics, а это означает, что пользователи упускают возможность использовать оптимизированные инструменты, непрерывные обновления и всестороннюю поддержку для обучения, валидации и развертывания.

Идеальные варианты использования

YOLOX — это подходящий вариант для:

  • Базовые модели для исследований: Служит отличной отправной точкой для исследователей, изучающих методы обнаружения без привязки к anchor boxes.
  • Промышленные приложения: Подходит для таких задач, как контроль качества в производстве, где достаточно надежного и хорошо изученного детектора.

Узнайте больше о YOLOX

Ultralytics YOLO11: Современная универсальность и производительность

Ultralytics YOLO11 — это последняя флагманская модель от Ultralytics, представляющая собой вершину серии YOLO. Он опирается на успехи своих предшественников, таких как YOLOv8, обеспечивая современную производительность, беспрецедентную универсальность и исключительный пользовательский опыт.

Технические детали:

Архитектура и ключевые особенности

YOLO11 имеет высокооптимизированную одноэтапную anchor-free архитектуру, разработанную для максимальной эффективности и точности.

  • Баланс производительности: YOLO11 обеспечивает исключительный компромисс между скоростью и точностью, что делает его подходящим для широкого спектра применений, от обработки в реальном времени на периферийных устройствах до высокопроизводительного анализа на облачных серверах.
  • Универсальность: Ключевым преимуществом YOLO11 является его многозадачность. Он поддерживает обнаружение объектов, сегментацию экземпляров, классификацию изображений, оценку позы и обнаружение ориентированных ограничивающих рамок (OBB) в рамках единого унифицированного фреймворка.
  • Простота использования: YOLO11 интегрирована в хорошо поддерживаемую экосистему с простым Python API, мощным CLI и обширной документацией. Это делает ее невероятно доступной как для начинающих, так и для экспертов.
  • Эффективность обучения: Модель выигрывает от эффективных процессов обучения, легкодоступных предварительно обученных весов и более низких требований к памяти, что позволяет ускорить циклы разработки.
  • Хорошо поддерживаемая экосистема: Ultralytics обеспечивает активную разработку, мощную поддержку сообщества и бесшовную интеграцию с такими инструментами, как Ultralytics HUB, для комплексного MLOps, от управления наборами данных до развертывания в production.

Сильные и слабые стороны

Преимущества:

  • Передовая производительность: Обеспечивает первоклассные показатели mAP, сохраняя при этом высокую скорость инференса.
  • Превосходная эффективность: Оптимизированная архитектура обеспечивает меньшее количество параметров и FLOPs для заданного уровня точности по сравнению с YOLOX.
  • Поддержка нескольких задач: Одна модель YOLO11 может быть обучена для различных задач компьютерного зрения, предлагая непревзойденную гибкость.
  • Удобный фреймворк: Экосистема Ultralytics упрощает весь жизненный цикл разработки.
  • Активная разработка и поддержка: Преимущества включают непрерывные обновления, большое сообщество и профессиональную поддержку от Ultralytics.

Слабые стороны:

  • Как одностадийный детектор, он может столкнуться с проблемами при обнаружении очень маленьких или сильно перекрывающихся объектов в плотных сценах, что является общим ограничением для этого класса моделей.
  • Самые крупные модели, такие как YOLO11x, требуют значительных вычислительных ресурсов для достижения максимальной точности, хотя они и остаются весьма эффективными для своего уровня производительности.

Идеальные варианты использования

YOLO11 — идеальный выбор для широкого спектра современных приложений:

Узнайте больше о YOLO11

Прямое сравнение производительности: YOLOX против YOLO11

При сравнении производительности на наборе данных COCO становятся очевидными улучшения в YOLO11.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOX-Nano 416 25.8 - - 0.91 1.08
YOLOX-Tiny 416 32.8 - - 5.06 6.45
YOLOX-s 640 40.5 - 2.56 9.0 26.8
YOLOX-m 640 46.9 - 5.43 25.3 73.8
YOLOX-l 640 49.7 - 9.04 54.2 155.6
YOLOX-x 640 51.1 - 16.1 99.1 281.9
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

YOLO11 демонстрирует превосходную производительность по всем направлениям. Например, YOLO11s достигает более высокого mAP (47,0), чем YOLOX-m (46,9), с менее чем половиной параметров и значительно меньшим количеством FLOPs. Еще более впечатляюще, YOLO11m превосходит самую большую модель YOLOX-x по точности (51,5 mAP против 51,1 mAP), будучи при этом гораздо более эффективной (20,1 млн параметров против 99,1 млн).

С точки зрения скорости, модели YOLO11 исключительно быстры, особенно на GPU с оптимизацией TensorRT. YOLO11n устанавливает новый стандарт для легких моделей со временем инференса всего 1,5 мс. Кроме того, Ultralytics предоставляет четкие эталонные показатели производительности CPU, что является критическим фактором для многих реальных развертываний, которых не хватает в эталонных тестах YOLOX.

Заключение: какую модель вам следует выбрать?

Несмотря на то, что YOLOX внес важный вклад в разработку детекторов объектов без привязки к якорям, Ultralytics YOLO11 — явный победитель почти во всех современных случаях использования. Он предлагает превосходное сочетание точности, скорости и вычислительной эффективности.

Преимущества YOLO11 выходят далеко за рамки необработанных показателей. Его интеграция в комплексную экосистему Ultralytics значительно повышает производительность. Благодаря своей универсальности, простоте использования, активному обслуживанию и обширной поддержке, YOLO11 позволяет разработчикам и исследователям быстрее и эффективнее создавать и развертывать передовые решения в области компьютерного зрения. Для любого нового проекта, требующего современной производительности и беспроблемной разработки, YOLO11 является рекомендуемым выбором.

Сравнения с другими моделями

Если вам интересно, как YOLOX и YOLO11 соотносятся с другими ведущими моделями, ознакомьтесь со следующими страницами сравнения:



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии