Перейти к содержанию

YOLO11 vs YOLOX: Эволюция высокопроизводительного обнаружения объектов

За последние несколько лет область компьютерного зрения пережила быстрые достижения, а модели обнаружения объектов в реальном времени становятся все более сложными. При выборе архитектуры для производственной среды или академических исследований разработчики часто взвешивают компромиссы между устаревшими решениями и передовыми инновациями. Это всестороннее сравнение исследует различия между Ultralytics YOLO11 и YOLOX от Megvii, предоставляя глубокое понимание их архитектур, метрик производительности и идеальных сценариев развертывания.

Архитектурный обзор

Обе модели представляют собой значительные прорывы в обнаружении объектов, но они исходят из разных философий проектирования и ориентированы на разный опыт разработчиков.

YOLO11: Универсальный многозадачный движок

Выпущенный в сентябре 2024 года Гленном Йохером и Цзин Цю в Ultralytics, YOLO11 разработан как унифицированный фреймворк, который балансирует высокую точность с исключительной эффективностью.

YOLO11 выходит за рамки стандартных ограничивающих рамок, нативно поддерживая сегментацию экземпляров, классификацию изображений, оценку позы и обнаружение ориентированных ограничивающих рамок (OBB). Его усовершенствованная архитектура оптимизирует извлечение признаков для обеспечения лучшего сохранения признаков в сложных пространственных иерархиях.

Узнайте больше о YOLO11

YOLOX: пионер Anchor-Free

Разработанный исследователями Megvii, YOLOX привлек значительное внимание в 2021 году, преодолев разрыв между исследованиями и промышленными приложениями с помощью чисто безанкерного подхода.

YOLOX представил разделенную головку и безанкерную парадигму, что значительно сократило количество проектных параметров и улучшило производительность на академических бенчмарках на момент его выпуска.

Узнайте больше о YOLOX

Вы знали?

Безанкерный дизайн, популяризированный YOLOX, вдохновил многие последующие архитектуры. Ultralytics внедрила и значительно усовершенствовала эти безанкерные концепции в последующих итерациях, таких как YOLOv8 и YOLO11, для обеспечения превосходной точности и гибкости развертывания.

Производительность и метрики

При оценке моделей обнаружения анализ баланса параметров, вычислительных затрат (FLOPs) и средней точности (mAP) имеет решающее значение для развертывания модели в реальных условиях.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Как видно из таблицы, YOLO11x значительно превосходит YOLOXx по абсолютной точности (54.7 mAP против 51.1 mAP), при этом требуя примерно вдвое меньше параметров (56.9M против 99.1M). Эта эффективность приводит к снижению требований к памяти как во время обучения, так и во время вывода, что является огромным преимуществом для производственных сред.

Экосистема и опыт разработчиков

Преимущество Ultralytics

Одно из наиболее глубоких различий между YOLO11 и YOLOX заключается в удобстве использования. YOLOX функционирует преимущественно как исследовательская кодовая база, требуя сложной настройки окружения, ручной компиляции C++ операторов и многословных аргументов командной строки для запуска обучения на пользовательских наборах данных.

В отличие от этого, YOLO11 полностью интегрирован в пакет Ultralytics Python, обеспечивая оптимизированный рабочий процесс «от новичка до эксперта». Платформа Ultralytics предлагает обширные инструменты для аннотации данных, отслеживания экспериментов и облачного обучения, абстрагируя рутинные операции, чтобы инженеры могли сосредоточиться на производительности модели.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model effortlessly using the Ultralytics API
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")

Кроме того, экспорт модели Ultralytics в такие форматы, как TensorRT, CoreML или OpenVINO, требует всего одной команды, тогда как устаревшие репозитории часто требуют сложных сторонних инструментов или ручных манипуляций с графом.

Реальные примеры использования

Когда следует рассмотреть YOLOX

YOLOX остается актуальным вариантом для специализированных, устаревших развертываний, где разработчики уже создали сильно кастомизированные C++ конвейеры вывода вокруг его специфических tensor выходов разделенной головы. Кроме того, исследователи, проводящие сравнительные исследования с архитектурами 2021 года, будут по-прежнему использовать YOLOX в качестве базовой модели для эталонного набора данных.

Где превосходит YOLO11

Почти для всех современных производственных сценариев YOLO11 обеспечивает значительно превосходный опыт:

  • Умные города и розничная торговля: Благодаря исключительному соотношению скорости и точности, YOLO11 без труда справляется с переполненными сценами, обеспечивая работу систем автоматизированной аналитики розничной торговли и управления дорожным движением без необходимости в массивных GPU-кластерах.
  • Периферийные вычисления: Высокая эффективность использования памяти и надежные опции экспорта делают YOLO11 идеальным для развертываний периферийного ИИ на таких устройствах, как Raspberry Pi или платформы NVIDIA Jetson.
  • Сложные конвейеры: Если проект требует объединения обнаружения объектов (detect) с ключевыми точками позы (например, спортивная аналитика) или точной сегментации экземпляров (например, медицинская визуализация), YOLO11 обрабатывает все задачи нативно через единый API.

Сценарии использования и рекомендации

Выбор между YOLO11 и YOLOX зависит от конкретных требований вашего проекта, ограничений развертывания и предпочтений экосистемы.

Когда следует выбирать YOLO11

YOLO11 — отличный выбор для:

  • Промышленное периферийное развертывание: Коммерческие приложения на таких устройствах, как Raspberry Pi или NVIDIA Jetson, где надежность и активное обслуживание имеют первостепенное значение.
  • Многозадачные приложения компьютерного зрения: Проекты, требующие detect, сегментации, оценки позы и obb в рамках единой унифицированной среды.
  • Быстрое прототипирование и развертывание: Команды, которым необходимо быстро перейти от сбора данных к производству, используя оптимизированный Ultralytics Python API.

Когда следует выбирать YOLOX

YOLOX рекомендуется для:

  • Исследования безъякорного detect: Академические исследования, использующие чистую, безъякорную архитектуру YOLOX в качестве основы для экспериментов с новыми головами detect или функциями потерь.
  • Сверхлегкие граничные устройства: Развертывание на микроконтроллерах или устаревшем мобильном оборудовании, где критически важен чрезвычайно малый объем (0,91 млн параметров) варианта YOLOX-Nano.
  • Исследования по назначению меток SimOTA: Исследовательские проекты, изучающие стратегии назначения меток на основе оптимального транспорта и их влияние на сходимость обучения.

Когда выбирать Ultralytics (YOLO26)

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и удобства для разработчиков:

  • Развертывание на периферии без NMS: Приложения, требующие стабильного вывода с низкой задержкой без сложности постобработки методом Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного ускорения GPU, где до 43% более быстрая инференция YOLO26 на CPU обеспечивает решающее преимущество.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэрофотосъемка с дронов или анализ данных с IoT-датчиков, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Взгляд в будущее: Мощь YOLO26

Хотя YOLO11 является исключительным выбором, ландшафт ИИ постоянно ускоряется. Для команд, ищущих абсолютную вершину эффективности и стабильности, YOLO26 (выпущенный в январе 2026 года) является окончательной рекомендацией для новых проектов компьютерного зрения.

YOLO26 представляет собой огромный шаг вперед благодаря реализации сквозной безальтернативной NMS-архитектуры. Устраняя пост-обработку Non-Maximum Suppression (NMS), он полностью исключает изменчивость задержки, значительно упрощая логику развертывания — концепцию, впервые примененную в YOLOv10.

Кроме того, YOLO26 включает удаление DFL (Distribution Focal Loss), оптимизируя архитектуру для достижения до 43% более быстрого инференса на CPU, что делает его бесспорным чемпионом для устройств с низким энергопотреблением и периферийных устройств. Стабильность обучения также значительно улучшена благодаря оптимизатору MuSGD — гибриду SGD и Muon, вдохновленному LLM, который ускоряет сходимость. В сочетании с передовыми функциями потерь, такими как ProgLoss + STAL, YOLO26 отлично справляется с обнаружением мелких объектов в сложных условиях, таких как изображения с дронов и периферийные датчики IoT.

Дальнейшее изучение

Хотите расширить свои знания об архитектурах детектирования объектов? Изучите возможности открытого словаря YOLO-World или углубитесь в трансформерную модель RT-DETR, документированную в экосистеме Ultralytics.

В заключение, хотя YOLOX представил важные архитектурные концепции в 2021 году, комплексный набор инструментов, эффективность использования памяти и передовая производительность YOLO11 — и особенно революционная архитектура YOLO26 — делают экосистему Ultralytics очевидным выбором для исследователей и корпоративных разработчиков сегодня.


Комментарии