YOLO11 vs YOLOX: Эволюция высокопроизводительного обнаружения объектов
За последние несколько лет область компьютерного зрения пережила быстрые достижения, а модели обнаружения объектов в реальном времени становятся все более сложными. При выборе архитектуры для производственной среды или академических исследований разработчики часто взвешивают компромиссы между устаревшими решениями и передовыми инновациями. Это всестороннее сравнение исследует различия между Ultralytics YOLO11 и YOLOX от Megvii, предоставляя глубокое понимание их архитектур, метрик производительности и идеальных сценариев развертывания.
Архитектурный обзор
Обе модели представляют собой значительные прорывы в обнаружении объектов, но они исходят из разных философий проектирования и ориентированы на разный опыт разработчиков.
YOLO11: Универсальный многозадачный движок
Выпущенный в сентябре 2024 года Гленном Йохером и Цзин Цю в Ultralytics, YOLO11 разработан как унифицированный фреймворк, который балансирует высокую точность с исключительной эффективностью.
- Авторы: Гленн Джочер и Цзин Цю
- Организация: Ultralytics
- Дата: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- Документация:https://docs.ultralytics.com/models/yolo11/
YOLO11 выходит за рамки стандартных ограничивающих рамок, нативно поддерживая сегментацию экземпляров, классификацию изображений, оценку позы и обнаружение ориентированных ограничивающих рамок (OBB). Его усовершенствованная архитектура оптимизирует извлечение признаков для обеспечения лучшего сохранения признаков в сложных пространственных иерархиях.
YOLOX: пионер Anchor-Free
Разработанный исследователями Megvii, YOLOX привлек значительное внимание в 2021 году, преодолев разрыв между исследованиями и промышленными приложениями с помощью чисто безанкерного подхода.
- Авторы: Чжэн Ге, Сунтао Лю, Фэн Ван, Цзэмин Ли и Цзянь Сунь
- Организация: Megvii
- Дата: 2021-07-18
- Arxiv:https://arxiv.org/abs/2107.08430
- GitHub:https://github.com/Megvii-BaseDetection/YOLOX
- Документация:https://yolox.readthedocs.io/en/latest/
YOLOX представил разделенную головку и безанкерную парадигму, что значительно сократило количество проектных параметров и улучшило производительность на академических бенчмарках на момент его выпуска.
Вы знали?
Безанкерный дизайн, популяризированный YOLOX, вдохновил многие последующие архитектуры. Ultralytics внедрила и значительно усовершенствовала эти безанкерные концепции в последующих итерациях, таких как YOLOv8 и YOLO11, для обеспечения превосходной точности и гибкости развертывания.
Производительность и метрики
При оценке моделей обнаружения анализ баланса параметров, вычислительных затрат (FLOPs) и средней точности (mAP) имеет решающее значение для развертывания модели в реальных условиях.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
Как видно из таблицы, YOLO11x значительно превосходит YOLOXx по абсолютной точности (54.7 mAP против 51.1 mAP), при этом требуя примерно вдвое меньше параметров (56.9M против 99.1M). Эта эффективность приводит к снижению требований к памяти как во время обучения, так и во время вывода, что является огромным преимуществом для производственных сред.
Экосистема и опыт разработчиков
Преимущество Ultralytics
Одно из наиболее глубоких различий между YOLO11 и YOLOX заключается в удобстве использования. YOLOX функционирует преимущественно как исследовательская кодовая база, требуя сложной настройки окружения, ручной компиляции C++ операторов и многословных аргументов командной строки для запуска обучения на пользовательских наборах данных.
В отличие от этого, YOLO11 полностью интегрирован в пакет Ultralytics Python, обеспечивая оптимизированный рабочий процесс «от новичка до эксперта». Платформа Ultralytics предлагает обширные инструменты для аннотации данных, отслеживания экспериментов и облачного обучения, абстрагируя рутинные операции, чтобы инженеры могли сосредоточиться на производительности модели.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model effortlessly using the Ultralytics API
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")
Кроме того, экспорт модели Ultralytics в такие форматы, как TensorRT, CoreML или OpenVINO, требует всего одной команды, тогда как устаревшие репозитории часто требуют сложных сторонних инструментов или ручных манипуляций с графом.
Реальные примеры использования
Когда следует рассмотреть YOLOX
YOLOX остается актуальным вариантом для специализированных, устаревших развертываний, где разработчики уже создали сильно кастомизированные C++ конвейеры вывода вокруг его специфических tensor выходов разделенной головы. Кроме того, исследователи, проводящие сравнительные исследования с архитектурами 2021 года, будут по-прежнему использовать YOLOX в качестве базовой модели для эталонного набора данных.
Где превосходит YOLO11
Почти для всех современных производственных сценариев YOLO11 обеспечивает значительно превосходный опыт:
- Умные города и розничная торговля: Благодаря исключительному соотношению скорости и точности, YOLO11 без труда справляется с переполненными сценами, обеспечивая работу систем автоматизированной аналитики розничной торговли и управления дорожным движением без необходимости в массивных GPU-кластерах.
- Периферийные вычисления: Высокая эффективность использования памяти и надежные опции экспорта делают YOLO11 идеальным для развертываний периферийного ИИ на таких устройствах, как Raspberry Pi или платформы NVIDIA Jetson.
- Сложные конвейеры: Если проект требует объединения обнаружения объектов (detect) с ключевыми точками позы (например, спортивная аналитика) или точной сегментации экземпляров (например, медицинская визуализация), YOLO11 обрабатывает все задачи нативно через единый API.
Сценарии использования и рекомендации
Выбор между YOLO11 и YOLOX зависит от конкретных требований вашего проекта, ограничений развертывания и предпочтений экосистемы.
Когда следует выбирать YOLO11
YOLO11 — отличный выбор для:
- Промышленное периферийное развертывание: Коммерческие приложения на таких устройствах, как Raspberry Pi или NVIDIA Jetson, где надежность и активное обслуживание имеют первостепенное значение.
- Многозадачные приложения компьютерного зрения: Проекты, требующие detect, сегментации, оценки позы и obb в рамках единой унифицированной среды.
- Быстрое прототипирование и развертывание: Команды, которым необходимо быстро перейти от сбора данных к производству, используя оптимизированный Ultralytics Python API.
Когда следует выбирать YOLOX
YOLOX рекомендуется для:
- Исследования безъякорного detect: Академические исследования, использующие чистую, безъякорную архитектуру YOLOX в качестве основы для экспериментов с новыми головами detect или функциями потерь.
- Сверхлегкие граничные устройства: Развертывание на микроконтроллерах или устаревшем мобильном оборудовании, где критически важен чрезвычайно малый объем (0,91 млн параметров) варианта YOLOX-Nano.
- Исследования по назначению меток SimOTA: Исследовательские проекты, изучающие стратегии назначения меток на основе оптимального транспорта и их влияние на сходимость обучения.
Когда выбирать Ultralytics (YOLO26)
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и удобства для разработчиков:
- Развертывание на периферии без NMS: Приложения, требующие стабильного вывода с низкой задержкой без сложности постобработки методом Non-Maximum Suppression.
- Среды только с CPU: Устройства без выделенного ускорения GPU, где до 43% более быстрая инференция YOLO26 на CPU обеспечивает решающее преимущество.
- Обнаружение мелких объектов: Сложные сценарии, такие как аэрофотосъемка с дронов или анализ данных с IoT-датчиков, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Взгляд в будущее: Мощь YOLO26
Хотя YOLO11 является исключительным выбором, ландшафт ИИ постоянно ускоряется. Для команд, ищущих абсолютную вершину эффективности и стабильности, YOLO26 (выпущенный в январе 2026 года) является окончательной рекомендацией для новых проектов компьютерного зрения.
YOLO26 представляет собой огромный шаг вперед благодаря реализации сквозной безальтернативной NMS-архитектуры. Устраняя пост-обработку Non-Maximum Suppression (NMS), он полностью исключает изменчивость задержки, значительно упрощая логику развертывания — концепцию, впервые примененную в YOLOv10.
Кроме того, YOLO26 включает удаление DFL (Distribution Focal Loss), оптимизируя архитектуру для достижения до 43% более быстрого инференса на CPU, что делает его бесспорным чемпионом для устройств с низким энергопотреблением и периферийных устройств. Стабильность обучения также значительно улучшена благодаря оптимизатору MuSGD — гибриду SGD и Muon, вдохновленному LLM, который ускоряет сходимость. В сочетании с передовыми функциями потерь, такими как ProgLoss + STAL, YOLO26 отлично справляется с обнаружением мелких объектов в сложных условиях, таких как изображения с дронов и периферийные датчики IoT.
Дальнейшее изучение
Хотите расширить свои знания об архитектурах детектирования объектов? Изучите возможности открытого словаря YOLO-World или углубитесь в трансформерную модель RT-DETR, документированную в экосистеме Ultralytics.
В заключение, хотя YOLOX представил важные архитектурные концепции в 2021 году, комплексный набор инструментов, эффективность использования памяти и передовая производительность YOLO11 — и особенно революционная архитектура YOLO26 — делают экосистему Ultralytics очевидным выбором для исследователей и корпоративных разработчиков сегодня.