YOLOX против YOLOv5: Углубленное сравнение архитектуры и производительности
Выбор правильной модели обнаружения объектов является критически важным решением, определяющим успех любого проекта компьютерного зрения. Это руководство содержит всестороннее техническое сравнение двух ключевых моделей в области ИИ: YOLOX от Megvii и Ultralytics YOLOv5. Анализируя их архитектуры, метрики производительности и экосистемы обучения, мы стремимся помочь разработчикам и исследователям сделать осознанный выбор для их конкретных сред развертывания.
Введение в модели
Обе модели появились в период быстрого развития обнаружения объектов в реальном времени, однако для достижения своей производительности они использовали различные архитектурные подходы.
YOLOX: Подход без использования якорей
Выпущенный исследователями Чжэн Гэ, Сунтао Лю, Фэн Ваном, Цзэмином Ли и Цзянь Сунем из Megvii 18 июля 2021 года, YOLOX ознаменовал значительный сдвиг, отказавшись от традиционных якорных боксов. Как задокументировано в их техническом отчете Arxiv, YOLOX интегрировал безанкерную архитектуру с разделенной головой и стратегией присвоения меток SimOTA. Эта разработка была направлена на преодоление разрыва между академическими исследованиями и промышленными приложениями, предлагая высокую производительность на стандартных наборах данных.
YOLOv5: Стандарт для производственного компьютерного зрения (Vision AI).
Разработанное Гленном Джочером и выпущенное Ultralytics 26 июня 2020 года, YOLOv5 быстро стало отраслевым стандартом для развертываемого компьютерного зрения. Созданное изначально на фреймворке PyTorch, оно демократизировало передовой ИИ, предлагая беспрецедентную простоту использования, исключительно быстрое обучение и высококачественный репозиторий. Архитектура YOLOv5 была сосредоточена на идеальном балансе скорости, точности и простоты развертывания, что сделало его фаворитом для всего: от периферийных устройств до масштабных облачных развертываний.
Архитектурные различия
Понимание основных механических различий между этими сетями проясняет, почему они демонстрируют разную производительность в различных задачах.
Без якорей и на основе якорей
Наиболее существенное отличие — это безанкерный механизм YOLOX. Традиционные модели, такие как YOLOv5, полагаются на предопределённые якорные боксы для предсказания ограничивающих рамок, что требует кластерного анализа на обучающем наборе данных для определения оптимальных размеров якорей. YOLOX устраняет это, предсказывая координаты ограничивающих рамок непосредственно в каждой пространственной позиции. Хотя безанкерный подход уменьшает количество проектных параметров и эвристической настройки, усовершенствованный анкерный подход YOLOv5, поддерживаемый его функцией авто-якоря, обеспечивает невероятно стабильную и предсказуемую сходимость обучения сразу после запуска.
Разделенная голова против связанной головы
YOLOX использует разделенную головку, что означает, что задачи классификации и регрессии разделены на отдельные ветви нейронной сети. Авторы утверждали, что это разрешает конфликты между обучением пространственных и семантических признаков. Напротив, YOLOv5 использовал высокооптимизированную связанную головку (в своих ранних версиях), которая максимизировала вычислительную эффективность и сокращала задержку вывода, что крайне важно для граничных вычислений в реальном времени.
Архитектурная эволюция
Хотя YOLOX отстаивал декомпозированную голову в 2021 году, Ultralytics позже приняла и усовершенствовала декомпозированные архитектуры в последующих моделях, таких как YOLOv8 и передовой YOLO26, объединив лучшее из обоих миров.
Стратегия назначения меток
YOLOX использует SimOTA для назначения меток, которая формулирует сопоставление объектов истинного положения с предсказаниями как задачу оптимального транспорта. Это динамическое назначение улучшает обработку переполненных сцен. YOLOv5 использует надежное назначение на основе правил формы, обеспечивая постоянную подачу высококачественных положительных образцов в функцию потерь, что способствует его легендарной стабильности обучения.
Производительность и сравнительное тестирование
Компромисс между скоростью и точностью является окончательным испытанием для этих архитектур. В таблице ниже проиллюстрирована производительность различных размеров моделей на стандартных бенчмарках.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Хотя YOLOX достигает конкурентоспособных показателей mAP, особенно в своих более крупных вариантах, YOLOv5 сохраняет заметное преимущество в скорости TensorRT inference по всем направлениям. Модель YOLOv5s, например, обеспечивает исключительное соотношение скорости и точности, что делает её весьма желательной для приложений реального времени, где каждая миллисекунда имеет значение.
Преимущества Ultralytics: Обучение и удобство использования
При переходе от исследований к производству экосистема, окружающая модель, часто так же важна, как и сама модель. В этом контексте преимущества экосистемы Ultralytics становятся очевидными.
Оптимизированный пользовательский опыт
YOLOv5 повсеместно хвалят за его путь разработчика «от новичка до эксперта». Python API Ultralytics и CLI позволяют загружать, обучать и развертывать модели с помощью одной строки кода. В отличие от этого, запуск YOLOX из репозитория Megvii GitHub требует более ручной настройки переменных среды, сложных настроек путей python и более крутой кривой обучения, типичной для академических исследовательских кодовых баз.
Эффективность обучения и требования к памяти
Модели Ultralytics тщательно спроектированы для минимизации использования памяти во время обучения. YOLOv5 требует значительно меньше памяти CUDA по сравнению с сильно параметризованными трансформерными моделями, такими как RT-DETR, или неоптимизированными исследовательскими моделями. Это позволяет разработчикам обучать большие размеры пакетов на потребительском оборудовании, ускоряя итеративный цикл разработки.
Универсальность в различных задачах
Хотя YOLOX является строго фреймворком для обнаружения объектов, экосистема Ultralytics развила YOLOv5 для поддержки множества задач компьютерного зрения. Из коробки вы можете выполнять классификацию изображений, сегментацию экземпляров и обнаружение объектов, используя тот же синтаксис API.
Непрерывные инновации
Если вам требуются еще более продвинутые задачи, такие как оценка позы или обнаружение ориентированных ограничивающих рамок (OBB), мы настоятельно рекомендуем обновиться до новейшей архитектуры Ultralytics YOLO26, которая нативно поддерживает все это с передовой точностью.
Сравнение кода
Разница в удобстве использования лучше всего демонстрируется на примере кода.
Обучение с YOLOv5:
from ultralytics import YOLO
# Load a pretrained YOLOv5s model
model = YOLO("yolov5su.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")
# Display results
results[0].show()
Обучение с YOLOX:(Требует ручного клонирования репозитория, установки через setup.py и сложных аргументов CLI)
# Example YOLOX training command
python tools/train.py -f exps/default/yolox_s.py -d 1 -b 64 --fp16 -o
Подход Ultralytics устраняет сложности, позволяя сосредоточиться на наборе данных и логике приложения, а не на отладке файлов конфигурации. Кроме того, отслеживание экспериментов осуществляется без проблем благодаря встроенной интеграции с Weights & Biases и Comet ML.
Идеальные варианты использования и практические применения
Выбор между этими моделями определяется операционной средой вашего проекта.
В чем YOLOX превосходит
YOLOX остается сильным кандидатом в академических кругах, где исследователи явно изучают безакорные парадигмы или стратегии присвоения меток. Он также полезен в сценариях, где detect переполненных сцен является абсолютно основной метрикой, а скорости развертывания на периферии вторичны.
Где превосходит YOLOv5
YOLOv5 — бесспорный чемпион практического развертывания.
- Высокоскоростное производство: Для обнаружения дефектов на сборочной линии минимальная задержка инференса YOLOv5 на граничных GPU гарантирует проверку продукции без замедления конвейера.
- Дроны и аэрофотосъемка: Его эффективное использование памяти позволяет запускать его на легких бортовых компьютерах дронов для таких задач, как мониторинг сельского хозяйства и отслеживание дикой природы.
- Умная розничная торговля: От автоматизированных касс до управления запасами, YOLOv5 легко экспортируется в TensorRT и ONNX для массового развертывания на тысячах камер магазинов.
Взгляд в будущее: Преимущество YOLO26
Хотя YOLOv5 является легендарной моделью, область ИИ быстро развивается. Если вы начинаете новый проект сегодня, мы настоятельно рекомендуем рассмотреть последнее поколение моделей Ultralytics.
Выпущенный в 2026 году, Ultralytics YOLO26 представляет собой огромный прорыв. Он отличается сквозной архитектурой без NMS, полностью устраняющей необходимость в постобработке методом Non-Maximum Suppression, что значительно упрощает логику развёртывания. Устранив Distribution Focal Loss (DFL) и используя передовой оптимизатор MuSGD, YOLO26 достигает до 43% более быстрого инференса на CPU по сравнению с предыдущими поколениями, сохраняя при этом более высокую точность, особенно для мелких объектов, благодаря новым функциям потерь ProgLoss + STAL.
Независимо от того, выбираете ли вы проверенную надежность YOLOv5 или передовую производительность YOLO26, Платформа Ultralytics гарантирует, что у вас есть лучшие доступные инструменты для беспрепятственного перехода от концепции к производству ваших решений компьютерного зрения. Обязательно изучите исчерпывающую документацию Ultralytics, чтобы раскрыть весь потенциал вашего конвейера ИИ.