Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX против YOLOv5#

Выбор подходящей модели для обнаружения объектов — критически важное решение, от которого зависит успех любого проекта в области компьютерного зрения. В этом руководстве представлено всестороннее техническое сравнение двух ключевых моделей в мире ИИ: YOLOX от Megvii и Ultralytics YOLOv5. Анализируя их архитектуру, метрики производительности и экосистемы обучения, мы поможем тебе и другим разработчикам и исследователям сделать обоснованный выбор для конкретных условий развертывания.

Link to this sectionВведение в модели#

Обе модели появились в период стремительного развития технологий обнаружения объектов в реальном времени, однако для достижения своей производительности они использовали разные архитектурные подходы.

Link to this sectionYOLOX: безъякорный подход#

Представленная исследователями Чжэн Гэ, Сунтао Лю, Фэн Ваном, Земином Ли и Цзянь Сунем из Megvii 18 июля 2021 года, модель YOLOX совершила значительный сдвиг, отказавшись от традиционных якорных рамок (anchor boxes). В своем техническом отчете на Arxiv авторы описали YOLOX как модель, объединяющую безъякорный дизайн с разделенной «головой» (decoupled head) и стратегией назначения меток SimOTA. Этот дизайн был призван сократить разрыв между академическими исследованиями и промышленным применением, демонстрируя высокую производительность на стандартных наборах данных.

Узнать больше о YOLOX

Link to this sectionYOLOv5: стандарт для промышленного ИИ в компьютерном зрении#

Созданная Гленном Джочером и выпущенная Ultralytics 26 июня 2020 года, модель YOLOv5 быстро стала отраслевым стандартом для развертывания решений в области компьютерного зрения. Построенная на фреймворке PyTorch, она сделала передовые ИИ-технологии доступными благодаря непревзойденной простоте использования, исключительно быстрому обучению и высококачественному репозиторию. Архитектура YOLOv5 ориентирована на идеальный баланс между скоростью, точностью и простотой развертывания, что делает ее фаворитом для любых задач — от устройств на периферии до масштабных облачных систем.

Узнай больше о YOLOv5

Link to this sectionАрхитектурные различия#

Понимание основных механических различий между этими сетями проясняет, почему они показывают разные результаты в различных задачах.

Link to this sectionБезъякорный подход против якорного#

Самое заметное различие — это безъякорный механизм YOLOX. Традиционные модели, такие как YOLOv5, полагаются на предопределенные якорные рамки для предсказания ограничивающих рамок (BBox), что требует кластерного анализа обучающего набора данных для определения оптимальных размеров якорей. YOLOX устраняет это, предсказывая координаты ограничивающей рамки непосредственно в каждой пространственной локации. В то время как безъякорный подход сокращает количество параметров проектирования и необходимость эвристической настройки, усовершенствованный якорный подход YOLOv5, дополненный функцией auto-anchor, обеспечивает невероятно стабильную и предсказуемую сходимость обучения сразу «из коробки».

Link to this sectionРазделенная «голова» (decoupled head) против объединенной (coupled head)#

В YOLOX используется разделенная «голова», что означает, что задачи классификации и регрессии разделены на разные ветви нейронной сети. Авторы утверждали, что это разрешает конфликты между изучением пространственных и семантических признаков. Напротив, YOLOv5 (в своих ранних версиях) использовала высокооптимизированную объединенную «голову», что максимизировало вычислительную эффективность и снижало задержку инференса, что критически важно для периферийных вычислений в реальном времени.

Архитектурная эволюция

Хотя YOLOX популяризировала разделенную «голову» в 2021 году, позже Ultralytics внедрила и усовершенствовала разделенные архитектуры в последующих моделях, таких как YOLOv8 и передовая YOLO26, объединив лучшие стороны обоих подходов.

Link to this sectionСтратегия назначения меток (Label Assignment)#

YOLOX использует SimOTA для назначения меток, что формулирует задачу сопоставления объектов ground truth с предсказаниями как задачу оптимальной транспортировки. Это динамическое назначение улучшает работу в сценах с высокой плотностью объектов. YOLOv5 применяет надежное назначение, основанное на правилах формы, гарантируя, что качественные положительные образцы стабильно подаются в функцию потерь, что способствует ее легендарной стабильности при обучении.

Link to this sectionПроизводительность и бенчмарки#

Компромисс между скоростью и точностью — главный тест для этих архитектур. В приведенной ниже таблице показана производительность различных размеров моделей на стандартных бенчмарках.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Хотя YOLOX достигает конкурентных значений mAP, особенно в своих крупных вариантах, YOLOv5 сохраняет заметное преимущество в скорости инференса через TensorRT по всем направлениям. Модель YOLOv5s, например, обеспечивает исключительное соотношение скорости и точности, что делает ее очень востребованной для приложений реального времени, где важна каждая миллисекунда.

Link to this sectionПреимущество Ultralytics: обучение и удобство использования#

При переходе от исследований к продакшену экосистема, окружающая модель, часто так же важна, как и сама модель. Здесь преимущества экосистемы Ultralytics становятся очевидными.

Link to this sectionУпрощенный пользовательский опыт#

YOLOv5 повсеместно хвалят за удобство для разработчиков типа «zero-to-hero». Ultralytics Python API и CLI позволяют тебе загружать, обучать и развертывать модели всего одной строкой кода. В то же время запуск YOLOX из репозитория Megvii на GitHub требует более ручной настройки переменных окружения, сложной настройки путей в Python и преодоления более крутой кривой обучения, типичной для академических кодовых баз.

Link to this sectionЭффективность обучения и требования к памяти#

Модели Ultralytics тщательно спроектированы для минимизации потребления памяти во время обучения. YOLOv5 требует значительно меньше памяти CUDA по сравнению с сильно параметризованными моделями-трансформерами, такими как RT-DETR, или неоптимизированными исследовательскими моделями. Это позволяет тебе обучать модели на больших размерах батчей даже на пользовательском оборудовании, ускоряя итеративный цикл разработки.

Link to this sectionУниверсальность в задачах#

Хотя YOLOX является исключительно фреймворком для обнаружения объектов, экосистема Ultralytics развила YOLOv5 для поддержки нескольких задач компьютерного зрения. Сразу «из коробки» ты можешь выполнять классификацию изображений, сегментацию экземпляров и обнаружение объектов, используя один и тот же синтаксис API.

Постоянные инновации

Если тебе требуются более сложные задачи, такие как оценка позы или обнаружение с помощью ориентированных ограничивающих рамок (OBB), мы настоятельно рекомендуем перейти на новейшую архитектуру Ultralytics YOLO26, которая поддерживает всё это нативно с высочайшей точностью.

Link to this sectionСравнение кода#

Разница в удобстве лучше всего видна в коде.

Обучение с YOLOv5:

from ultralytics import YOLO

# Load a pretrained YOLOv5s model
model = YOLO("yolov5su.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")

# Display results
results[0].show()

Обучение с YOLOX: (Требует ручного клонирования репозитория, установки setup.py и сложных аргументов CLI)

# Example YOLOX training command
python tools/train.py -f exps/default/yolox_s.py -d 1 -b 64 --fp16 -o

Подход Ultralytics устраняет трудности, позволяя тебе сосредоточиться на наборе данных и логике приложения, а не на отладке конфигурационных файлов. Более того, отслеживание экспериментов происходит бесшовно благодаря встроенным интеграциям с Weights & Biases и Comet ML.

Link to this sectionИдеальные сценарии использования и реальные приложения#

Выбор между этими моделями зависит от операционной среды твоего проекта.

Link to this sectionВ чем YOLOX превосходит#

YOLOX остается сильным кандидатом в академической среде, где исследователи изучают безъякорные парадигмы или стратегии назначения меток. Он также полезен в сценариях, где обнаружение в переполненных сценах является главной метрикой, а скорость развертывания на периферии — второстепенной.

Link to this sectionВ чем превосходит YOLOv5#

YOLOv5 — неоспоримый лидер практического развертывания.

  • Высокоскоростное производство: Для дефектоскопии на конвейере минимальная задержка инференса YOLOv5 на периферийных GPU гарантирует, что продукция будет проверена без замедления производственной линии.
  • Дроны и аэросъемка: Эффективное использование памяти позволяет модели работать на легких бортовых компьютерах дронов для задач, таких как мониторинг сельского хозяйства и отслеживание дикой природы.
  • Умный ритейл: От автоматизированных касс до управления запасами — YOLOv5 легко экспортируется в TensorRT и ONNX для массового развертывания на тысячах камер в магазинах.

Link to this sectionВзгляд в будущее: преимущество YOLO26#

Хотя YOLOv5 — легендарная модель, область ИИ развивается стремительно. Если ты начинаешь новый проект сегодня, мы настоятельно советуем обратить внимание на последнее поколение моделей Ultralytics.

Выпущенная в 2026 году, Ultralytics YOLO26 представляет собой огромный шаг вперед. Она отличается дизайном End-to-End NMS-Free, полностью исключающим необходимость в постобработке Non-Maximum Suppression, что значительно упрощает логику развертывания. Убрав Distribution Focal Loss (DFL) и используя передовой оптимизатор MuSGD, YOLO26 достигает до 43% более быстрого инференса на CPU, чем предыдущие поколения, при сохранении более высокой точности, особенно на мелких объектах, благодаря новым функциям потерь ProgLoss + STAL.

Независимо от того, выберешь ли ты проверенную в боях надежность YOLOv5 или передовую производительность YOLO26, платформа Ultralytics гарантирует, что у тебя будут лучшие инструменты для бесшовного превращения твоих решений в области компьютерного зрения из концепции в реальный продукт. Обязательно изучи подробную документацию Ultralytics, чтобы раскрыть весь потенциал своего ИИ-пайплайна.

Участники

Комментарии