Перейти к содержанию

YOLOX против YOLO11: соединяя научные исследования и практическое применение

В быстро развивающейся области обнаружения объектов выбор подходящей модели часто требует баланса между передовыми исследованиями и практическими потребностями внедрения. В этом сравнении рассматриваются две значимые архитектуры: YOLOX, высокопроизводительный детектор без анкоров, выпущенный в 2021 году, и YOLO11— универсальная и надежная модель от Ultralytics для современных корпоративных приложений. Хотя обе модели принадлежат к YOLO , они значительно различаются по архитектурной философии, поддержке экосистемы и простоте использования.

Сравнение метрик производительности

При оценке детекторов объектов ключевыми показателями являются средняя средняя точность (mAP) и скорость вывода. В таблице ниже показано, как новая архитектура YOLO11 превосходную эффективность, особенно в плане соотношения скорости и точности.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

YOLOX: эволюция без якоря

YOLOX был представлен компанией Megvii в 2021 году как версия YOLO без анкоров. Его целью было преодолеть разрыв между академическими исследованиями и промышленным применением за счет упрощения головки детектора и устранения необходимости в заранее определенных анкорных боксах.

Основные характеристики:

  • Конструкция без анкеров: устраняет сложный процесс группировки анкерных коробок, упрощая процесс обучения.
  • Разделенная головка: разделяет задачи классификации и регрессии на разные ветви, улучшая скорость и точность сходимости.
  • SimOTA: усовершенствованная стратегия присвоения меток, которая динамически присваивает положительные образцы, повышая стабильность обучения.

Хотя YOLOX стал значительным шагом вперед в 2021 году, его внедрение часто требует более сложной настройки и не имеет единой многозадачной поддержки, которая присутствует в более новых фреймворках.

YOLOX Детали:

YOLO11: Универсальность и мощность экосистемы

YOLO11, выпущенная компанией Ultralytics, основана на успехе своих предшественников и представляет собой модель, которая не только точна, но и невероятно проста в использовании и развертывании. Она разработана как комплексное решение для широкого спектра задач компьютерного зрения.

Ключевые преимущества:

  • Простота использования: Ultralytics славится своей простотой. Загрузка, обучение и прогнозирование могут быть выполнены всего несколькими строчками кода, что значительно снижает барьер для входа для разработчиков.
  • Хорошо поддерживаемая экосистема: YOLO11 активным обслуживанием, частыми обновлениями и активным сообществом. Это обеспечивает совместимость с последними версиями PyTorch версиями и быстрое исправление ошибок.
  • Универсальность: в отличие от YOLOX, который в первую очередь является детектором объектов, YOLO11 поддерживает несколько задач, включая сегментацию экземпляров, оценку позы, классификацию и обнаружение ориентированных ограничивающих рамок (OBB).
  • Эффективность обучения: YOLO11 для эффективного использования ресурсов и часто требует меньше памяти во время обучения по сравнению с альтернативными решениями на основе трансформеров, такими как RT-DETR.

Узнайте больше о YOLO11

YOLO11 :

Вы знали?

Если вам нужна самая новая и передовая технология для периферийных вычислений, обратите внимание на YOLO26. Выпущенная в январе 2026 года, она отличается встроенной сквозной архитектурой NMS, оптимизатором MuSGD и на 43 % более быстрым CPU , что делает ее лучшим выбором для периферийного искусственного интеллекта.

Архитектурное сравнение

Архитектурные различия между YOLOX и YOLO11 эволюцию стратегий обнаружения объектов с течением времени.

Архитектура YOLOX

YOLOX использует магистраль CSPDarknet, аналогичную YOLOv5 вводит развязанную структуру головы. В традиционных YOLO классификация и локализация выполнялись совместно. YOLOX разделяет их на две отдельные ветви, что помогает разрешить конфликт между достоверностью классификации и точностью локализации. Его механизм без якорей рассматривает обнаружение объектов как задачу точечной регрессии, что упрощает конструкцию модели, но иногда может создавать проблемы в сценариях с чрезвычайно плотным расположением объектов по сравнению с подходами на основе якорей.

Архитектура YOLO11

YOLO11 усовершенствованную архитектуру основной части и шеи, которая улучшает возможности извлечения признаков в разных масштабах. Он интегрирует передовые модули для лучшего пространственного внимания и слияния признаков. Важным преимуществом Ultralytics является бесшовная интеграция экспортируемости. Архитектура с самого начала разработана так, чтобы ее можно было легко экспортировать в такие форматы, как ONNX, TensorRTи OpenVINO, что гарантирует, что высокая точность, наблюдаемая во время обучения, напрямую переносится на эффективное вычисление на периферийных устройствах.

Идеальные варианты использования

Выбор между этими моделями часто зависит от конкретных требований вашего проекта.

Когда следует выбирать YOLOX

  • Исследовательские базовые показатели: YOLOX является отличным ориентиром для академических исследований, посвященных методам обнаружения без анкоров или модификации развязанных головок.
  • Устаревшие системы: если у вас уже есть конвейер, построенный на основе кодовой базы Megvii, или вам требуется стратегия назначения SimOTA для нишевого набора данных.

Когда следует выбирать YOLO11

  • Быстрое развитие: если вам нужно быстро перейти от набора данных к развернутой модели, оптимизированная Ultralytics и Python делают YOLO11 лучшим выбором.
  • Требования к многозадачности: проекты, которые могут расширяться от простого обнаружения до сегментации или отслеживания, выигрывают от унифицированной структуры YOLO11.
  • Внедрение в производство: для коммерческого применения в розничной торговле, «умных» городах или сфере безопасности надежная поддержка экспорта и проверенная сообществом надежность YOLO11 риски внедрения.
  • Edge Computing: Благодаря оптимизированным вариантам YOLO11 исключительно высокую производительность на устройствах с ограниченными ресурсами, таких как Raspberry Pi или NVIDIA .

Сравнение кода: Простота использования

Разница в удобстве использования становится очевидной при сравнении рабочих процессов обучения.

Обучение с Ultralytics YOLO11: Ultralytics устраняет сложности, позволяя вам сосредоточиться на своих данных.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

Обучение с YOLOX: YOLOX обычно требует клонирования репозитория, настройки определенной среды и запуска обучения с помощью скриптов командной строки с многочисленными аргументами, что может быть менее интуитивным для рабочих процессов Python.

Заключение

YOLOX и YOLO11 эффективные модели, которые внесли значительный вклад в развитие области компьютерного зрения. YOLOX бросил вызов доминированию методов на основе якорей и ввел важные концепции, такие как развязанные головы. Однако для большинства разработчиков и предприятий сегодня YOLO11 представляет собой более привлекательный пакет. Сочетание высокой производительности, универсальности и непревзойденной экосистемы делает его прагматичным выбором для создания реальных решений в области искусственного интеллекта.

Тем, кто хочет еще больше расширить границы, особенно для периферийных развертываний, мы настоятельно рекомендуем изучить YOLO26. Благодаря своей сквозной конструкции NMS и устранению фокальной потери распределения (DFL), YOLO26 представляет собой новый скачок в эффективности и скорости.

Другие модели для изучения

  • YOLO26: новейшая ультрасовременная модель от Ultralytics январь 2026 г.), отличающаяся NMS NMS-вывода и специализированными функциями потерь.
  • YOLOv8: широко используемый классический алгоритм из YOLO , известный своим балансом скорости и точности.
  • RT-DETR: детектор на основе трансформатора, обеспечивающий высокую точность, идеально подходит для ситуаций, когда скорость в реальном времени менее важна, чем точность.
  • SAM : модель Meta Segment Anything Model, идеально подходящая для задач сегментации без предварительной подготовки.

Комментарии