Перейти к содержанию

YOLO26 против YOLOX: Прогресс в обнаружении объектов в реальном времени

В быстро развивающейся области компьютерного зрения выбор правильной модели для вашего приложения имеет решающее значение. Это руководство представляет собой углубленное техническое сравнение между Ultralytics YOLO26, новейшей передовой моделью для периферийных устройств и приложений реального времени, и YOLOX, высокопроизводительным детектором без якорей, выпущенным в 2021 году компанией Megvii. Мы анализируем их архитектуры, метрики производительности и пригодность для развертывания, чтобы помочь вам принять обоснованные решения для ваших проектов.

Обзор моделей

Прежде чем углубляться в технические детали, важно понять истоки и основные философии, лежащие в основе разработки каждой модели.

Ultralytics YOLO26

Выпущенная в январе 2026 года Гленном Джочером и Цзин Цю в Ultralytics, YOLO26 представляет собой значительный шаг вперед в эффективности и удобстве использования. Разработанная специально для периферийных и маломощных устройств, она представляет нативную сквозную архитектуру без NMS. Эта конструкция устраняет необходимость в постобработке Non-Maximum Suppression (NMS), что является распространенным узким местом в конвейерах развертывания.

Ключевые инновации включают оптимизатор MuSGD, вдохновленный Kimi K2 от Moonshot AI, который адаптирует методы обучения больших языковых моделей (LLM) для задач компьютерного зрения, а также удаление Distribution Focal Loss (DFL) для оптимизации процессов экспорта. Благодаря ускорению вывода на CPU до 43% по сравнению с предшественниками, YOLO26 превосходно работает в сценариях, требующих высокой скорости без ускорения на GPU.

Узнайте больше о YOLO26

YOLOX

YOLOX, разработанный исследователями Megvii в 2021 году, стал ключевым релизом, популяризировавшим безякорную парадигму обнаружения в семействе YOLO. Благодаря разделению предсказательной головы и использованию SimOTA для назначения меток, YOLOX достиг конкурентоспособной точности и выиграл Streaming Perception Challenge на семинаре CVPR 2021. Он остается уважаемой моделью в исследовательском сообществе за свой чистый дизайн и эффективность в высокопроизводительных средах с GPU.

Узнайте больше о YOLOX

Сравнение производительности

При оценке детекторов объектов компромисс между скоростью (задержкой) и точностью (mAP) имеет первостепенное значение. YOLO26 демонстрирует значительные преимущества по обоим показателям, особенно на оборудовании на базе CPU.

Метрический анализ

В следующей таблице представлена производительность различных масштабов моделей на наборе данных COCO.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Интерпретация производительности

YOLO26 стабильно превосходит YOLOX по всем масштабам с точки зрения точности (mAP). Например, YOLO26s достигает 48.6 mAP по сравнению с YOLOX-s с 40.5 mAP, что является существенным улучшением для моделей аналогичного размера. Кроме того, нативная сквозная архитектура YOLO26 гарантирует, что указанные скорости отражают общее время вывода, тогда как традиционные бенчмарки часто исключают время NMS.

Ключевые архитектурные различия

1. Сквозная обработка против постобработки

Одним из наиболее определяющих различий является конвейер вывода.

  • YOLO26: Нативно сквозной. Используя передовые методы обучения, он предсказывает точное количество объектов без необходимости подавления немаксимумов (NMS). Это прорыв для развертывания, поскольку NMS часто трудно ускорить на NPU и периферийных процессорах.
  • YOLOX: Полагается на NMS. Хотя он представил безъякорный механизм для упрощения головы, необработанный вывод все еще содержит перекрывающиеся рамки, которые необходимо фильтровать, что добавляет задержку и сложность при экспорте модели в такие форматы, как TensorRT или CoreML.

2. Функции потерь и оптимизация

YOLO26 представляет ProgLoss (Progressive Loss Balancing) и STAL (Small-Target-Aware Label Assignment). Эти инновации специально нацелены на обнаружение мелких объектов, что является общей слабостью ранних детекторов. Кроме того, YOLO26 использует оптимизатор MuSGD, гибрид SGD и Muon, который стабилизирует обучение значительно быстрее, чем стандартные оптимизаторы, используемые в YOLOX.

3. Оптимизация для периферийных устройств

YOLO26 явно удаляет модуль Distribution Focal Loss (DFL). Хотя DFL (используемый в таких моделях, как YOLOv8) улучшает точность ограничивающих рамок, он полагается на операции, которые могут быть медленными на специфическом оборудовании. Удаляя его, YOLO26 достигает ускорения вывода на CPU до 43%, что делает его превосходным выбором для Raspberry Pi, мобильных CPU и других сред с ограниченными ресурсами.

Простота использования и экосистема

Для разработчиков «мягкие» характеристики модели — документация, качество API и поддержка — так же важны, как и сырые метрики.

Преимущество Ultralytics

YOLO26 интегрирован в надежную экосистему Ultralytics. Это обеспечивает:

Экосистема YOLOX

YOLOX предоставляет надежную реализацию на PyTorch и поддерживает такие форматы, как ONNX и TensorRT. Однако он обычно требует больше шаблонного кода для обучения и вывода по сравнению с ultralytics пакетом. Его экосистема менее централизована, часто требуя от пользователей ручной обработки аугментаций данных и скриптов развертывания, которые стандартно поставляются с моделями Ultralytics.

Сравнение кода

Разница в удобстве использования лучше всего иллюстрируется кодом.

Обучение YOLO26 с Ultralytics:

from ultralytics import YOLO

# Load model and train on COCO8 dataset
model = YOLO("yolo26n.pt")
model.train(data="coco8.yaml", epochs=100, imgsz=640)

Обучение YOLOX (стандартная реализация):Требует клонирования репозитория, установки специфических требований, подготовки набора данных в определенной структуре каталогов и запуска сложных строк CLI.

# Example YOLOX training command (conceptual)
python tools/train.py -f exps/default/yolox_s.py -d 1 -b 64 --fp16 -o -c yolox_s.pth

Идеальные варианты использования

Когда выбирать YOLO26

  • Развертывание на периферии: Если вы развертываете на мобильных устройствах, датчиках IoT или CPU, где TensorRT или ускорение NPU ограничено.
  • Сложные задачи: Когда ваш проект требует сегментации, оценки позы или обнаружения повернутых объектов (OBB) наряду со стандартным обнаружением.
  • Быстрая разработка: Когда вам нужно быстро итерировать, используя стабильный, хорошо документированный API со встроенной поддержкой управления наборами данных.
  • Обнаружение мелких объектов: Приложения, такие как аэрофотосъемка или контроль качества, где предсказание мелких целей имеет решающее значение.

Когда следует рассмотреть YOLOX

  • Устаревшие исследования: Если вы воспроизводите академические результаты 2021-2022 годов, которые специально сравниваются с оригинальной статьей YOLOX.
  • Специфическая кастомизация: Если у вас есть существующий конвейер, сильно настроенный под специфическую архитектуру YOLOX, и затраты на миграцию являются непомерными.

Заключение

Хотя YOLOX остается важной вехой в истории безанкерного обнаружения объектов, YOLO26 предлагает более комплексное решение для современных приложений ИИ. Благодаря своей нативной сквозной архитектуре, превосходному соотношению точности и скорости, а также поддержке экосистемы Ultralytics, YOLO26 является рекомендуемым выбором как для новых проектов, так и для обновления существующих развертываний.

Сочетание стабильности обучения MuSGD, эффективности без DFL и универсальности задач гарантирует, что YOLO26 не только быстрее обнаруживает объекты, но и упрощает весь жизненный цикл машинного обучения от тренировки до развертывания.

Дополнительная литература

Тем, кто заинтересован в изучении других моделей семейства YOLO, рекомендуется рассмотреть:

  • YOLO11: Предшественник YOLO26, предлагающий отличную производительность и широкую совместимость.
  • YOLOv10: Первая итерация, представившая обучение без NMS, проложившая путь для усовершенствований YOLO26.
  • YOLO World: Для задач обнаружения с открытым словарем, где необходимо обнаруживать объекты, отсутствующие в обучающем наборе.

Комментарии