Перейти к содержанию

YOLO26 против YOLOX: Новая эра безанкерного обнаружения объектов

Эволюция компьютерного зрения ознаменована значительными архитектурными прорывами. В 2021 году YOLOX представил весьма влиятельную безанкерную парадигму, которая преодолела разрыв между академическими исследованиями и промышленным применением. Перенесемся в 2026 год, и ландшафт был переопределен Ultralytics YOLO, в частности, с выпуском YOLO26. Это всестороннее сравнение исследует, как YOLO26 основывается на исторических инновациях, чтобы обеспечить непревзойденную производительность, универсальность и простоту использования.

Обзоры моделей

Понимание истоков и основных философий этих моделей необходимо для принятия обоснованных решений по развертыванию.

YOLO26 Подробности

Узнайте больше о YOLO26

YOLO26 представляет собой вершину современного инжиниринга ИИ, предлагая нативную сквозную архитектуру, которая устраняет сложные узкие места постобработки. Он значительно оптимизирован как для облачных, так и для периферийных развертываний, обладая экосистемой, которая бесшовно поддерживает разнообразные задачи.

Подробности о YOLOX

Узнайте больше о YOLOX

YOLOX стал важным шагом вперёд, представив разделенную голову и безъякорную архитектуру наряду со стратегией присваивания меток SimOTA. Он предлагал отличный баланс скорости и точности на момент своего выпуска, что сделало его популярным выбором для многих устаревших систем.

Архитектурные инновации

Различия между YOLO26 и YOLOX подчеркивают пять лет неустанных инноваций в проектировании глубокого обучения.

Хотя YOLOX отстаивал безанкерный подход, он всё ещё сильно зависел от традиционной Non-Maximum Suppression (NMS) для фильтрации избыточных ограничивающих рамок. YOLO26 представляет сквозную NMS-Free архитектуру. Этот прорыв, впервые применённый в YOLOv10, полностью исключает постобработку NMS, что приводит к более быстрым и простым конвейерам развертывания со значительно меньшей вариативностью задержки.

Кроме того, YOLO26 включает удаление DFL. Благодаря исключению Distribution Focal Loss процесс экспорта модели значительно упрощается, обеспечивая исключительную совместимость с периферийными устройствами и оборудованием с низким энергопотреблением. В сочетании с архитектурными оптимизациями модели YOLO26 достигает до 43% более быстрого инференса на CPU по сравнению с предшественниками, что делает его мощным решением для сред, не имеющих выделенных GPU.

Стабильность обучения — еще одно критическое отличие. YOLO26 использует новый оптимизатор MuSGD, гибрид SGD и Muon, вдохновленный инновациями в обучении LLM от Moonshot AI. Этот оптимизатор обеспечивает стабильность обучения больших языковых моделей в компьютерном зрении, способствуя более быстрой сходимости.

Расширенные функции потерь

YOLO26 использует ProgLoss + STAL, специализированные функции потерь, которые обеспечивают заметные улучшения в распознавании мелких объектов. Это критически важно для сложных задач, таких как обработка аэрофотоснимков и анализ плотных сред.

Производительность и сравнительное тестирование

При прямом сравнении этих моделей на наборе данных COCO превосходство YOLO26 как в точности, так и в эффективности становится очевидным. Модели Ultralytics неизменно демонстрируют более низкие требования к памяти во время обучения и более высокую скорость инференса.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Примечание: Модель YOLO26x достигает впечатляющего mAP в 57.5, при этом требуя значительно меньше параметров (55.7M), чем модель YOLOXx (99.1M), подчеркивая невероятную эффективность по параметрам архитектуры Ultralytics.

Экосистема и простота использования

Одним из наиболее значительных преимуществ выбора YOLO26 является хорошо поддерживаемая экосистема, предоставляемая Ultralytics. В то время как YOLOX требует ориентироваться в сложных исследовательских кодовых базах и выполнять ручные настройки окружения, Ultralytics предлагает оптимизированный процесс разработки, позволяющий быстро освоить систему.

Используя унифицированный Python API, разработчики могут легко переключаться между такими задачами, как обнаружение объектов, сегментация экземпляров, классификация изображений и оценка позы. YOLOX, напротив, строго ограничен обнаружением ограничивающих рамок.

Пример обучения

Обучение модели на пользовательском наборе данных с помощью Ultralytics отличается исключительной эффективностью. Конвейер обучения минимизирует использование памяти CUDA, что позволяет использовать большие размеры пакетов даже на потребительском оборудовании, что является резким контрастом по сравнению со старыми архитектурами или тяжелыми моделями-трансформерами.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model effortlessly with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the trained model to ONNX format for deployment
model.export(format="onnx")

The Платформа Ultralytics дополнительно улучшает этот рабочий процесс, предоставляя облачное обучение, автоматическую аннотацию наборов данных и опции развертывания в один клик. Это незаменимый инструмент для команд, стремящихся быстро перейти от прототипирования к производству.

Идеальные варианты использования и практические применения

Выбор правильной модели определяет успех вашего реального развертывания.

Периферийный ИИ и IoT

Для приложений, требующих локальной обработки на ограниченном оборудовании, таких как умные системы охранной сигнализации или удаленные датчики окружающей среды, YOLO26 является окончательным выбором. Его архитектура без NMS и на 43% более быстрое выполнение на CPU означают, что он бесперебойно работает на таких устройствах, как Raspberry Pi, без сложных обходных путей квантования.

Автономная робототехника

Робототехника требует высокой точности и низкой задержки. Возможности оценки позы YOLO26, усиленные оценкой остаточного логарифмического правдоподобия (RLE), позволяют роботам понимать кинематику человека в реальном времени. Отсутствие в YOLOX встроенного обнаружения ключевых точек делает его непригодным для таких сложных задач взаимодействия человека и робота.

Высотная и аэроинспекция

При инспектировании инфраструктуры с помощью дронов обнаружение мельчайших дефектов имеет первостепенное значение. Функции ProgLoss и STAL в YOLO26 значительно улучшают полноту обнаружения крошечных объектов. Кроме того, YOLO26 нативно поддерживает ориентированные ограничивающие рамки (OBB), дополненные специализированной функцией потерь угла для решения проблем границ, что делает его идеальным для спутниковых и аэрофотоснимков, где объекты произвольно повернуты.

Устаревшие развертывания

YOLOX все еще может найти применение в устаревших средах, где существующие конвейеры развертывания на C++ были явно построены вокруг его специфических выходов разделенной головы в 2021 году. Однако для любого нового проекта настоятельно рекомендуется мигрировать в экосистему Ultralytics, чтобы использовать современные приросты производительности и постоянную поддержку сообщества.

Изучение других моделей

Хотя YOLO26 представляет собой текущее состояние передовых технологий, экосистема Ultralytics предлагает множество моделей, адаптированных под конкретные нужды. Для разработчиков, интересующихся архитектурами на основе трансформеров, RT-DETR предлагает альтернативный подход к сквозному обнаружению. Кроме того, YOLO11 остается надежным, тщательно протестированным вариантом для производственных сред, требующих обширного исторического бенчмаркинга.

В заключение, переход от YOLOX к YOLO26 демонстрирует стремительное развитие этой области. Сочетая интуитивно понятный API, универсальный набор функций и беспрецедентную эффективность, YOLO26 является лучшим выбором для исследователей и разработчиков по всему миру.


Комментарии