Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 против YOLOv5: поколенческий скачок в детекции объектов#

Эволюция компьютерного зрения определяется неустанным стремлением к скорости, точности и доступности. Выбор правильной архитектуры имеет решающее значение для успеха любого ИИ-проекта. В этом подробном руководстве мы сравниваем два монументальных релиза от Ultralytics: первопроходца YOLOv5 и инновационную модель YOLO26. Хотя обе они оказали огромное влияние на ландшафт детекции объектов в реальном времени, их базовые технологии отражают серьезный сдвиг парадигмы в том, как нейронные сети обрабатывают визуальные данные.

Link to this sectionОбзор моделей#

Прежде чем погружаться в архитектурные нюансы, давай определим основополагающие детали обеих моделей.

Детали YOLO26:

Узнай больше о YOLO26

Детали YOLOv5:

Узнай больше о YOLOv5

Изучение других вариантов

Хотя это руководство посвящено YOLO26 и YOLOv5, разработчикам, переносящим устаревшие системы, также может быть интересно сравнить YOLO11 или архитектуру YOLOv10, в которой впервые не используется NMS. Обе они служат отличными отправными точками для конкретных сред развертывания.

Link to this sectionАрхитектурные инновации#

Шестилетний разрыв между YOLOv5 и YOLO26 представляет собой огромный скачок в исследованиях глубокого обучения. YOLOv5 популяризировала широкое использование PyTorch для моделей компьютерного зрения, предложив высокооптимизированный механизм детекции на основе якорей (anchors), который стал отраслевым стандартом. Однако она сильно зависела от Non-Maximum Suppression (NMS) во время постобработки, что могло приводить к задержкам на устройствах с ограниченными ресурсами.

YOLO26 полностью переосмысливает процесс инференса благодаря сквозному дизайну без NMS (End-to-End NMS-Free Design). Устраняя необходимость в постобработке NMS, YOLO26 обеспечивает более быструю и гораздо более простую логику развертывания — концепцию, впервые опробованную в YOLOv10, но доведенную здесь до совершенства. Кроме того, YOLO26 включает удаление DFL (Distribution Focal Loss), что значительно упрощает выходную голову (output head). Это делает экспорт модели в такие форматы, как ONNX и TensorRT, невероятно плавным, обеспечивая отличную совместимость с периферийными устройствами и устройствами с низким энергопотреблением.

Во время обучения YOLO26 использует передовой оптимизатор MuSGD, гибрид SGD и Muon, вдохновленный Kimi K2 от Moonshot AI. Это привносит инновации обучения LLM в сферу компьютерного зрения, гарантируя высокую стабильность обучения и значительно более быструю сходимость по сравнению с традиционными оптимизаторами SGD или AdamW, используемыми в YOLOv5.

Link to this sectionПроизводительность и метрики#

При оценке моделей баланс между средней точностью (mAP) и скоростью инференса определяет жизнеспособность в реальных условиях. YOLO26 нативно оптимизирована как для мощных GPU, так и для CPU на периферийных устройствах.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Бенчмарки демонстрируют ошеломляющее улучшение. Например, YOLO26n достигает mAP 40.9 по сравнению с 28.0 у YOLOv5n, одновременно обеспечивая до 43% более быстрый инференс на CPU. Это делает YOLO26 значительно более эффективной для встраиваемых решений, таких как Raspberry Pi или мобильные устройства. Хотя YOLOv5 имеет небольшое преимущество в скорости TensorRT GPU на уровне Nano, компромисс в точности сильно склоняется в пользу YOLO26.

Link to this sectionЭкосистема обучения и простота использования#

Обе модели получают огромную пользу от хорошо поддерживаемой экосистемы Ultralytics. Они предлагают опыт «от нуля до героя» с оптимизированным Python API, обширной документацией и активной поддержкой сообщества. Однако YOLO26 выводит эффективность обучения на новый уровень.

Модели Ultralytics стабильно требуют значительно меньше памяти CUDA во время обучения, чем аналоги с тяжелыми трансформерами. YOLO26 усиливает это с помощью функций потерь ProgLoss + STAL. Эти достижения приносят заметные улучшения в распознавании мелких объектов без увеличения нагрузки на память.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model with the MuSGD optimizer (default for YOLO26)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)

# Run fast, NMS-free inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Этот простой скрипт позволяет тебе быстро итерировать пользовательские наборы данных, бесшовно переходя от загрузки данных к модели, готовой к работе в продакшене.

Развертывание стало проще

Используя платформу Ultralytics, ты можешь автоматически экспортировать свои обученные модели YOLO26 в такие форматы, как CoreML или TensorFlow Lite, не написав ни строчки кода для конвертации.

Link to this sectionУниверсальность и идеальные варианты использования#

Link to this sectionКогда использовать YOLOv5#

YOLOv5 остается надежной «рабочей лошадкой» для устаревших систем. Если у тебя есть существующий промышленный конвейер, сильно привязанный к выводам на основе якорей (anchor-based), или если ты выполняешь инференс на старых устройствах NVIDIA Jetson со зрелыми, замороженными стеками TensorRT, YOLOv5 предоставляет стабильное и хорошо задокументированное решение.

Link to this sectionКогда использовать YOLO26#

YOLO26 — это окончательный выбор для современных проектов компьютерного зрения. Ее универсальность намного превосходит предшественницу. В то время как YOLOv5 в первую очередь фокусируется на детекции (с более поздними добавлениями сегментации), YOLO26 предлагает глубокую, нативную поддержку сегментации экземпляров, оценки позы, классификации изображений и ориентированных ограничивающих рамок (OBB).

YOLO26 представляет улучшения для конкретных задач, такие как специализированная функция потерь для семантической сегментации, оценка остаточного логарифмического правдоподобия (RLE) для сверхточных ключевых точек позы и продвинутая функция потерь угла для OBB, чтобы решать сложные пограничные проблемы.

  • Edge IoT и робототехника: Архитектура без NMS и инференс на CPU, ускоренный на 43%, делают YOLO26 идеальной для навигации роботов в реальном времени и камер «умного дома».
  • Аэросъемка: Улучшения ProgLoss + STAL делают обнаружение крошечных объектов с дронов — например, транспортных средств на парковках или посевов на сельскохозяйственных полях — значительно более надежным.
  • Видеоаналитика в реальном времени: Будь то отслеживание спортсменов в спортивных трансляциях или мониторинг транспортных потоков, баланс производительности YOLO26 гарантирует высокий показатель полноты (recall) без пропуска кадров.

В конечном итоге, приверженность Ultralytics доступной высокопроизводительной экосистеме гарантирует, что переход с YOLOv5 на YOLO26 происходит беспрепятственно, открывая передовые возможности как для исследователей, так и для разработчиков.

Авторы

Комментарии