Link to this sectionYOLO26 против YOLOv5: поколенческий скачок в детекции объектов#
Эволюция компьютерного зрения определяется неустанным стремлением к скорости, точности и доступности. Выбор правильной архитектуры имеет решающее значение для успеха любого ИИ-проекта. В этом подробном руководстве мы сравниваем два монументальных релиза от Ultralytics: первопроходца YOLOv5 и инновационную модель YOLO26. Хотя обе они оказали огромное влияние на ландшафт детекции объектов в реальном времени, их базовые технологии отражают серьезный сдвиг парадигмы в том, как нейронные сети обрабатывают визуальные данные.
Link to this sectionОбзор моделей#
Прежде чем погружаться в архитектурные нюансы, давай определим основополагающие детали обеих моделей.
Детали YOLO26:
- Авторы: Гленн Джочер и Цзин Цю
- Организация: Ultralytics
- Дата: 2026-01-14
- GitHub: https://github.com/ultralytics/ultralytics
- Документация: Документация YOLO26
Детали YOLOv5:
- Автор: Гленн Джочер
- Организация: Ultralytics
- Дата: 26.06.2020
- GitHub: https://github.com/ultralytics/yolov5
- Документация: Документация YOLOv5
Link to this sectionАрхитектурные инновации#
Шестилетний разрыв между YOLOv5 и YOLO26 представляет собой огромный скачок в исследованиях глубокого обучения. YOLOv5 популяризировала широкое использование PyTorch для моделей компьютерного зрения, предложив высокооптимизированный механизм детекции на основе якорей (anchors), который стал отраслевым стандартом. Однако она сильно зависела от Non-Maximum Suppression (NMS) во время постобработки, что могло приводить к задержкам на устройствах с ограниченными ресурсами.
YOLO26 полностью переосмысливает процесс инференса благодаря сквозному дизайну без NMS (End-to-End NMS-Free Design). Устраняя необходимость в постобработке NMS, YOLO26 обеспечивает более быструю и гораздо более простую логику развертывания — концепцию, впервые опробованную в YOLOv10, но доведенную здесь до совершенства. Кроме того, YOLO26 включает удаление DFL (Distribution Focal Loss), что значительно упрощает выходную голову (output head). Это делает экспорт модели в такие форматы, как ONNX и TensorRT, невероятно плавным, обеспечивая отличную совместимость с периферийными устройствами и устройствами с низким энергопотреблением.
Во время обучения YOLO26 использует передовой оптимизатор MuSGD, гибрид SGD и Muon, вдохновленный Kimi K2 от Moonshot AI. Это привносит инновации обучения LLM в сферу компьютерного зрения, гарантируя высокую стабильность обучения и значительно более быструю сходимость по сравнению с традиционными оптимизаторами SGD или AdamW, используемыми в YOLOv5.
Link to this sectionПроизводительность и метрики#
При оценке моделей баланс между средней точностью (mAP) и скоростью инференса определяет жизнеспособность в реальных условиях. YOLO26 нативно оптимизирована как для мощных GPU, так и для CPU на периферийных устройствах.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Бенчмарки демонстрируют ошеломляющее улучшение. Например, YOLO26n достигает mAP 40.9 по сравнению с 28.0 у YOLOv5n, одновременно обеспечивая до 43% более быстрый инференс на CPU. Это делает YOLO26 значительно более эффективной для встраиваемых решений, таких как Raspberry Pi или мобильные устройства. Хотя YOLOv5 имеет небольшое преимущество в скорости TensorRT GPU на уровне Nano, компромисс в точности сильно склоняется в пользу YOLO26.
Link to this sectionЭкосистема обучения и простота использования#
Обе модели получают огромную пользу от хорошо поддерживаемой экосистемы Ultralytics. Они предлагают опыт «от нуля до героя» с оптимизированным Python API, обширной документацией и активной поддержкой сообщества. Однако YOLO26 выводит эффективность обучения на новый уровень.
Модели Ultralytics стабильно требуют значительно меньше памяти CUDA во время обучения, чем аналоги с тяжелыми трансформерами. YOLO26 усиливает это с помощью функций потерь ProgLoss + STAL. Эти достижения приносят заметные улучшения в распознавании мелких объектов без увеличения нагрузки на память.
from ultralytics import YOLO
# Initialize the cutting-edge YOLO26 Nano model
model = YOLO("yolo26n.pt")
# Train the model with the MuSGD optimizer (default for YOLO26)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)
# Run fast, NMS-free inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()Этот простой скрипт позволяет тебе быстро итерировать пользовательские наборы данных, бесшовно переходя от загрузки данных к модели, готовой к работе в продакшене.
Используя платформу Ultralytics, ты можешь автоматически экспортировать свои обученные модели YOLO26 в такие форматы, как CoreML или TensorFlow Lite, не написав ни строчки кода для конвертации.
Link to this sectionУниверсальность и идеальные варианты использования#
Link to this sectionКогда использовать YOLOv5#
YOLOv5 остается надежной «рабочей лошадкой» для устаревших систем. Если у тебя есть существующий промышленный конвейер, сильно привязанный к выводам на основе якорей (anchor-based), или если ты выполняешь инференс на старых устройствах NVIDIA Jetson со зрелыми, замороженными стеками TensorRT, YOLOv5 предоставляет стабильное и хорошо задокументированное решение.
Link to this sectionКогда использовать YOLO26#
YOLO26 — это окончательный выбор для современных проектов компьютерного зрения. Ее универсальность намного превосходит предшественницу. В то время как YOLOv5 в первую очередь фокусируется на детекции (с более поздними добавлениями сегментации), YOLO26 предлагает глубокую, нативную поддержку сегментации экземпляров, оценки позы, классификации изображений и ориентированных ограничивающих рамок (OBB).
YOLO26 представляет улучшения для конкретных задач, такие как специализированная функция потерь для семантической сегментации, оценка остаточного логарифмического правдоподобия (RLE) для сверхточных ключевых точек позы и продвинутая функция потерь угла для OBB, чтобы решать сложные пограничные проблемы.
- Edge IoT и робототехника: Архитектура без NMS и инференс на CPU, ускоренный на 43%, делают YOLO26 идеальной для навигации роботов в реальном времени и камер «умного дома».
- Аэросъемка: Улучшения ProgLoss + STAL делают обнаружение крошечных объектов с дронов — например, транспортных средств на парковках или посевов на сельскохозяйственных полях — значительно более надежным.
- Видеоаналитика в реальном времени: Будь то отслеживание спортсменов в спортивных трансляциях или мониторинг транспортных потоков, баланс производительности YOLO26 гарантирует высокий показатель полноты (recall) без пропуска кадров.
В конечном итоге, приверженность Ultralytics доступной высокопроизводительной экосистеме гарантирует, что переход с YOLOv5 на YOLO26 происходит беспрепятственно, открывая передовые возможности как для исследователей, так и для разработчиков.