YOLOv5 против YOLO26: поколенческий скачок в детекции объектов в реальном времени
Эволюция компьютерного зрения определяется постоянным стремлением к созданию более быстрых, точных и доступных моделей. Сравнивая Ultralytics YOLOv5 с передовой Ultralytics YOLO26, ты увидишь смену парадигмы, которая стирает грань между надежными старыми системами и самыми современными решениями в области ИИ.
В этом руководстве представлен подробный технический разбор обеих архитектур с акцентом на метрики производительности, структурные различия и идеальные сценарии развертывания.
Обзор моделей
YOLOv5: рабочая лошадка индустрии
Выпущенная в 2020 году, YOLOv5 произвела революцию в доступности детекции объектов. Перенос архитектуры на фреймворк PyTorch обеспечил разработчикам беспрецедентный опыт легкого старта («zero-to-hero»).
- Авторы: Glenn Jocher
- Организация: Ultralytics
- Дата: 26.06.2020
- GitHub: https://github.com/ultralytics/yolov5
- Документация: Документация YOLOv5
YOLOv5 заложила фундамент высококлассной экосистемы Ultralytics. Она представила агрессивные методы аугментации данных, эффективные циклы обучения и оптимизированные пути экспорта в пограничные форматы, такие как CoreML и ONNX. Простота использования и низкие требования к памяти во время обучения сделали её основным инструментом для стартапов и исследователей по всему миру.
YOLO26: стандарт Vision AI нового поколения
Перенесемся в январь 2026 года: Ultralytics YOLO26 представляет собой вершину развития ИИ в области компьютерного зрения реального времени. Она органично интегрирует опыт, полученный в промежуточных поколениях, таких как YOLOv8 и YOLO11, и привносит масштабные прорывы, вдохновленные обучением больших языковых моделей (LLM).
- Авторы: Гленн Джочер (Glenn Jocher) и Цзин Цю (Jing Qiu)
- Организация: Ultralytics
- Дата: 2026-01-14
- GitHub: https://github.com/ultralytics/ultralytics
- Документация: Документация YOLO26
YOLO26 устанавливает новый ориентир баланса производительности, предлагая точность уровня state-of-the-art и будучи специально разработанной для доминирования в задачах пограничных вычислений.
Если ты переносишь старую кодовую базу, тебе также может быть интересно сравнить YOLOv5 с YOLO11 — моделью предыдущего поколения, которая внедрила начальную поддержку разнообразных задач, таких как оценка позы (Pose Estimation) и ориентированные ограничивающие рамки (OBB).
Архитектурные прорывы в YOLO26
В то время как YOLOv5 полагается на детекторы с привязкой к якорям (anchor-based) и стандартные функции потерь, YOLO26 полностью перерабатывает внутренние механизмы, чтобы устранить узкие места при развертывании.
- Дизайн end-to-end без NMS: Самое значительное отличие — это нативная архитектура YOLO26 типа end-to-end. В отличие от YOLOv5, требующей ручного подавления немаксимумов (NMS) для фильтрации избыточных ограничивающих рамок, YOLO26 полностью исключает этот шаг постобработки. Это обеспечивает детерминированную задержку вывода и значительно упрощает интеграцию в C++ или встроенное оборудование.
- Удаление DFL: YOLO26 удаляет Distribution Focal Loss (DFL). Этот архитектурный выбор радикально упрощает экспорт модели и улучшает совместимость с маломощными пограничными устройствами и микроконтроллерами, которые часто испытывают трудности с выполнением сложных операторов.
- Оптимизатор MuSGD: Используя наработки Kimi K2 от Moonshot AI, YOLO26 применяет оптимизатор MuSGD, гибрид SGD и Muon. Это приносит стабильность и быструю сходимость, характерные для обучения LLM, в область компьютерного зрения, что приводит к меньшему использованию памяти и более быстрым циклам обучения по сравнению с моделями, насыщенными трансформерами.
- ProgLoss + STAL: YOLO26 использует сложные функции ProgLoss и STAL, значительно улучшающие способность модели обнаруживать мелкие и плотно расположенные объекты — исторически сложная задача для YOLOv5.
Сравнение производительности
При сравнении моделей на датасете COCO, YOLO26 демонстрирует масштабные улучшения точности (mAP) при одновременном сокращении количества параметров и ускорении CPU-вывода.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Примечание: YOLO26 Nano (YOLO26n) достигает ошеломляющего значения 40.9 mAP по сравнению с 28.0 mAP у YOLOv5n, предлагая при этом до 43% более быстрый CPU-вывод благодаря удалению DFL и «голове» без NMS.
Универсальность и поддержка задач
YOLOv5 известна прежде всего детекцией объектов. Хотя более поздние обновления добавили базовую сегментацию, YOLO26 была с нуля спроектирована как унифицированный многозадачный движок.
YOLO26 изначально поддерживает:
- Сегментацию экземпляров: включает многомасштабные прототипы, специфичные для задачи, и функцию потерь для семантической сегментации.
- Оценку позы (Pose Estimation): использует Residual Log-Likelihood Estimation (RLE) для высокоточной детекции ключевых точек.
- Ориентированные ограничивающие рамки (OBB): включая специализированную функцию потерь по углу для решения проблем разрыва границ, что критически важно для анализа спутниковых снимков.
- Классификацию изображений: стандартная категоризация целого изображения.
Обе модели выигрывают от использования платформы Ultralytics, предоставляющей бесшовную разметку данных, автоматическую настройку гиперпараметров и развертывание в облаке в один клик. Однако YOLO26 в полной мере использует преимущества современных структур API.
Использование и примеры кода
Python API от Ultralytics делает переключение между моделями невероятно простым. Поскольку обе модели разделяют одну и ту же хорошо поддерживаемую экосистему, обновление устаревшего конвейера YOLOv5 до YOLO26 требует лишь замены файла весов.
Пример на Python
from ultralytics import YOLO
# To use YOLOv5, load a v5 weights file
# model = YOLO("yolov5su.pt")
# Migrate to the recommended YOLO26 model
model = YOLO("yolo26n.pt")
# Train on the COCO8 dataset using the efficient MuSGD optimizer
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
batch=32, # YOLO26's low memory footprint allows larger batch sizes
)
# Run an NMS-free inference
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()Пример CLI
Ты можешь развернуть YOLO26 напрямую через командную строку, используя интеграцию TensorRT для максимальной пропускной способности GPU:
# Export the model to TensorRT format
yolo export model=yolo26n.pt format=engine
# Run inference with the compiled engine
yolo predict model=yolo26n.engine source=path/to/video.mp4Идеальные сценарии использования
Когда стоит выбрать YOLO26
Для любого современного проекта по компьютерному зрению YOLO26 — это бесспорная рекомендация.
- Edge AI и IoT: Ускорение CPU-вывода на 43% и удаление DFL делают её идеальной для развертывания на Raspberry Pi или мобильных устройствах.
- Высокоскоростные конвейеры: Архитектура без NMS обеспечивает стабильную, предсказуемую задержку, что критически важно для автономной робототехники и систем сигнализации безопасности реального времени.
- Сложные сценарии: Если твое приложение требует отслеживания мелких объектов (например, мониторинг с дронов) или вращающихся объектов (OBB), продвинутые функции потерь YOLO26 (ProgLoss + STAL) дают огромное преимущество в точности.
Когда стоит выбрать YOLOv5
- Устаревшие системы: Если твоя рабочая среда имеет жестко закодированные зависимости от генерации якорей YOLOv5 или логики парсинга NMS, миграция может потребовать небольшого периода рефакторинга.
- Специфические академические бенчмарки: Исследователи часто используют YOLOv5 в качестве классического базового уровня для демонстрации исторического прогресса архитектур детекции объектов.
Резюме
Переход с YOLOv5 на YOLO26 — это не просто итеративное обновление; это фундаментальный скачок в том, как модели детекции объектов обучаются и развертываются. Используя оптимизатор MuSGD, отказываясь от сложной постобработки благодаря дизайну без NMS и значительно ускоряя работу на CPU, Ultralytics YOLO26 обеспечивает бескомпромиссный баланс скорости и точности.
Хотя YOLOv5 всегда будут помнить как модель, которая демократизировала ИИ в компьютерном зрении, разработчикам, желающим создавать надежные, готовые к продакшену и перспективные приложения, стоит уверенно строить свои решения на базе YOLO26.