YOLOv5 против YOLO26: поколенческий скачок в детекции объектов в реальном времени

Эволюция компьютерного зрения определяется постоянным стремлением к созданию более быстрых, точных и доступных моделей. Сравнивая Ultralytics YOLOv5 с передовой Ultralytics YOLO26, ты увидишь смену парадигмы, которая стирает грань между надежными старыми системами и самыми современными решениями в области ИИ.

В этом руководстве представлен подробный технический разбор обеих архитектур с акцентом на метрики производительности, структурные различия и идеальные сценарии развертывания.

Обзор моделей

YOLOv5: рабочая лошадка индустрии

Выпущенная в 2020 году, YOLOv5 произвела революцию в доступности детекции объектов. Перенос архитектуры на фреймворк PyTorch обеспечил разработчикам беспрецедентный опыт легкого старта («zero-to-hero»).

Авторы: Glenn Jocher
Организация: Ultralytics
Дата: 26.06.2020
GitHub: https://github.com/ultralytics/yolov5
Документация: Документация YOLOv5

YOLOv5 заложила фундамент высококлассной экосистемы Ultralytics. Она представила агрессивные методы аугментации данных, эффективные циклы обучения и оптимизированные пути экспорта в пограничные форматы, такие как CoreML и ONNX. Простота использования и низкие требования к памяти во время обучения сделали её основным инструментом для стартапов и исследователей по всему миру.

Узнай больше о YOLOv5

YOLO26: стандарт Vision AI нового поколения

Перенесемся в январь 2026 года: Ultralytics YOLO26 представляет собой вершину развития ИИ в области компьютерного зрения реального времени. Она органично интегрирует опыт, полученный в промежуточных поколениях, таких как YOLOv8 и YOLO11, и привносит масштабные прорывы, вдохновленные обучением больших языковых моделей (LLM).

Авторы: Гленн Джочер (Glenn Jocher) и Цзин Цю (Jing Qiu)
Организация: Ultralytics
Дата: 2026-01-14
GitHub: https://github.com/ultralytics/ultralytics
Документация: Документация YOLO26

YOLO26 устанавливает новый ориентир баланса производительности, предлагая точность уровня state-of-the-art и будучи специально разработанной для доминирования в задачах пограничных вычислений.

Узнай больше о YOLO26

Другие модели Ultralytics

Если ты переносишь старую кодовую базу, тебе также может быть интересно сравнить YOLOv5 с YOLO11 — моделью предыдущего поколения, которая внедрила начальную поддержку разнообразных задач, таких как оценка позы (Pose Estimation) и ориентированные ограничивающие рамки (OBB).

Архитектурные прорывы в YOLO26

В то время как YOLOv5 полагается на детекторы с привязкой к якорям (anchor-based) и стандартные функции потерь, YOLO26 полностью перерабатывает внутренние механизмы, чтобы устранить узкие места при развертывании.

Дизайн end-to-end без NMS: Самое значительное отличие — это нативная архитектура YOLO26 типа end-to-end. В отличие от YOLOv5, требующей ручного подавления немаксимумов (NMS) для фильтрации избыточных ограничивающих рамок, YOLO26 полностью исключает этот шаг постобработки. Это обеспечивает детерминированную задержку вывода и значительно упрощает интеграцию в C++ или встроенное оборудование.
Удаление DFL: YOLO26 удаляет Distribution Focal Loss (DFL). Этот архитектурный выбор радикально упрощает экспорт модели и улучшает совместимость с маломощными пограничными устройствами и микроконтроллерами, которые часто испытывают трудности с выполнением сложных операторов.
Оптимизатор MuSGD: Используя наработки Kimi K2 от Moonshot AI, YOLO26 применяет оптимизатор MuSGD, гибрид SGD и Muon. Это приносит стабильность и быструю сходимость, характерные для обучения LLM, в область компьютерного зрения, что приводит к меньшему использованию памяти и более быстрым циклам обучения по сравнению с моделями, насыщенными трансформерами.
ProgLoss + STAL: YOLO26 использует сложные функции ProgLoss и STAL, значительно улучшающие способность модели обнаруживать мелкие и плотно расположенные объекты — исторически сложная задача для YOLOv5.

Сравнение производительности

При сравнении моделей на датасете COCO, YOLO26 демонстрирует масштабные улучшения точности (mAP) при одновременном сокращении количества параметров и ускорении CPU-вывода.

Модель	размер ^{(пиксели)}	mAP^val 50-95	Скорость ^{CPU ONNX (мс)}	Скорость ^{T4 TensorRT10 (мс)}	параметры ^(М)	FLOPs ^(Б)
YOLOv5n	640	28.0	73.6	1.12	2.6	7.7
YOLOv5s	640	37.4	120.7	1.92	9.1	24.0
YOLOv5m	640	45.4	233.9	4.03	25.1	64.2
YOLOv5l	640	49.0	408.4	6.61	53.2	135.0
YOLOv5x	640	50.7	763.2	11.89	97.2	246.4

YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

Примечание: YOLO26 Nano (YOLO26n) достигает ошеломляющего значения 40.9 mAP по сравнению с 28.0 mAP у YOLOv5n, предлагая при этом до 43% более быстрый CPU-вывод благодаря удалению DFL и «голове» без NMS.

Универсальность и поддержка задач

YOLOv5 известна прежде всего детекцией объектов. Хотя более поздние обновления добавили базовую сегментацию, YOLO26 была с нуля спроектирована как унифицированный многозадачный движок.

YOLO26 изначально поддерживает:

Сегментацию экземпляров: включает многомасштабные прототипы, специфичные для задачи, и функцию потерь для семантической сегментации.
Оценку позы (Pose Estimation): использует Residual Log-Likelihood Estimation (RLE) для высокоточной детекции ключевых точек.
Ориентированные ограничивающие рамки (OBB): включая специализированную функцию потерь по углу для решения проблем разрыва границ, что критически важно для анализа спутниковых снимков.
Классификацию изображений: стандартная категоризация целого изображения.

Интеграция с экосистемой

Обе модели выигрывают от использования платформы Ultralytics, предоставляющей бесшовную разметку данных, автоматическую настройку гиперпараметров и развертывание в облаке в один клик. Однако YOLO26 в полной мере использует преимущества современных структур API.

Использование и примеры кода

Python API от Ultralytics делает переключение между моделями невероятно простым. Поскольку обе модели разделяют одну и ту же хорошо поддерживаемую экосистему, обновление устаревшего конвейера YOLOv5 до YOLO26 требует лишь замены файла весов.

Пример на Python

from ultralytics import YOLO

# To use YOLOv5, load a v5 weights file
# model = YOLO("yolov5su.pt")

# Migrate to the recommended YOLO26 model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset using the efficient MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=32,  # YOLO26's low memory footprint allows larger batch sizes
)

# Run an NMS-free inference
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Пример CLI

Ты можешь развернуть YOLO26 напрямую через командную строку, используя интеграцию TensorRT для максимальной пропускной способности GPU:

# Export the model to TensorRT format
yolo export model=yolo26n.pt format=engine

# Run inference with the compiled engine
yolo predict model=yolo26n.engine source=path/to/video.mp4

Идеальные сценарии использования

Когда стоит выбрать YOLO26

Для любого современного проекта по компьютерному зрению YOLO26 — это бесспорная рекомендация.

Edge AI и IoT: Ускорение CPU-вывода на 43% и удаление DFL делают её идеальной для развертывания на Raspberry Pi или мобильных устройствах.
Высокоскоростные конвейеры: Архитектура без NMS обеспечивает стабильную, предсказуемую задержку, что критически важно для автономной робототехники и систем сигнализации безопасности реального времени.
Сложные сценарии: Если твое приложение требует отслеживания мелких объектов (например, мониторинг с дронов) или вращающихся объектов (OBB), продвинутые функции потерь YOLO26 (ProgLoss + STAL) дают огромное преимущество в точности.

Когда стоит выбрать YOLOv5

Устаревшие системы: Если твоя рабочая среда имеет жестко закодированные зависимости от генерации якорей YOLOv5 или логики парсинга NMS, миграция может потребовать небольшого периода рефакторинга.
Специфические академические бенчмарки: Исследователи часто используют YOLOv5 в качестве классического базового уровня для демонстрации исторического прогресса архитектур детекции объектов.

Резюме

Переход с YOLOv5 на YOLO26 — это не просто итеративное обновление; это фундаментальный скачок в том, как модели детекции объектов обучаются и развертываются. Используя оптимизатор MuSGD, отказываясь от сложной постобработки благодаря дизайну без NMS и значительно ускоряя работу на CPU, Ultralytics YOLO26 обеспечивает бескомпромиссный баланс скорости и точности.

Хотя YOLOv5 всегда будут помнить как модель, которая демократизировала ИИ в компьютерном зрении, разработчикам, желающим создавать надежные, готовые к продакшену и перспективные приложения, стоит уверенно строить свои решения на базе YOLO26.

Contributors

GLglenn-jocher⁵

Created 4 месяца назадUpdated на прошлой неделе