YOLOv5 против YOLO26: поколенческий скачок в детекции объектов в реальном времени

Эволюция компьютерного зрения определяется постоянным стремлением к созданию более быстрых, точных и доступных моделей. Сравнивая Ultralytics YOLOv5 с передовой Ultralytics YOLO26, ты увидишь смену парадигмы, которая стирает грань между надежными старыми системами и самыми современными решениями в области ИИ.

В этом руководстве представлен подробный технический разбор обеих архитектур с акцентом на метрики производительности, структурные различия и идеальные сценарии развертывания.

Обзор моделей

YOLOv5: рабочая лошадка индустрии

Выпущенная в 2020 году, YOLOv5 произвела революцию в доступности детекции объектов. Перенос архитектуры на фреймворк PyTorch обеспечил разработчикам беспрецедентный опыт легкого старта («zero-to-hero»).

YOLOv5 заложила фундамент высококлассной экосистемы Ultralytics. Она представила агрессивные методы аугментации данных, эффективные циклы обучения и оптимизированные пути экспорта в пограничные форматы, такие как CoreML и ONNX. Простота использования и низкие требования к памяти во время обучения сделали её основным инструментом для стартапов и исследователей по всему миру.

Узнай больше о YOLOv5

YOLO26: стандарт Vision AI нового поколения

Перенесемся в январь 2026 года: Ultralytics YOLO26 представляет собой вершину развития ИИ в области компьютерного зрения реального времени. Она органично интегрирует опыт, полученный в промежуточных поколениях, таких как YOLOv8 и YOLO11, и привносит масштабные прорывы, вдохновленные обучением больших языковых моделей (LLM).

YOLO26 устанавливает новый ориентир баланса производительности, предлагая точность уровня state-of-the-art и будучи специально разработанной для доминирования в задачах пограничных вычислений.

Узнай больше о YOLO26

Другие модели Ultralytics

Если ты переносишь старую кодовую базу, тебе также может быть интересно сравнить YOLOv5 с YOLO11 — моделью предыдущего поколения, которая внедрила начальную поддержку разнообразных задач, таких как оценка позы (Pose Estimation) и ориентированные ограничивающие рамки (OBB).

Архитектурные прорывы в YOLO26

В то время как YOLOv5 полагается на детекторы с привязкой к якорям (anchor-based) и стандартные функции потерь, YOLO26 полностью перерабатывает внутренние механизмы, чтобы устранить узкие места при развертывании.

  1. Дизайн end-to-end без NMS: Самое значительное отличие — это нативная архитектура YOLO26 типа end-to-end. В отличие от YOLOv5, требующей ручного подавления немаксимумов (NMS) для фильтрации избыточных ограничивающих рамок, YOLO26 полностью исключает этот шаг постобработки. Это обеспечивает детерминированную задержку вывода и значительно упрощает интеграцию в C++ или встроенное оборудование.
  2. Удаление DFL: YOLO26 удаляет Distribution Focal Loss (DFL). Этот архитектурный выбор радикально упрощает экспорт модели и улучшает совместимость с маломощными пограничными устройствами и микроконтроллерами, которые часто испытывают трудности с выполнением сложных операторов.
  3. Оптимизатор MuSGD: Используя наработки Kimi K2 от Moonshot AI, YOLO26 применяет оптимизатор MuSGD, гибрид SGD и Muon. Это приносит стабильность и быструю сходимость, характерные для обучения LLM, в область компьютерного зрения, что приводит к меньшему использованию памяти и более быстрым циклам обучения по сравнению с моделями, насыщенными трансформерами.
  4. ProgLoss + STAL: YOLO26 использует сложные функции ProgLoss и STAL, значительно улучшающие способность модели обнаруживать мелкие и плотно расположенные объекты — исторически сложная задача для YOLOv5.

Сравнение производительности

При сравнении моделей на датасете COCO, YOLO26 демонстрирует масштабные улучшения точности (mAP) при одновременном сокращении количества параметров и ускорении CPU-вывода.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Примечание: YOLO26 Nano (YOLO26n) достигает ошеломляющего значения 40.9 mAP по сравнению с 28.0 mAP у YOLOv5n, предлагая при этом до 43% более быстрый CPU-вывод благодаря удалению DFL и «голове» без NMS.

Универсальность и поддержка задач

YOLOv5 известна прежде всего детекцией объектов. Хотя более поздние обновления добавили базовую сегментацию, YOLO26 была с нуля спроектирована как унифицированный многозадачный движок.

YOLO26 изначально поддерживает:

  • Сегментацию экземпляров: включает многомасштабные прототипы, специфичные для задачи, и функцию потерь для семантической сегментации.
  • Оценку позы (Pose Estimation): использует Residual Log-Likelihood Estimation (RLE) для высокоточной детекции ключевых точек.
  • Ориентированные ограничивающие рамки (OBB): включая специализированную функцию потерь по углу для решения проблем разрыва границ, что критически важно для анализа спутниковых снимков.
  • Классификацию изображений: стандартная категоризация целого изображения.
Интеграция с экосистемой

Обе модели выигрывают от использования платформы Ultralytics, предоставляющей бесшовную разметку данных, автоматическую настройку гиперпараметров и развертывание в облаке в один клик. Однако YOLO26 в полной мере использует преимущества современных структур API.

Использование и примеры кода

Python API от Ultralytics делает переключение между моделями невероятно простым. Поскольку обе модели разделяют одну и ту же хорошо поддерживаемую экосистему, обновление устаревшего конвейера YOLOv5 до YOLO26 требует лишь замены файла весов.

Пример на Python

from ultralytics import YOLO

# To use YOLOv5, load a v5 weights file
# model = YOLO("yolov5su.pt")

# Migrate to the recommended YOLO26 model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset using the efficient MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=32,  # YOLO26's low memory footprint allows larger batch sizes
)

# Run an NMS-free inference
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Пример CLI

Ты можешь развернуть YOLO26 напрямую через командную строку, используя интеграцию TensorRT для максимальной пропускной способности GPU:

# Export the model to TensorRT format
yolo export model=yolo26n.pt format=engine

# Run inference with the compiled engine
yolo predict model=yolo26n.engine source=path/to/video.mp4

Идеальные сценарии использования

Когда стоит выбрать YOLO26

Для любого современного проекта по компьютерному зрению YOLO26 — это бесспорная рекомендация.

  • Edge AI и IoT: Ускорение CPU-вывода на 43% и удаление DFL делают её идеальной для развертывания на Raspberry Pi или мобильных устройствах.
  • Высокоскоростные конвейеры: Архитектура без NMS обеспечивает стабильную, предсказуемую задержку, что критически важно для автономной робототехники и систем сигнализации безопасности реального времени.
  • Сложные сценарии: Если твое приложение требует отслеживания мелких объектов (например, мониторинг с дронов) или вращающихся объектов (OBB), продвинутые функции потерь YOLO26 (ProgLoss + STAL) дают огромное преимущество в точности.

Когда стоит выбрать YOLOv5

  • Устаревшие системы: Если твоя рабочая среда имеет жестко закодированные зависимости от генерации якорей YOLOv5 или логики парсинга NMS, миграция может потребовать небольшого периода рефакторинга.
  • Специфические академические бенчмарки: Исследователи часто используют YOLOv5 в качестве классического базового уровня для демонстрации исторического прогресса архитектур детекции объектов.

Резюме

Переход с YOLOv5 на YOLO26 — это не просто итеративное обновление; это фундаментальный скачок в том, как модели детекции объектов обучаются и развертываются. Используя оптимизатор MuSGD, отказываясь от сложной постобработки благодаря дизайну без NMS и значительно ускоряя работу на CPU, Ultralytics YOLO26 обеспечивает бескомпромиссный баланс скорости и точности.

Хотя YOLOv5 всегда будут помнить как модель, которая демократизировала ИИ в компьютерном зрении, разработчикам, желающим создавать надежные, готовые к продакшену и перспективные приложения, стоит уверенно строить свои решения на базе YOLO26.

Комментарии