Перейти к содержанию

YOLOv5 против YOLO26: Эволюция обнаружения объектов в реальном времени

Эволюция обнаружения объектов ознаменовалась значительными скачками в эффективности и точности. В течение многих лет YOLOv5 оставался отраслевым стандартом, любимым за баланс скорости и простоты использования. Однако ландшафт компьютерного зрения быстро меняется. Появляется YOLO26, новейшее поколение от Ultralytics, которое переосмысливает возможности как на периферийных устройствах, так и на высокопроизводительных серверах.

Это руководство представляет техническое сравнение между легендарным YOLOv5 и передовым YOLO26, анализируя их архитектуры, метрики производительности и идеальные сценарии использования, чтобы помочь вам выбрать подходящий инструмент для вашего следующего проекта по компьютерному зрению.

Краткое сравнение

Хотя обе модели являются результатом приверженности Ultralytics доступному ИИ, они представляют разные эпохи философии проектирования. YOLOv5 был сосредоточен на создании надежной, удобной экосистемы, тогда как YOLO26 расширяет границы задержки и архитектурной эффективности.

YOLOv5: Унаследованный стандарт

Выпущенный в июне 2020 года Гленном Йохером, YOLOv5 произвел революцию в доступности обнаружения объектов. Это была одна из первых моделей, предложивших бесшовный процесс обучения непосредственно в экосистеме PyTorch, отказавшись от фреймворка Darknet, используемого ее предшественниками.

  • Дата: 2020-06-26
  • Авторы: Гленн Джокер
  • Организация:Ultralytics
  • Ключевая особенность: Обнаружение на основе якорей, требующее подавления немаксимумов (NMS).

YOLOv5 остается надежной рабочей лошадкой, особенно для устаревших систем, где обновление конвейера вывода может быть дорогостоящим. Его «якорная» архитектура опирается на предопределенные ограничивающие рамки для предсказания местоположения объектов — метод, который эффективен, но требует тщательной настройки гиперпараметров.

Узнайте больше о YOLOv5

YOLO26: Новый рубеж

Выпущенный в январе 2026 года Гленном Йохером и Цзин Цю, YOLO26 представляет радикальные архитектурные изменения, разработанные для современной эпохи Edge AI. Он отказывается от якорей и сложной постобработки, чтобы обеспечить чистую скорость без ущерба для точности.

  • Дата: 2026-01-14
  • Авторы: Гленн Джохер, Цзин Цю
  • Организация:Ultralytics
  • Ключевая особенность: Сквозная архитектура без NMS, оптимизатор MuSGD, удаление DFL.

YOLO26 создан для разработчиков, которым требуется максимальная пропускная способность. Устраняя необходимость в NMS, он упрощает логику развертывания и уменьшает задержку, что делает его превосходным выбором для приложений реального времени на CPU и мобильных устройствах.

Узнайте больше о YOLO26


Сравнение технических характеристик

Следующие метрики демонстрируют поколенческий скачок в производительности. Тесты проводились на наборе данных COCO, стандартном бенчмарке для задач object detection.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Основные выводы

  1. Эффективность CPU: YOLO26n почти в 2 раза быстрее на CPU, чем YOLOv5n, при этом предлагая значительный скачок в точности (28,0% против 40,9% mAP). Это критически важно для развертывания на Raspberry Pi или мобильных устройствах, где ресурсы GPU недоступны.
  2. Эффективность параметров: YOLO26x достигает значительно более высокой точности (57,5% mAP), чем YOLOv5x (50,7%), при этом используя почти вдвое меньше параметров (55,7M против 97,2M). Такое уменьшение размера модели снижает требования к памяти и затраты на хранение.
  3. Компромисс между точностью и скоростью: Версия "Nano" YOLO26 превосходит версию "Small" YOLOv5 по точности, несмотря на то, что относится к меньшему классу моделей.

Обновление с YOLOv5

Если вы в настоящее время используете YOLOv5s, переход на YOLO26n, вероятно, обеспечит вам одновременно более высокую точность и более быструю инференцию, снижая как вычислительные затраты, так и задержку.

Архитектурное Глубокое Погружение

Разрыв в производительности обусловлен фундаментальными различиями в подходе моделей к задаче detect.

1. Сквозная архитектура без NMS

YOLOv5 использует традиционный подход, который генерирует тысячи потенциальных ограничивающих рамок. Этап постобработки, называемый Non-Maximum Suppression (NMS), необходим для отфильтровывания их до окончательных detect. Этот этап часто медленный и трудно ускоряется на аппаратном обеспечении, таком как FPGA или NPU.

YOLO26 изначально является сквозной (end-to-end) системой. Он использует стратегию двойного присвоения меток во время обучения, которая заставляет модель предсказывать одну высококачественную рамку для каждого объекта. Это полностью исключает этап NMS во время инференции.

  • Преимущество: Меньшая задержка и более простые конвейеры развертывания (нет необходимости реализовывать NMS на C++ или CUDA для пользовательского экспорта).
  • Результат: До 43% более быстрая инференция на CPU по сравнению с предыдущими поколениями, полагающимися на интенсивную постобработку.

2. Функции потерь: Удаление DFL и ProgLoss

YOLOv5 (и последующий YOLOv8) использовали Distribution Focal Loss (DFL) для уточнения границ рамок. Хотя DFL эффективен, он добавляет вычислительные накладные расходы и сложность в процесс экспорта.

YOLO26 удаляет DFL, возвращаясь к упрощенной регрессионной голове, которую легче квантовать для развертывания INT8. Чтобы компенсировать любую потенциальную потерю точности, YOLO26 вводит ProgLoss (Progressive Loss Balancing) и STAL (Small-Target-Aware Label Assignment).

  • STAL: Конкретно нацелен на проблему "малых объектов", повышая производительность на удаленных или крошечных целях — распространенная слабость в более ранних версиях YOLO, включая v5.
  • ProgLoss: Динамически регулирует вес различных компонентов функции потерь во время обучения для стабилизации сходимости.

3. Оптимизатор MuSGD

Стабильность обучения была основным направлением для команды YOLO26. В то время как YOLOv5 обычно полагался на стандартные оптимизаторы SGD или Adam, YOLO26 включает MuSGD — гибридный оптимизатор, вдохновленный Kimi K2 от Moonshot AI и методами обучения больших языковых моделей (LLM).

  • Инновация: Он привносит стабильность Muon-оптимизации в компьютерное зрение, позволяя использовать более высокие скорости обучения и более быструю сходимость без риска скачков потерь.

Универсальность и поддержка задач

Обе модели интегрированы в экосистему Ultralytics, что означает поддержку широкого спектра задач компьютерного зрения. Однако YOLO26 включает архитектурные улучшения, специфичные для задач, которых нет у YOLOv5.

ФункциональностьYOLOv5YOLO26
Обнаружение объектов✅ Стандартный, на основе якорейБез NMS, STAL для малых объектов
Сегментация✅ Добавлено в v7.0Semantic Loss и Multi-scale Proto
Оценка позы❌ (Доступно в форках)RLE (Residual Log-Likelihood Estimation)
OBB❌ (Доступно в форках)Angle Loss для точного вращения
Классификация✅ Поддерживается✅ Оптимизированные архитектуры

Поддержка YOLO26 оценки остаточного логарифмического правдоподобия (RLE) в оценке позы обеспечивает значительно более точные ключевые точки для отслеживания позы человека, что делает ее превосходной для спортивной аналитики и медицинских приложений.

Обучение и использование

Одна из сильных сторон экосистемы Ultralytics — это унифицированный API. Независимо от того, используете ли вы YOLOv5 (через современный пакет) или YOLO26, код остается согласованным и простым.

Пример кода на Python

Вот как вы можете обучать и выполнять инференс с обеими моделями, используя ultralytics пакет. Обратите внимание, что для YOLOv5 современный пакет использует yolov5u веса (адаптированные без якорей) по умолчанию для лучшей совместимости, но сравнение применимо к архитектуре.

from ultralytics import YOLO

# Load the models
model_v5 = YOLO("yolov5s.pt")  # Legacy standard
model_26 = YOLO("yolo26n.pt")  # New NMS-free standard

# Comparison: Inference on an image
# YOLO26 requires no NMS post-processing arguments in export/deployment
results_v5 = model_v5("https://ultralytics.com/images/bus.jpg")
results_26 = model_26("https://ultralytics.com/images/bus.jpg")

# Print results to see speed differences
print(f"YOLOv5 Speed: {results_v5[0].speed}")
print(f"YOLO26 Speed: {results_26[0].speed}")

# Train YOLO26 on custom data
# The MuSGD optimizer is handled automatically
results = model_26.train(data="coco8.yaml", epochs=100, imgsz=640)

Платформа Ultralytics (ранее HUB) еще больше упрощает этот процесс, позволяя управлять наборами данных и обучать обе модели в облаке без написания кода, хотя YOLO26 является рекомендуемым по умолчанию для новых проектов, создаваемых на платформе.

Развертывание и экосистема

YOLOv5 обладает обширной устаревшей экосистемой. Существуют тысячи учебных пособий, сторонних репозиториев и аппаратных интеграций, специально написанных для yolov5 форматов. Если вы работаете с жестким, устаревшим аппаратным конвейером, который строго требует точной формы выходного tensor'а YOLOv5, он остается жизнеспособным выбором.

Однако для современного развертывания YOLO26 предлагает превосходные возможности экспорта.

  • Edge AI: Удаление DFL и NMS значительно упрощает преобразование моделей YOLO26 в такие форматы, как TensorRT и OpenVINO.
  • Квантование: YOLO26 разработан с учетом удобства квантования, сохраняя более высокую точность при преобразовании в INT8 для мобильных процессоров.

Заключение

В то время как YOLOv5 остается легендарной моделью, демократизировавшей обнаружение объектов, YOLO26 представляет будущее. Благодаря своей сквозной безальтернативной NMS-архитектуре, удалению тяжелых функций потерь и интеграции оптимизаторов, вдохновленных LLM, таких как MuSGD, YOLO26 обеспечивает такой профиль производительности, которому YOLOv5 просто не может соответствовать.

Для разработчиков, начинающих новые проекты, YOLO26 является однозначной рекомендацией. Он предлагает более высокую точность при меньшей задержке, сниженное потребление памяти и более простой путь развертывания.

Изучите другие модели

Для пользователей, заинтересованных в специализированных архитектурах, рассмотрите возможность изучения YOLO11, прямого предшественника YOLO26, который предлагает отличную производительность общего назначения, или YOLO-World для задач обнаружения с открытым словарем, где вам нужно detect объекты, отсутствующие в вашем обучающем наборе.


Комментарии