Перейти к содержанию

YOLO26 против YOLOv5: Сравнение архитектуры, скорости и вариантов использования

Эволюция моделей detect объектов была быстрой и преобразующей. В этом сравнении мы исследуем отличительные характеристики Ultralytics YOLO26 и Ultralytics YOLOv5, изучая, как достижения в архитектуре и методологиях обучения сформировали их возможности. В то время как YOLOv5 остается фундаментальным столпом в сообществе компьютерного зрения, недавно выпущенный YOLO26 представляет прорывные эффективности, разработанные для развертывания на периферийных устройствах следующего поколения и высокоскоростного вывода.

Обзор модели

Обе модели представляют собой значимые вехи в истории архитектуры YOLO (You Only Look Once). Они разделяют приверженность производительности в реальном времени и простоте использования, но служат для несколько разных эпох развития ИИ.

Ultralytics YOLO26

YOLO26 — это последняя итерация от Ultralytics, выпущенная в январе 2026 года. Она представляет собой сдвиг в сторону нативных сквозных архитектур, которые устраняют необходимость в постобработке Non-Maximum Suppression (NMS). Разработанная с учетом периферийных вычислений, она упрощает развертывание, одновременно расширяя границы точности.

  • Авторы: Гленн Джочер и Цзин Цю
  • Организация:Ultralytics
  • Дата: 2026-01-14
  • Документация:Документация YOLO26
  • Ключевое нововведение: Сквозное detect без NMS, удаление DFL и оптимизатор MuSGD.

Узнайте больше о YOLO26

Ultralytics YOLOv5

YOLOv5 был выпущен в середине 2020 года и быстро стал отраслевым стандартом благодаря балансу скорости, точности и удобной инженерии. Он представил экосистему PyTorch миллионам разработчиков и остается широко используемым в производственных средах, где стабильность и поддержка устаревших систем имеют первостепенное значение.

  • Автор: Гленн Джокер
  • Организация:Ultralytics
  • Дата: 2020-06-26
  • Документация:Документация YOLOv5
  • Ключевое нововведение: Удобная реализация PyTorch, мозаичная аугментация и механизмы авто-якорей.

Узнайте больше о YOLOv5

Архитектурные различия

Переход от YOLOv5 к YOLO26 включает фундаментальные изменения в том, как detect объекты и как модель оптимизируется во время обучения.

Сквозная обработка против постобработки

YOLOv5 полагается на подавление немаксимумов (NMS) для отфильтровывания дублирующихся ограничивающих рамок. Хотя NMS эффективен, он является эвристическим процессом, который может стать узким местом во время инференса, особенно на граничных устройствах с ограниченными циклами CPU. Он вводит гиперпараметры, такие как пороги IoU, которые необходимо настраивать для конкретных наборов данных.

В отличие от этого, YOLO26 изначально является сквозным. Приняв архитектуру, впервые примененную в YOLOv10, YOLO26 предсказывает точный набор объектов непосредственно из выходных данных сети без необходимости NMS. Это значительно упрощает конвейер развертывания, поскольку выход модели является окончательным результатом.

Простота развертывания

Удаление NMS в YOLO26 означает, что вам больше не нужно компилировать сложные этапы постобработки при экспорте в такие форматы, как CoreML или TensorRT. Сырые выходные данные модели готовы к использованию, что снижает задержку и сложность интеграции.

Функции потерь и оптимизация

YOLO26 вводит ProgLoss (прогрессивная балансировка потерь) и STAL (присвоение меток с учетом мелких объектов). Эти инновации специально нацелены на общие недостатки в обнаружении объектов, такие как трудности с обнаружением мелких объектов на аэрофотоснимках или в загроможденных сценах. ProgLoss динамически регулирует веса различных компонентов функции потерь во время обучения для стабилизации сходимости.

Кроме того, YOLO26 использует оптимизатор MuSGD, гибрид SGD и оптимизатора Muon, вдохновленный методами обучения больших языковых моделей (LLM). Это привносит стабильность обучения LLM в компьютерное зрение, что приводит к более быстрой сходимости и более устойчивым весам.

Упрощенная архитектура головы

Основным изменением в YOLO26 является удаление Distribution Focal Loss (DFL). Хотя DFL помогал с точностью ограничивающих рамок в предыдущих итерациях, таких как YOLOv8, он добавлял вычислительные накладные расходы и сложность при экспорте. Уточняя функцию потерь регрессии, YOLO26 достигает высокой точности без DFL, что делает его до 43% быстрее на CPU по сравнению с предыдущими поколениями, что является критически важным показателем для приложений edge AI.

Сравнение метрик производительности

Следующая таблица сравнивает производительность YOLO26 и YOLOv5 на наборе данных COCO. YOLO26 демонстрирует значительные улучшения как в точности (mAP), так и в скорости инференса, особенно на аппаратном обеспечении CPU, где проявляются его архитектурные оптимизации.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Основные выводы

  1. Скачок в точности: YOLO26n (Nano) достигает 40.9 mAP, значительно превосходя YOLOv5n с его 28.0 mAP. Это позволяет пользователям развертывать меньшие модели без ущерба для качества обнаружения.
  2. Эффективность CPU: Архитектурное упрощение в YOLO26 приводит к значительно более быстрому инференсу на CPU. Например, YOLO26n работает со скоростью ~39 мс на CPU по сравнению с ~74 мс для YOLOv5n, что делает его идеальным для Raspberry Pi или мобильных развертываний.
  3. Эффективность по параметрам: YOLO26 достигает более высокой точности с меньшим количеством параметров во многих случаях (например, YOLO26l имеет 24.8M параметров против 53.2M у YOLOv5l), уменьшая объем используемой памяти во время обучения и инференса.

Обучение и экосистема

Обе модели выигрывают от надежной экосистемы Ultralytics, но YOLO26 использует более новые инструменты и более глубокие интеграции.

Простота использования и API

Обе модели используют унифицированный ultralytics пакет Python (YOLOv5 изначально был автономным, но теперь интегрирован). Это гарантирует, что переключение между ними так же просто, как изменение строки имени модели.

from ultralytics import YOLO

# Load YOLO26 for state-of-the-art performance
model_26 = YOLO("yolo26n.pt")
model_26.train(data="coco8.yaml", epochs=100)

# Load YOLOv5 for legacy comparison
model_v5 = YOLO("yolov5nu.pt")
model_v5.train(data="coco8.yaml", epochs=100)

Расширенные функции обучения

YOLO26 поддерживает улучшенные стратегии аугментации данных и новый оптимизатор MuSGD, который помогает более эффективно избегать локальных минимумов, чем стандартный SGD, используемый в YOLOv5. Кроме того, YOLO26 предлагает улучшения, специфичные для задач, такие как Residual Log-Likelihood Estimation (RLE) для оценки позы и специализированные угловые потери для задач Oriented Bounding Box (OBB) — функции, которые либо отсутствовали, либо были менее доработаны в эпоху YOLOv5.

Пользователи также могут использовать платформу Ultralytics для управления наборами данных, обучения моделей в облаке и беспрепятственного развертывания на различных конечных точках.

Идеальные варианты использования

Когда выбирать YOLO26

YOLO26 является рекомендуемым выбором практически для всех новых проектов благодаря превосходному соотношению точности и задержки.

  • Edge AI и IoT: Благодаря удалению DFL и инференсу без NMS, YOLO26 идеально подходит для таких устройств, как NVIDIA Jetson, Raspberry Pi или мобильные телефоны, где эффективность CPU/NPU имеет решающее значение.
  • Обнаружение мелких объектов: Благодаря STAL, YOLO26 превосходно работает в сценариях, таких как аэрофотосъемка с дронов или обнаружение дефектов в производстве, где цели часто крошечны по сравнению с размером изображения.
  • Аналитика видео в реальном времени: Улучшения скорости позволяют обрабатывать более высокие частоты кадров, что крайне важно для мониторинга трафика или спортивной аналитики.

Когда выбирать YOLOv5

Хотя YOLOv5 старше, у него все еще есть своя ниша:

  • Устаревшие системы: Существующие конвейеры, построенные строго на основе структуры репозитория YOLOv5 образца 2020 года, могут счесть более простым поддерживать старую модель, а не мигрировать.
  • Самая широкая аппаратная поддержка: Будучи старше, YOLOv5 был портирован практически на каждую мыслимую платформу, включая очень малоизвестные микроконтроллеры, которые, возможно, еще не имеют оптимизированной поддержки для новых архитектур.

Заключение

В то время как YOLOv5 заложил основу для современного обнаружения объектов благодаря своей доступности и надежности, YOLO26 представляет собой значительный шаг вперед. Приняв сквозную безNMS архитектуру, оптимизировав для граничного оборудования и внедрив передовые методы обучения, такие как MuSGD и ProgLoss, YOLO26 предлагает убедительное обновление для разработчиков, стремящихся к наилучшей производительности.

Для большинства пользователей выбор очевиден: YOLO26 обеспечивает скорость, точность и универсальность, необходимые для современных требовательных приложений компьютерного зрения.

Изучите другие модели

Если вы заинтересованы в изучении других архитектур, обратите внимание на YOLO11, прямого предшественника YOLO26, или на YOLO-World для возможностей обнаружения с открытым словарем.


Комментарии