Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv8 против YOLOv5#

Выбор подходящей архитектуры компьютерного зрения — критически важный шаг при построении надежных конвейеров машинного обучения. В этом подробном техническом сравнении мы исследуем различия между двумя самыми популярными моделями в экосистеме vision AI: YOLOv8 и YOLOv5. Обе модели были разработаны Ultralytics и значительно повлияли на развитие сферы обнаружения объектов в реальном времени, установив отраслевые стандарты скорости, точности и простоты использования.

Независимо от того, разворачиваешь ли ты решение на граничных устройствах или масштабируешь облачный инференс, понимание архитектурных изменений, метрик производительности и методологий обучения этих моделей поможет тебе принять обоснованное решение для своих проектов по компьютерному зрению.

Link to this sectionUltralytics YOLOv8: универсальный стандарт#

Выпущенная в начале 2023 года, YOLOv8 ознаменовала собой серьезный архитектурный сдвиг по сравнению с предшественницами. Она была разработана с нуля как единый фреймворк, способный нативно решать множество задач компьютерного зрения, включая сегментацию экземпляров, классификацию изображений и оценку позы.

Link to this sectionАрхитектура и методологии#

В YOLOv8 представлена anchor-free (безякорная) голова обнаружения, которая упрощает процесс обучения за счет исключения необходимости вручную настраивать якорные рамки (anchor boxes) на основе распределения датасета. Это делает модель более устойчивой при обобщении на пользовательских датасетах и сокращает количество предсказаний рамок, ускоряя Non-Maximum Suppression (NMS).

Архитектура включает модуль C2f (Cross-Stage Partial bottleneck с двумя свертками), который заменяет модуль C3, используемый в YOLOv5. Модуль C2f улучшает поток градиентов и позволяет модели изучать более богатые представления признаков без существенного увеличения вычислительных затрат. Кроме того, в YOLOv8 используется структура decoupled head (разделенной головы), которая отдельно обрабатывает задачи определения наличия объекта, классификации и регрессии, что, как было доказано, повышает скорость сходимости и точность.

Эффективность памяти

Модели Ultralytics YOLO, включая YOLOv8, оптимизированы для использования меньшего объема памяти CUDA во время обучения по сравнению со многими альтернативами на базе Transformer, такими как RT-DETR. Это позволяет разработчикам использовать большие размеры пакетов (batch sizes) на стандартных потребительских GPU, таких как серия NVIDIA RTX.

Link to this sectionСильные и слабые стороны#

Преимущества:

  • Непревзойденная универсальность в решении множества задач, выходящих за рамки простого обнаружения ограничивающих рамок.
  • Оптимизированный Python API через пакет ultralytics, делающий обучение и экспорт крайне интуитивно понятными.
  • Более высокая mean Average Precision (mAP) для всех вариантов размеров по сравнению с YOLOv5.

Недостатки:

  • Разделенная голова (decoupled head) и модуль C2f вносят небольшое увеличение количества параметров и FLOPs для некоторых вариантов по сравнению с их прямыми аналогами в YOLOv5.

Узнай больше о YOLOv8

Link to this sectionUltralytics YOLOv5: Ловкий первопроходец#

Представленная в 2020 году, YOLOv5 привнесла YOLO в экосистему PyTorch, значительно улучшив доступность для разработчиков. Она быстро стала отраслевым стандартом для быстрых, надежных и легко развертываемых моделей обнаружения объектов.

Link to this sectionАрхитектура и методологии#

YOLOv5 опирается на anchor-based (якорную) архитектуру и использует модифицированный бэкбон CSPDarknet53. Хотя подходы на основе якорных рамок требуют тщательной кластеризации ограничивающих рамок датасета для определения оптимальных якорей перед обучением, они очень эффективны для конкретных, хорошо определенных датасетов.

В YOLOv5 встроен модуль C3, который эффективно извлекает признаки, сохраняя при этом небольшой размер параметров. Её функция потерь сильно полагается на потерю объектности (Objectness loss) в сочетании с потерями классификации и регрессии ограничивающих рамок для направления сети к точным предсказаниям.

Link to this sectionСильные и слабые стороны#

Преимущества:

  • Чрезвычайно легкая, что делает варианты Nano (YOLOv5n) и Small (YOLOv5s) отлично подходящими для развертывания edge AI с ограниченными ресурсами.
  • Исключительно высокая скорость инференса, особенно на CPU.
  • Глубоко укоренившаяся экосистема с огромным количеством обучающих материалов от сообщества и сторонних интеграций.

Недостатки:

  • Требует настройки якорных рамок, что может усложнить подготовку для сильно различающихся или пользовательских датасетов.
  • Более низкая общая точность (mAP) по сравнению с современными безъякорными архитектурами, такими как YOLOv8 и YOLO26.

Узнай больше о YOLOv5

Link to this sectionСравнение производительности#

При оценке этих моделей достижение выгодного компромисса между скоростью и точностью является первостепенным. В таблице ниже представлены метрики производительности обеих архитектур, оцененные на датасете COCO. Скорости на CPU измерялись с помощью ONNX, а скорости на GPU тестировались с использованием TensorRT.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Хотя YOLOv5 сохраняет небольшое преимущество в количестве параметров и абсолютной скорости для своего варианта Nano, YOLOv8 предлагает значительный скачок в mAP по всем направлениям, обеспечивая гораздо более сильный баланс производительности для требовательных сценариев реального развертывания.

Link to this sectionПростота использования и экосистема Ultralytics#

Определяющей характеристикой современных моделей Ultralytics является хорошо поддерживаемая экосистема, которая их окружает. Переход от YOLOv5 к YOLOv8 принес введение унифицированного pip-пакета ultralytics, что создало очень оптимизированный пользовательский опыт.

Ты можешь легко управлять обучением модели, валидацией, предсказанием и экспортом с помощью всего нескольких строк кода на Python, минуя сложные шаблонные скрипты, которые исторически требовались в проектах глубокого обучения.

from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train the model on custom data efficiently
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the model to ONNX for production deployment
path = model.export(format="onnx")

Более того, интеграция с такими инструментами, как Ultralytics Platform, упрощает управление датасетами, облачное обучение и развертывание, обеспечивая активную разработку и сильную поддержку сообщества.

Link to this sectionИдеальные варианты использования#

Когда выбирать YOLOv5: Если ты поддерживаешь устаревшие системы, запускаешь инференс на крайне ограниченных CPU, таких как Raspberry Pi, или работаешь над проектом, где сохранение каждого байта размера модели критически важно, YOLOv5 остается надежной рабочей лошадкой.

Когда выбирать YOLOv8: Практически для всех новых проектов, стартующих сегодня, YOLOv8 настоятельно рекомендуется вместо YOLOv5. Её продвинутая архитектура без усилий справляется со сложным трекингом, ориентированными ограничивающими рамками (OBB) и сегментацией. Она идеальна для современных приложений, начиная от автономной робототехники и заканчивая анализом медицинских изображений и инфраструктурой умного города.

Ищешь новейшее состояние технологий?

Хотя YOLOv8 невероятно функциональна, разработчикам, ищущим абсолютный предел производительности, стоит рассмотреть YOLO26. Выпущенная в 2026 году, она представляет несколько революционных достижений:

  • Сквозной (End-to-End) дизайн без NMS: Исключает постобработку NMS для более быстрого и простого развертывания — концепция, впервые предложенная в YOLOv10.
  • Оптимизатор MuSGD: Гибрид SGD и Muon, который привносит инновации из обучения LLM в компьютерное зрение, обеспечивая более стабильное обучение и более быструю сходимость.
  • До 43% более быстрый инференс на CPU: Сильно оптимизирована для сред граничных вычислений (edge computing) без выделенных GPU.
  • Удаление DFL: Distribution Focal Loss была удалена для упрощения экспорта и повышения совместимости с граничными устройствами.
  • ProgLoss + STAL: Продвинутые функции потерь, которые обеспечивают заметные улучшения в распознавании мелких объектов, что критично для аэрофотосъемки и интернета вещей (IoT).

Используя исчерпывающую документацию и инструменты, предоставляемые Ultralytics, ты можешь легко развернуть YOLOv8 или исследовать передовую YOLO26 для решения сложных визуальных задач с беспрецедентной скоростью и точностью. Для дальнейшего изучения рассмотри наши руководства по настройке гиперпараметров и практикам развертывания моделей.

Контрибьюторы

Комментарии