Перейти к содержанию

YOLOv5 против YOLOv8: Оценка эволюции Ultralytics Vision AI.

При создании масштабируемых и эффективных приложений компьютерного зрения выбор правильной архитектуры имеет решающее значение. Эволюция экосистемы Ultralytics постоянно расширяла границы скорости и точности, предоставляя разработчикам надежные инструменты для реальных развертываний. Это техническое сравнение углубляется в различия между YOLOv5 и YOLOv8, исследуя их архитектуры, компромиссы в производительности и идеальные варианты использования, чтобы помочь вам принять обоснованное решение для вашего следующего проекта в области ИИ.

Обе эти модели представляют собой значимые вехи в истории обнаружения объектов в реальном времени, и обе выигрывают от высокооптимизированных требований к памяти и простоты использования, характерных для экосистемы Ultralytics.

YOLOv5: Надежный отраслевой стандарт.

Представленный в 2020 году, YOLOv5 быстро стал отраслевым стандартом для быстрого, доступного и надежного обнаружения объектов. Используя нативную реализацию на PyTorch, он упростил жизненный цикл обучения и развертывания для инженеров по всему миру.

Архитектурные преимущества

YOLOv5 работает по парадигме detect на основе якорей, которая опирается на предопределенные anchor boxes для предсказания границ объектов. Его архитектура включает backbone сети Cross-Stage Partial (CSP), оптимизируя поток градиентов и уменьшая вычислительную избыточность. Это приводит к невероятно малому объему занимаемой памяти, что делает его исключительно быстрым для обучения даже на стандартных потребительских GPU.

Идеальные варианты использования

YOLOv5 настоятельно рекомендуется для проектов, где максимальная пропускная способность и минимальное использование ресурсов имеют первостепенное значение. Он превосходно работает в средах edge AI, таких как развертывание на Raspberry Pi или мобильных устройствах. Его зрелость означает, что он был тщательно проверен в тысячах коммерческих развертываний, предлагая непревзойденную стабильность для традиционных рабочих процессов detect объектов.

Преимущество устаревшего развертывания

Благодаря широкому распространению, YOLOv5 имеет невероятно стабильные пути экспорта в устаревшие фреймворки развертывания, такие как TensorRT и ONNX, что делает интеграцию в старые технологические стеки бесшовной.

Узнайте больше о YOLOv5

YOLOv8: Унифицированный фреймворк компьютерного зрения

Выпущенный в январе 2023 года, YOLOv8 представил собой монументальный архитектурный сдвиг, превратившись из специализированного детектора объектов в универсальную, многозадачную систему компьютерного зрения.

Архитектурные инновации

В отличие от своего предшественника, YOLOv8 представляет безанкерную голову обнаружения. Это устраняет необходимость вручную настраивать конфигурации якорей на основе распределений набора данных, улучшая обобщение на различных пользовательских наборах данных, таких как популярный набор данных COCO.

Архитектура также обновляет основу сети с помощью модуля C2f (Cross-Stage Partial bottleneck с двумя свертками), заменяющего более старый модуль C3. Это улучшение повышает качество представления признаков, не сильно нагружая память. Кроме того, реализация разделенной головы, разделяющей задачи обнаружения объектов, классификации и регрессии, значительно улучшает сходимость во время обучения модели.

Универсальность и Python API

YOLOv8 представил современный ultralytics python API, стандартизирующий рабочий процесс для различных задач компьютерного зрения. Независимо от того, выполняете ли вы segmentation изображений, классификация изображений, или оценка позы, унифицированный API требует лишь незначительных изменений конфигурации.

from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train on a custom dataset with built-in memory efficiency
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference and easily parse results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Узнайте больше о YOLOv8

Подробное сравнение производительности

При сравнении двух поколений мы наблюдаем классический компромисс: YOLOv8 достигает более высокой средней точности (mAP) по всем показателям, в то время как YOLOv5 сохраняет небольшое преимущество в абсолютной необработанной скорости инференса и количестве параметров для своих наименьших вариантов.

Ниже приведено подробное сравнение их метрик производительности на наборе данных COCO при размере изображения 640 пикселей.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Данные показывают, что YOLOv8 значительно повышает точность. Например, YOLOv8s достигает 44,9 mAP по сравнению с YOLOv5s при 37.4 mAP, что является значительным прорывом, существенно улучшающим производительность в плотных средах или при идентификации мелких объектов. Однако для сред с крайне ограниченными ресурсами, YOLOv5n остается невероятно эффективным, обладая наименьшим количеством параметров и FLOPs.

Требования к памяти

Обе модели высоко оптимизированы для снижения использования памяти CUDA во время обучения по сравнению с более тяжелыми архитектурами, такими как модели-трансформеры. Это позволяет специалистам использовать большие размеры пакетов на стандартных GPU, ускоряя исследовательский цикл.

Преимущество экосистемы

Выбор YOLOv5 или YOLOv8 предоставляет разработчикам доступ к хорошо поддерживаемой платформе Ultralytics. Эта интегрированная среда предлагает простые инструменты для аннотации наборов данных, настройки гиперпараметров, облачного обучения и мониторинга моделей. Активная разработка и сильная поддержка сообщества гарантируют, что разработчики могут быстро решать проблемы и интегрироваться с внешними инструментами, такими как Weights & Biases и ClearML.

В то время как другие фреймворки могут иметь крутую кривую обучения, Ultralytics отдает приоритет оптимизированному пользовательскому опыту, обеспечивая выгодный компромисс между скоростью и точностью, подходящий для различных сценариев развертывания в реальном мире.

За пределами v8: Исследование YOLO11 и YOLO26

Хотя YOLOv8 является высокопроизводительным фреймворком, область искусственного интеллекта быстро развивается. Разработчикам, заинтересованным в передовой производительности, также следует изучить YOLO11, которая развивает v8 с улучшенной точностью и скоростью.

Тем, кто ищет самые передовые достижения в области технологий компьютерного зрения, мы настоятельно рекомендуем Ultralytics YOLO26. Выпущенный в 2026 году, YOLO26 представляет собой огромный шаг вперед:

  • Сквозная архитектура без NMS: Изначально разработанная в экспериментальных архитектурах, YOLO26 изначально устраняет постобработку подавления немаксимумов, что приводит к значительно более простым и быстрым конвейерам развертывания.
  • Оптимизатор MuSGD: Вдохновленный инновациями в обучении LLM, наблюдаемыми в таких моделях, как Kimi K2, YOLO26 использует гибридный оптимизатор для более стабильного обучения и быстрой сходимости.
  • Мастерство периферийных вычислений: Благодаря до 43% более быстрому инференсу на CPU по сравнению с предыдущими поколениями, это идеальная модель для устройств без выделенных GPU.
  • Повышенная точность: Используя новые функции потерь ProgLoss + STAL, он значительно улучшает распознавание мелких объектов, что критически важно для робототехники и аэросъемки с дронов.

Будь то поддержка устаревшей системы с YOLOv5, масштабирование универсального приложения с YOLOv8 или внедрение инноваций с передовыми возможностями YOLO26, пакет Ultralytics предоставляет комплексные инструменты, необходимые для успеха в современном AI-зрении.


Комментарии