Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 против YOLOv8#

При создании масштабируемых и эффективных приложений компьютерного зрения выбор правильной архитектуры имеет решающее значение. Эволюция экосистемы Ultralytics постоянно раздвигает границы скорости и точности, предоставляя разработчикам надежные инструменты для внедрения в реальных условиях. Это техническое сравнение углубляется в различия между YOLOv5 и YOLOv8, исследуя их архитектуры, компромиссы в производительности и идеальные варианты использования, чтобы помочь тебе принять обоснованное решение для твоего следующего AI-проекта.

Обе эти модели представляют собой важные вехи в истории обнаружения объектов в реальном времени, и обе выигрывают от высокооптимизированных требований к памяти и простоты использования, которые характеризуют экосистему Ultralytics.

Link to this sectionYOLOv5: Надежный отраслевой стандарт#

Представленный в 2020 году, YOLOv5 быстро стал отраслевым стандартом для быстрого, доступного и надежного обнаружения объектов. Используя собственную реализацию PyTorch, он оптимизировал жизненный цикл обучения и развертывания для инженеров по всему миру.

Link to this sectionАрхитектурные преимущества#

YOLOv5 работает на основе парадигмы обнаружения с использованием анкоров, которая полагается на предопределенные anchor boxes для предсказания границ объектов. Его архитектура включает магистраль (backbone) на основе сети Cross-Stage Partial (CSP), оптимизирующую градиентный поток и уменьшающую вычислительную избыточность. Это приводит к невероятно малому потреблению памяти, что делает его исключительно быстрым для обучения даже на стандартных потребительских GPU.

Link to this sectionИдеальные варианты использования#

YOLOv5 настоятельно рекомендуется для проектов, где максимальная пропускная способность и минимальное использование ресурсов имеют первостепенное значение. Он превосходно работает в средах edge AI, таких как развертывание на Raspberry Pi или мобильных устройствах. Его зрелость означает, что он был тщательно проверен в тысячах коммерческих внедрений, предлагая непревзойденную стабильность для традиционных рабочих процессов обнаружения объектов.

Преимущество развертывания устаревших систем

Благодаря широкому распространению, YOLOv5 имеет невероятно стабильные пути экспорта в устаревшие среды развертывания, такие как TensorRT и ONNX, что делает интеграцию в старые технологические стеки бесшовной.

Узнай больше о YOLOv5

Link to this sectionYOLOv8: Унифицированная архитектура компьютерного зрения#

Выпущенный в январе 2023 года, YOLOv8 ознаменовал собой монументальный архитектурный сдвиг, превратившись из специализированного детектора объектов в универсальную многозадачную платформу компьютерного зрения.

Link to this sectionАрхитектурные инновации#

В отличие от своего предшественника, YOLOv8 представляет собой anchor-free (безанкорную) голову обнаружения. Это устраняет необходимость вручную настраивать конфигурации анкоров на основе распределений набора данных, улучшая обобщающую способность на различных пользовательских наборах данных, таких как популярный набор данных COCO.

Архитектура также модернизирует магистраль с помощью модуля C2f (Cross-Stage Partial bottleneck с двумя свертками), заменяющего старый модуль C3. Это улучшение повышает качество представления признаков без существенной нагрузки на память. Кроме того, реализация разделенной головы (decoupled head) — разделяющей задачи определения наличия объекта, классификации и регрессии — значительно улучшает сходимость во время обучения модели.

Link to this sectionУниверсальность и Python API#

YOLOv8 представил современный Python API ultralytics, стандартизировав рабочий процесс для различных задач компьютерного зрения. Выполняешь ли ты сегментацию изображений, классификацию изображений или оценку позы, унифицированный API требует лишь незначительных изменений конфигурации.

from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train on a custom dataset with built-in memory efficiency
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference and easily parse results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Узнай больше о YOLOv8

Link to this sectionДетальное сравнение производительности#

Сравнивая эти два поколения, мы наблюдаем классический компромисс: YOLOv8 достигает более высокого среднего значения точности (mAP) по всем направлениям, в то время как YOLOv5 сохраняет небольшое преимущество в абсолютной скорости инференса и количестве параметров для своих самых маленьких вариантов.

Ниже приведено подробное сравнение их показателей производительности на наборе данных COCO при размере изображения 640 пикселей.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Данные показывают, что YOLOv8 обеспечивает существенный прирост точности. Например, YOLOv8s достигает 44.9 mAP по сравнению с 37.4 mAP у YOLOv5s, что является огромным скачком, значительно повышающим производительность в плотных средах или при идентификации мелких объектов. Однако для крайне ограниченных сред YOLOv5n остается невероятно эффективным, обладая наименьшим количеством параметров и FLOPs.

Требования к памяти

Обе модели сильно оптимизированы для меньшего использования памяти CUDA во время обучения по сравнению с более тяжелыми архитектурами, такими как трансформеры. Это позволяет практикам использовать большие размеры батчей на стандартных GPU, ускоряя цикл исследований.

Link to this sectionПреимущество экосистемы#

Выбор YOLOv5 или YOLOv8 дает разработчикам доступ к хорошо поддерживаемой платформе Ultralytics Platform. Эта интегрированная среда предлагает простые инструменты для аннотирования наборов данных, настройки гиперпараметров, облачного обучения и мониторинга моделей. Активная разработка и сильная поддержка сообщества гарантируют, что ты сможешь быстро решать проблемы и интегрироваться с внешними инструментами, такими как Weights & Biases и ClearML.

В то время как другие фреймворки могут страдать от крутой кривой обучения, Ultralytics отдает приоритет упрощенному пользовательскому опыту, обеспечивая благоприятный компромисс между скоростью и точностью, подходящий для различных сценариев реального внедрения.

Link to this sectionЗа пределами v8: Изучаем YOLO11 и YOLO26#

Хотя YOLOv8 является очень мощным фреймворком, область искусственного интеллекта развивается быстро. Разработчикам, заинтересованным в производительности современного уровня, следует также изучить YOLO11, который базируется на v8 с улучшенной точностью и скоростью.

Тем, кто ищет абсолютный передовой край технологий компьютерного зрения, мы настоятельно рекомендуем Ultralytics YOLO26. Выпущенный в 2026 году, YOLO26 представляет собой огромный шаг вперед:

  • Дизайн End-to-End без NMS: Впервые примененный в экспериментальных архитектурах, YOLO26 нативно исключает постобработку Non-Maximum Suppression, что приводит к значительно более простым и быстрым конвейерам развертывания.
  • Оптимизатор MuSGD: Вдохновленный инновациями в обучении LLM, наблюдаемыми в таких моделях, как Kimi K2, YOLO26 использует гибридный оптимизатор для более стабильного обучения и быстрой сходимости.
  • Мастерство в граничных вычислениях (Edge Computing): Благодаря увеличению скорости инференса на CPU до 43% по сравнению с предыдущими поколениями, это идеальная модель для устройств, не имеющих выделенных GPU.
  • Улучшенная точность: Используя новые функции потерь ProgLoss + STAL, она радикально улучшает распознавание мелких объектов, что критически важно для робототехники и аэрофотосъемки с дронов.

Будь то поддержка устаревшей системы на YOLOv5, масштабирование универсального приложения на YOLOv8 или инновации с передовыми возможностями YOLO26, пакет Ultralytics предоставляет всеобъемлющие инструменты, необходимые для успеха в современном AI для компьютерного зрения.

Участники

Комментарии