Перейти к содержанию

Эволюция обнаружения объектов: YOLOv5 vs. YOLOv7

Ландшафт компьютерного зрения быстро развивался в последние несколько лет, движимый потребностью в более быстром и точном обнаружении объектов в реальном времени. При выборе правильной архитектуры для вашего проекта компьютерного зрения крайне важно понимать нюансы между популярными моделями, такими как Ultralytics YOLOv5 и YOLOv7. Это всестороннее техническое сравнение углубляется в их архитектуры, методологии обучения, метрики производительности и идеальные сценарии развертывания, чтобы помочь вам принять обоснованное решение.

Краткий обзор: Истоки моделей

Понимание истоков и философии проектирования, лежащих в основе этих моделей, обеспечивает контекст для их архитектурных решений.

Подробности о YOLOv5:

Узнайте больше о YOLOv5

Детали YOLOv7:

Узнайте больше о YOLOv7

Изучить другие архитектуры

Интересно, как эти модели соотносятся с другими? Ознакомьтесь с нашими сравнениями, такими как YOLOv5 vs YOLO11 или YOLOv7 vs EfficientDet, чтобы расширить свое понимание экосистемы обнаружения объектов.

Архитектурные инновации и различия

YOLOv5: Стандарт доступности.

Представленный Ultralytics в 2020 году, YOLOv5 произвел сдвиг парадигмы, нативно используя фреймворк PyTorch, что значительно снизило порог входа для исследователей и разработчиков. Его архитектура основана на модифицированном базовом блоке CSPDarknet53, интегрирующем сети Cross Stage Partial (CSP) для уменьшения количества параметров при сохранении потока градиентов.

Одним из его величайших преимуществ являются требования к памяти. По сравнению со старыми двухэтапными детекторами или тяжелыми трансформерными моделями, такими как RT-DETR, YOLOv5 требует значительно меньше памяти CUDA во время обучения, что позволяет использовать большие размеры пакетов на стандартных потребительских GPU. Кроме того, его изначально интегрированная универсальность беспрепятственно поддерживает классификацию изображений, обнаружение объектов и сегментацию изображений.

YOLOv7: Расширяя границы точности в реальном времени

Выпущенный в середине 2022 года, YOLOv7 был сфокусирован на расширении передовых границ для обнаружения объектов в реальном времени на бенчмарках MS COCO. Авторы представили расширенную эффективную сеть агрегации слоев (E-ELAN), которая улучшает способность сети к обучению, не нарушая исходный градиентный путь.

YOLOv7 также известен своим "обучаемым набором бесплатных приёмов", в частности, методами репараметризации во время обучения, которые преобразуют несколько модулей в один сверточный слой для инференса, повышая скорость без ущерба для точности. Однако эта сложная методология обучения часто приводит к более крутым кривым обучения и менее прямолинейным конвейерам экспорта по сравнению с нативной экосистемой Ultralytics.

Сравнение производительности

При оценке этих моделей баланс производительности между скоростью, точностью и вычислительными затратами имеет первостепенное значение. Ниже приведено подробное сравнение их метрик производительности на основе набора данных MS COCO val2017.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Хотя YOLOv7 достигает более высоких абсолютных показателей mAP на более крупных вариантах, YOLOv5 предлагает беспрецедентный спектр моделей — от сверхлегкого Nano (YOLOv5n) для экстремальных периферийных устройств до сверхбольшого (YOLOv5x) для облачного вывода.

Преимущество экосистемы Ultralytics

Полезность модели выходит за рамки ее чистой архитектуры; экосистема, окружающая ее, определяет, насколько быстро она может быть развернута в производство. Именно здесь модели Ultralytics проявляют себя.

  • Простота использования: Платформа Ultralytics и ее унифицированный Python API обеспечивают оптимизированный пользовательский опыт, простой синтаксис и обширную документацию. Обучение на пользовательском наборе данных не требует шаблонного кода.
  • Хорошо поддерживаемая экосистема: Ultralytics выигрывает от активной разработки, частых обновлений и мощной поддержки сообщества. Интеграции с такими инструментами, как Comet ML и Weights & Biases, встроены по умолчанию.
  • Эффективность обучения: Загрузчики данных, интеллектуальное кэширование и поддержка нескольких GPU делают модели Ultralytics исключительно эффективными для обучения. Легкодоступные предварительно обученные веса значительно ускоряют перенос обучения.

Пример кода: Начало работы

Использование Ultralytics позволяет развернуть модель всего за несколько строк кода. Следующий фрагмент кода на Python демонстрирует, насколько просто загружать, обучать и выполнять инференс с использованием рекомендованного ultralytics пакет.

from ultralytics import YOLO

# Load a pretrained YOLOv5s model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 example dataset
# Ultralytics automatically handles data downloading and augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the predictions
predictions[0].show()

В отличие от этого, использование оригинального репозитория YOLOv7 обычно предполагает клонирование сложных репозиториев, ручное управление зависимостями и применение длинных аргументов командной строки.

Реальные приложения и идеальные сценарии использования

Когда выбирать YOLOv7

YOLOv7 остается сильным кандидатом для академического бенчмаркинга или специфических устаревших конвейеров GPU, где максимальный mAP является единственной целью и система уже адаптирована к его выходным tensor на основе якорей. Исследователи, изучающие анализ пути градиента, часто используют YOLOv7 в качестве базовой модели.

Когда выбирать YOLOv5

YOLOv5 широко используется в производственных средах благодаря своей исключительной стабильности. Это предпочтительный выбор для:

  • Мобильные и граничные вычисления: Развертывание YOLOv5n на iOS через CoreML или на Android через TFLite.
  • Гибкие стартапы: Команды, нуждающиеся в быстрых циклах итераций, получают выгоду от бесшовной интеграции с платформой Ultralytics для управления наборами данных и облачного обучения.
  • Многозадачные среды: Системы, требующие одновременного обнаружения, классификации и сегментации объектов.

Будущее: Переход к YOLO26

Хотя сравнение YOLOv5 и YOLOv7 является отличным способом понять эволюцию ИИ в области зрения, современные технологии продолжают развиваться. Выпущенная в январе 2026 года, Ultralytics YOLO26 представляет собой монументальный прорыв, делая старые архитектуры в значительной степени устаревшими для новых проектов.

Для разработчиков, стремящихся к вершине производительности, YOLO26 предлагает несколько новаторских преимуществ по сравнению с YOLOv5 и YOLOv7:

  • Сквозная архитектура без NMS: За счет исключения постобработки подавления немаксимумов YOLO26 предлагает значительно более простое развертывание и более быструю, стабильную задержку.
  • Оптимизатор MuSGD: Вдохновленный инновациями LLM от Moonshot AI, этот гибридный оптимизатор обеспечивает высокостабильное обучение и быструю сходимость.
  • Беспрецедентная скорость на периферии: Специально оптимизированный для граничных сред, нано-вариант обеспечивает до 43% более быстрого инференса на CPU за счет удаления Distribution Focal Loss (DFL).
  • Превосходная точность: Новые функции потерь, такие как ProgLoss + STAL, значительно улучшают распознавание мелких объектов, что делает его идеальным для видео с дронов и робототехники.

Независимо от того, поддерживаете ли вы существующий конвейер YOLOv5 или планируете внедрить передовой YOLO26, платформа Ultralytics предоставляет все необходимые инструменты для успеха в современном компьютерном зрении.


Комментарии