Эволюция детектирования объектов: YOLOv5 против YOLOv7
Ландшафт компьютерного зрения стремительно меняется последние несколько лет, что обусловлено потребностью в более быстром и точном детектировании объектов в реальном времени. При выборе подходящей архитектуры для твоего проекта по компьютерному зрению важно понимать нюансы между популярными моделями, такими как Ultralytics YOLOv5 и YOLOv7. Это подробное техническое сравнение рассматривает их архитектуры, методологии обучения, метрики производительности и оптимальные сценарии развертывания, чтобы помочь тебе принять обоснованное решение.
Краткий обзор: происхождение моделей
Понимание происхождения и философии проектирования этих моделей дает контекст для их архитектурных решений.
Детали YOLOv5:
- Авторы: Glenn Jocher
- Организация: Ultralytics
- Дата: 26.06.2020
- GitHub: Репозиторий YOLOv5
- Документация: Документация YOLOv5
Подробности YOLOv7:
- Авторы: Chien-Yao Wang, Alexey Bochkovskiy и Hong-Yuan Mark Liao
- Организация: Institute of Information Science, Academia Sinica, Taiwan
- Дата: 2022-07-06
- Arxiv: Статья о YOLOv7
- GitHub: Репозиторий YOLOv7
- Документация: Документация YOLOv7
Интересно, как эти модели соотносятся с другими? Ознакомься с нашими сравнениями, такими как YOLOv5 против YOLO11 или YOLOv7 против EfficientDet, чтобы расширить свое понимание экосистемы детектирования объектов.
Архитектурные инновации и различия
YOLOv5: стандарт доступности
Представленная Ultralytics в 2020 году, YOLOv5 совершила парадигмальный сдвиг, начав использовать фреймворк PyTorch нативно, что значительно снизило порог входа для исследователей и разработчиков. Ее архитектура опирается на бэкбон Modified CSPDarknet53, объединяющий сети Cross Stage Partial (CSP) для уменьшения количества параметров при сохранении потока градиентов.
Одной из ее сильнейших сторон являются требования к памяти. По сравнению со старыми двухстадийными детекторами или тяжелыми Transformer-моделями, такими как RT-DETR, YOLOv5 требует значительно меньше памяти CUDA во время обучения, что позволяет использовать большие размеры батчей на стандартных потребительских GPU. Более того, ее нативно интегрированная универсальность бесшовно поддерживает классификацию изображений, детектирование объектов и сегментацию изображений.
YOLOv7: расширение границ точности в реальном времени
Выпущенная в середине 2022 года, YOLOv7 сосредоточилась на раздвижении границ современных технологий для детектирования в реальном времени на бенчмарках MS COCO. Авторы представили Extended Efficient Layer Aggregation Network (E-ELAN), которая улучшает обучаемость сети, не нарушая исходный путь прохождения градиента.
YOLOv7 также известна своим «обучаемым набором бесплатных инструментов» (trainable bag-of-freebies), в частности методами перепараметризации во время обучения, которые преобразуют несколько модулей в один сверточный слой для инференса, повышая скорость без ущерба для точности. Однако эта сложная методология обучения часто приводит к более крутым кривым обучения и менее прямолинейным конвейерам экспорта по сравнению с нативной экосистемой Ultralytics.
Сравнение производительности
При оценке этих моделей первостепенное значение имеет баланс производительности между скоростью, точностью и вычислительными затратами. Ниже приведено детальное сравнение их метрик производительности, основанное на наборе данных MS COCO val2017.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
В то время как YOLOv7 достигает более высоких абсолютных показателей mAP на крупных вариантах, YOLOv5 предлагает непревзойденный спектр моделей — от ультралегкой Nano (YOLOv5n) для экстремальных граничных устройств до Extra-Large (YOLOv5x) для облачного инференса.
Преимущество экосистемы Ultralytics
Полезность модели выходит за рамки ее архитектуры; экосистема вокруг нее определяет, насколько быстро она может быть внедрена в продакшн. Именно здесь модели Ultralytics проявляют себя лучше всего.
- Простота использования: Ultralytics Platform и ее унифицированный Python API обеспечивают оптимизированный пользовательский опыт, простой синтаксис и обширную документацию. Обучение на собственном наборе данных требует минимум кода.
- Хорошо поддерживаемая экосистема: Ultralytics выигрывает от активной разработки, частых обновлений и сильной поддержки сообщества. Интеграции с такими инструментами, как Comet ML и Weights & Biases, уже встроены.
- Эффективность обучения: Загрузчики данных, умное кэширование и поддержка нескольких GPU делают обучение моделей Ultralytics исключительно эффективным. Легкодоступные предобученные веса значительно ускоряют трансферное обучение.
Пример кода: Начало работы
Используя Ultralytics, для развертывания модели требуется всего несколько строк кода. Следующий фрагмент на Python демонстрирует, как просто загружать, обучать и запускать инференс, используя рекомендуемый пакет ultralytics.
from ultralytics import YOLO
# Load a pretrained YOLOv5s model
model = YOLO("yolov5s.pt")
# Train the model on the COCO8 example dataset
# Ultralytics automatically handles data downloading and augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the predictions
predictions[0].show()Напротив, использование оригинального репозитория YOLOv7 обычно предполагает клонирование сложных репозиториев, ручное управление зависимостями и использование длинных аргументов командной строки.
Реальные приложения и идеальные сценарии использования
Когда стоит выбрать YOLOv7
YOLOv7 остается сильным кандидатом для академического бенчмаркинга или специфических устаревших GPU-конвейеров, где единственной целью является максимальный mAP, а система уже адаптирована под ее anchor-based выходные тензоры. Исследователи, занимающиеся анализом путей прохождения градиентов, часто используют YOLOv7 в качестве базовой модели.
Когда выбирать YOLOv5
YOLOv5 пользуется большой популярностью в производственных средах благодаря своей исключительной стабильности. Это предпочтительный выбор для:
- Мобильные и граничные вычисления: Развертывание YOLOv5n на iOS через CoreML или Android через TFLite.
- Agile-стартапы: Командам, нуждающимся в быстрых циклах итерации, помогает бесшовная интеграция с Ultralytics Platform для управления данными и облачного обучения.
- Многозадачные среды: Системы, требующие одновременного детектирования объектов, классификации и сегментации.
Будущее: переход на YOLO26
Хотя сравнение YOLOv5 и YOLOv7 — отличный способ понять эволюцию ИИ в компьютерном зрении, современные технологии продолжают развиваться. Выпущенная в январе 2026 года, Ultralytics YOLO26 представляет собой монументальный скачок вперед, делая старые архитектуры практически устаревшими для новых проектов.
Для разработчиков, стремящихся к пику производительности, YOLO26 предлагает несколько революционных преимуществ перед YOLOv5 и YOLOv7:
- Сквозной дизайн без NMS: Исключив постобработку Non-Maximum Suppression, YOLO26 предлагает значительно более простое развертывание и быструю, стабильную задержку.
- Оптимизатор MuSGD: Вдохновленный инновациями в LLM от Moonshot AI, этот гибридный оптимизатор обеспечивает высокостабильное обучение и быструю сходимость.
- Беспрецедентная скорость на граничных устройствах: Специально оптимизированный для граничных сред, вариант nano обеспечивает до 43% более быстрый инференс на CPU за счет удаления Distribution Focal Loss (DFL).
- Превосходная точность: Новые функции потерь, такие как ProgLoss + STAL, значительно улучшают распознавание мелких объектов, что делает эту модель идеальной для съемок с дронов и робототехники.
Независимо от того, поддерживаешь ли ты существующий конвейер YOLOv5 или хочешь внедрить передовую YOLO26, Ultralytics Platform предоставляет все необходимые инструменты для успеха в современном компьютерном зрении.