Перейти к содержанию

YOLOv5 YOLOv7: эволюция детекторов объектов в реальном времени

Выбор подходящей архитектуры для обнаружения объектов предполагает поиск баланса между точностью, скоростью вывода и простотой развертывания. В этом руководстве представлено подробное техническое сравнение между Ultralytics YOLOv5 и YOLOv7, двух влиятельных моделей в области компьютерного зрения. Мы анализируем их архитектурные различия, тесты производительности и идеальные сценарии использования, чтобы помочь вам принять обоснованное решение для ваших проектов в области компьютерного зрения.

Краткое изложение

Хотя обе модели являются эффективными, YOLOv5 остается отраслевым стандартом по удобству использования, универсальности развертывания и поддержке сообщества. Его зрелая экосистема и беспроблемная интеграция с Ultralytics делают его отличным выбором для производственных сред. YOLOv7, выпущенная позднее, представила архитектурные инновации, такие как E-ELAN, для более высокой пиковой точности на GPU , но не имеет обширной поддержки многозадачности и оптимизированных инструментов, которые есть в Ultralytics .

Разработчикам, начинающим новые проекты в 2026 году, мы настоятельно рекомендуем оценить YOLO26, который превосходит обе модели по скорости и точности благодаря своей нативной сквозной архитектуре NMS.

Ultralytics YOLOv5: производственный стандарт

YOLOv5 произвела революцию в этой области не только благодаря своим показателям, но и благодаря приоритету, отданному опыту разработчиков. Это была первая YOLO , реализованная нативно в PyTorch, что сделало ее доступной для широкого сообщества исследователей и инженеров. Ее философия «простота обучения, простота внедрения» сделала ее идеальным решением для реальных приложений, от автономных транспортных средств до промышленного контроля.

Author: Glenn Jocher
Organization:Ultralytics
Date: 2020-06-26
GitHub:ultralytics/yolov5
Docs:YOLOv5 Documentation

Узнайте больше о YOLOv5

Архитектура и Дизайн

YOLOv5 магистраль CSP-Darknet53 с фокусным слоем (позже замененным на свертку 6x6) для уменьшения вычислений при сохранении информации. Он использует шею Path Aggregation Network (PANet) для слияния характеристик и многомасштабного прогнозирования. Ключевые архитектурные особенности включают:

  • Мозаичное увеличение данных: метод обучения, который объединяет четыре изображения в одно, улучшая способность модели detect объекты и снижая потребность в больших мини-партиях.
  • Автоматическое обучение опорных точек ограничивающих прямоугольников: во время обучения модель автоматически адаптирует опорные прямоугольники к конкретной геометрии пользовательских наборов данных.
  • Активация SiLU: использование функции активации Sigmoid Linear Unit (SiLU) для более плавного распространения градиента.

Ключевые преимущества

  • Простота использования: упрощенный API и подробная документация позволяют разработчикам обучить пользовательскую модель всего за несколько строк кода.
  • Универсальность развертывания: встроенная поддержка экспорта для ONNX, TensorRT, CoreML, TFLite и OpenVINO беспроблемное развертывание на периферийных и облачных целях.
  • Многозадачность: помимо обнаружения, YOLOv5 сегментацию объектов и классификацию изображений, предлагая комплексный набор инструментов для различных задач машинного зрения.

YOLOv7: повышение GPU

YOLOv7 был разработан для расширения границ скорости и точности на GPU . Он представляет несколько стратегий «bag-of-freebies» — методов, которые повышают точность без увеличения затрат на вычисления, — что делает его сильным конкурентом в сценариях высокопроизводительных вычислений.

Авторы: Чень-Яо Ван, Алексей Бочковский, Хун-Юань Марк Ляо
Организация: Институт информационных наук, Академия Синика, Тайвань
Дата: 06.07.2022
Arxiv:2207.02696
GitHub:WongKinYiu/yolov7
Документация:YOLOv7

Узнайте больше о YOLOv7

Архитектура и инновации

YOLOv7 на эффективном проектировании архитектуры и масштабировании моделей. Его основной инновацией является расширенная сеть эффективной агрегации слоев (E-ELAN), которая позволяет модели обучаться более разнообразным особенностям путем контроля самых коротких и самых длинных путей градиента.

  • Масштабирование модели: YOLOv7 метод комбинированного масштабирования, который одновременно изменяет глубину и ширину для моделей на основе конкатенации, оптимизируя архитектуру для различных аппаратных ограничений.
  • Вспомогательная головка от грубой к тонкой: она использует вспомогательную головку для обучения, которая направляет процесс обучения, который затем перепараметризуется в основную головку для вывода, обеспечивая отсутствие снижения скорости при развертывании.
  • Плановая перепараметризация: архитектура стратегически использует перепараметризированные свертки (RepConv) для баланса скорости и точности, избегая идентичных соединений, которые разрушают остаточное обучение.

Сравнение показателей производительности

В следующей таблице сравниваются результаты YOLOv5 YOLOv7 COCO . В то время как YOLOv7 преимущества в сыром mAP GPU, YOLOv5 конкурентоспособную скорость, особенно на CPU, и значительно меньшее количество параметров для более компактных моделей.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Анализ результатов

  • Эффективность: YOLOv5n (Nano) отличается исключительной легкостью, что делает его идеальным решением для устройств с ограниченными ресурсами, где каждый мегабайт памяти на счету.
  • Точность: YOLOv7x достигает более высокой mAP (53,1%) по сравнению с YOLOv5x (50,7%), демонстрируя преимущества архитектуры E-ELAN для высокопроизводительных задач GPU .
  • Развертывание:ONNX CPU ONNX для YOLOv5 и оптимизирована, обеспечивая надежную производительность дляGPU .

Выбор для Edge

Для периферийных устройств, таких как Raspberry Pi или мобильные телефоны, YOLOv5n или YOLOv5s часто являются лучшим выбором благодаря меньшему объему занимаемой памяти и проверенной совместимости TFLite .

Обучение и экосистема

Одним из наиболее значимых отличительных факторов является экосистема, окружающая модели.YOLO Ultralytics YOLO используют преимущества постоянно поддерживаемой платформы, которая упрощает весь жизненный цикл операций машинного обучения (MLOps).

Преимущества экосистемы Ultralytics

  • Интегрированная платформа: Ultralytics позволяет пользователям управлять наборами данных, визуализировать процессы обучения и беспрепятственно развертывать модели через веб-интерфейс.
  • Эффективность обучения: YOLOv5 эффективные средства загрузки данных и интеллектуальное кэширование, что значительно сокращает время обучения на пользовательских наборах данных по сравнению с более старыми архитектурами.
  • Поддержка сообщества: благодаря тысячам участников и активным обсуждениям на GitHub и Discord, с Ultralytics можно быстрее находить решения для крайних случаев.

Пример кода: Обучение с Ultralytics

Обучение YOLO с помощью Ultralytics для всех версий. Вы можете переключаться между YOLOv5, YOLO11 и рекомендуемой YOLO26, просто изменив название модели.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model
model = YOLO("yolov5s.pt")

# Train the model on a custom dataset
# The API handles data downloading and configuration automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a new image
predictions = model("path/to/image.jpg")

Будущее: почему стоит перейти на YOLO26?

Хотя сравнение YOLOv5 YOLOv7 для понимания устаревших систем, современные технологии значительно продвинулись вперед. Выпущенная в январе 2026 года Ultralytics представляет собой сдвиг парадигмы в области обнаружения объектов.

Узнайте больше о YOLO26

  • Встроенная сквозная обработка: в отличие от YOLOv5 YOLOv7, которые требуют постобработки с помощью алгоритма подавления неактивных пиков (NMS), YOLO26 изначально NMS использует NMS. Это упрощает процессы развертывания и снижает изменчивость задержек.
  • Оптимизатор MuSGD: Используя инновации в области обучения LLM, оптимизатор MuSGD обеспечивает более стабильную конвергенцию и надежную производительность для различных наборов данных.
  • Повышенная скорость: YOLO26 обеспечивает до 43 % более быстрое CPU по сравнению с предыдущими поколениями, что делает его лучшим выбором для современных приложений искусственного интеллекта на периферии.
  • Универсальность: он изначально поддерживает ориентированную ограничивающую рамку (OBB), оценку позы и сегментацию со специализированными функциями потерь, такими как ProgLoss и STAL, для лучшего обнаружения мелких объектов.

Заключение

И YOLOv5 YOLOv7 свое место в истории компьютерного зрения. YOLOv7 — это мощный инструмент для исследователей, позволяющий максимизировать mAP определенном GPU . Однако YOLOv5 остается практичным выбором для многих благодаря своей непревзойденной простоте использования, стабильности и широкой поддержке развертывания.

Для перспективных проектов рекомендация ясна: используйте Ultralytics . Он сочетает в себе удобную экосистему YOLOv5 архитектурными прорывами, которые превосходят обе предшествующие версии по скорости, точности и простоте.

Посетите Ultralytics Hub, чтобы более подробно изучить эти архитектуры и загрузить предварительно обученные веса для вашего следующего проекта.


Комментарии