YOLOv5 YOLOv7: эволюция детекторов объектов в реальном времени
Выбор подходящей архитектуры для обнаружения объектов предполагает поиск баланса между точностью, скоростью вывода и простотой развертывания. В этом руководстве представлено подробное техническое сравнение между Ultralytics YOLOv5 и YOLOv7, двух влиятельных моделей в области компьютерного зрения. Мы анализируем их архитектурные различия, тесты производительности и идеальные сценарии использования, чтобы помочь вам принять обоснованное решение для ваших проектов в области компьютерного зрения.
Краткое изложение
Хотя обе модели являются эффективными, YOLOv5 остается отраслевым стандартом по удобству использования, универсальности развертывания и поддержке сообщества. Его зрелая экосистема и беспроблемная интеграция с Ultralytics делают его отличным выбором для производственных сред. YOLOv7, выпущенная позднее, представила архитектурные инновации, такие как E-ELAN, для более высокой пиковой точности на GPU , но не имеет обширной поддержки многозадачности и оптимизированных инструментов, которые есть в Ultralytics .
Разработчикам, начинающим новые проекты в 2026 году, мы настоятельно рекомендуем оценить YOLO26, который превосходит обе модели по скорости и точности благодаря своей нативной сквозной архитектуре NMS.
Ultralytics YOLOv5: производственный стандарт
YOLOv5 произвела революцию в этой области не только благодаря своим показателям, но и благодаря приоритету, отданному опыту разработчиков. Это была первая YOLO , реализованная нативно в PyTorch, что сделало ее доступной для широкого сообщества исследователей и инженеров. Ее философия «простота обучения, простота внедрения» сделала ее идеальным решением для реальных приложений, от автономных транспортных средств до промышленного контроля.
Author: Glenn Jocher
Organization:Ultralytics
Date: 2020-06-26
GitHub:ultralytics/yolov5
Docs:YOLOv5 Documentation
Архитектура и Дизайн
YOLOv5 магистраль CSP-Darknet53 с фокусным слоем (позже замененным на свертку 6x6) для уменьшения вычислений при сохранении информации. Он использует шею Path Aggregation Network (PANet) для слияния характеристик и многомасштабного прогнозирования. Ключевые архитектурные особенности включают:
- Мозаичное увеличение данных: метод обучения, который объединяет четыре изображения в одно, улучшая способность модели detect объекты и снижая потребность в больших мини-партиях.
- Автоматическое обучение опорных точек ограничивающих прямоугольников: во время обучения модель автоматически адаптирует опорные прямоугольники к конкретной геометрии пользовательских наборов данных.
- Активация SiLU: использование функции активации Sigmoid Linear Unit (SiLU) для более плавного распространения градиента.
Ключевые преимущества
- Простота использования: упрощенный API и подробная документация позволяют разработчикам обучить пользовательскую модель всего за несколько строк кода.
- Универсальность развертывания: встроенная поддержка экспорта для ONNX, TensorRT, CoreML, TFLite и OpenVINO беспроблемное развертывание на периферийных и облачных целях.
- Многозадачность: помимо обнаружения, YOLOv5 сегментацию объектов и классификацию изображений, предлагая комплексный набор инструментов для различных задач машинного зрения.
YOLOv7: повышение GPU
YOLOv7 был разработан для расширения границ скорости и точности на GPU . Он представляет несколько стратегий «bag-of-freebies» — методов, которые повышают точность без увеличения затрат на вычисления, — что делает его сильным конкурентом в сценариях высокопроизводительных вычислений.
Авторы: Чень-Яо Ван, Алексей Бочковский, Хун-Юань Марк Ляо
Организация: Институт информационных наук, Академия Синика, Тайвань
Дата: 06.07.2022
Arxiv:2207.02696
GitHub:WongKinYiu/yolov7
Документация:YOLOv7
Архитектура и инновации
YOLOv7 на эффективном проектировании архитектуры и масштабировании моделей. Его основной инновацией является расширенная сеть эффективной агрегации слоев (E-ELAN), которая позволяет модели обучаться более разнообразным особенностям путем контроля самых коротких и самых длинных путей градиента.
- Масштабирование модели: YOLOv7 метод комбинированного масштабирования, который одновременно изменяет глубину и ширину для моделей на основе конкатенации, оптимизируя архитектуру для различных аппаратных ограничений.
- Вспомогательная головка от грубой к тонкой: она использует вспомогательную головку для обучения, которая направляет процесс обучения, который затем перепараметризуется в основную головку для вывода, обеспечивая отсутствие снижения скорости при развертывании.
- Плановая перепараметризация: архитектура стратегически использует перепараметризированные свертки (RepConv) для баланса скорости и точности, избегая идентичных соединений, которые разрушают остаточное обучение.
Сравнение показателей производительности
В следующей таблице сравниваются результаты YOLOv5 YOLOv7 COCO . В то время как YOLOv7 преимущества в сыром mAP GPU, YOLOv5 конкурентоспособную скорость, особенно на CPU, и значительно меньшее количество параметров для более компактных моделей.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Анализ результатов
- Эффективность: YOLOv5n (Nano) отличается исключительной легкостью, что делает его идеальным решением для устройств с ограниченными ресурсами, где каждый мегабайт памяти на счету.
- Точность: YOLOv7x достигает более высокой mAP (53,1%) по сравнению с YOLOv5x (50,7%), демонстрируя преимущества архитектуры E-ELAN для высокопроизводительных задач GPU .
- Развертывание:ONNX CPU ONNX для YOLOv5 и оптимизирована, обеспечивая надежную производительность дляGPU .
Выбор для Edge
Для периферийных устройств, таких как Raspberry Pi или мобильные телефоны, YOLOv5n или YOLOv5s часто являются лучшим выбором благодаря меньшему объему занимаемой памяти и проверенной совместимости TFLite .
Обучение и экосистема
Одним из наиболее значимых отличительных факторов является экосистема, окружающая модели.YOLO Ultralytics YOLO используют преимущества постоянно поддерживаемой платформы, которая упрощает весь жизненный цикл операций машинного обучения (MLOps).
Преимущества экосистемы Ultralytics
- Интегрированная платформа: Ultralytics позволяет пользователям управлять наборами данных, визуализировать процессы обучения и беспрепятственно развертывать модели через веб-интерфейс.
- Эффективность обучения: YOLOv5 эффективные средства загрузки данных и интеллектуальное кэширование, что значительно сокращает время обучения на пользовательских наборах данных по сравнению с более старыми архитектурами.
- Поддержка сообщества: благодаря тысячам участников и активным обсуждениям на GitHub и Discord, с Ultralytics можно быстрее находить решения для крайних случаев.
Пример кода: Обучение с Ultralytics
Обучение YOLO с помощью Ultralytics для всех версий. Вы можете переключаться между YOLOv5, YOLO11 и рекомендуемой YOLO26, просто изменив название модели.
from ultralytics import YOLO
# Load a pre-trained YOLOv5 model
model = YOLO("yolov5s.pt")
# Train the model on a custom dataset
# The API handles data downloading and configuration automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a new image
predictions = model("path/to/image.jpg")
Будущее: почему стоит перейти на YOLO26?
Хотя сравнение YOLOv5 YOLOv7 для понимания устаревших систем, современные технологии значительно продвинулись вперед. Выпущенная в январе 2026 года Ultralytics представляет собой сдвиг парадигмы в области обнаружения объектов.
- Встроенная сквозная обработка: в отличие от YOLOv5 YOLOv7, которые требуют постобработки с помощью алгоритма подавления неактивных пиков (NMS), YOLO26 изначально NMS использует NMS. Это упрощает процессы развертывания и снижает изменчивость задержек.
- Оптимизатор MuSGD: Используя инновации в области обучения LLM, оптимизатор MuSGD обеспечивает более стабильную конвергенцию и надежную производительность для различных наборов данных.
- Повышенная скорость: YOLO26 обеспечивает до 43 % более быстрое CPU по сравнению с предыдущими поколениями, что делает его лучшим выбором для современных приложений искусственного интеллекта на периферии.
- Универсальность: он изначально поддерживает ориентированную ограничивающую рамку (OBB), оценку позы и сегментацию со специализированными функциями потерь, такими как ProgLoss и STAL, для лучшего обнаружения мелких объектов.
Заключение
И YOLOv5 YOLOv7 свое место в истории компьютерного зрения. YOLOv7 — это мощный инструмент для исследователей, позволяющий максимизировать mAP определенном GPU . Однако YOLOv5 остается практичным выбором для многих благодаря своей непревзойденной простоте использования, стабильности и широкой поддержке развертывания.
Для перспективных проектов рекомендация ясна: используйте Ultralytics . Он сочетает в себе удобную экосистему YOLOv5 архитектурными прорывами, которые превосходят обе предшествующие версии по скорости, точности и простоте.
Посетите Ultralytics Hub, чтобы более подробно изучить эти архитектуры и загрузить предварительно обученные веса для вашего следующего проекта.