Перейти к содержанию

YOLOv6.0 против YOLOv7: глубокое погружение в промышленную скорость и точность

Выбор оптимальной модели обнаружения объектов - критически важное решение, которое зависит от баланса между скоростью вывода, точностью и вычислительной эффективностью. В данном техническом сравнении рассматриваются различия между YOLOv6.0, ориентированной на промышленное использование, и YOLOv7моделью, разработанной для расширения границ точности с использованием обучаемого "мешка бесплатных вещей". Проанализировав их архитектуры, эталоны и идеальные сценарии использования, разработчики смогут определить, какое решение лучше всего соответствует их конкретным ограничениям на развертывание.

YOLOv6.0: Разработано для промышленной эффективности

YOLOv6.0 представляет собой значительную эволюцию в серии YOLO , специально разработанную для промышленных приложений, где скорость работы в реальном времени и эффективность оборудования не являются обязательными условиями. Разработанная компанией Meituan, эта версия сфокусирована на оптимизации компромисса между задержкой и точностью, что делает ее отличным выбором для пограничных вычислений и сред с высокой пропускной способностью.

Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, and Xiangxiang Chu
Organization:Meituan
Date: 2023-01-13
Arxiv:https://arxiv.org/abs/2301.05586
GitHubYOLOv6
Docsultralytics

Архитектура и ключевые особенности

Архитектура YOLOv6.0 построена на концепции аппаратно-ориентированного дизайна. В ней используется перепараметризуемая основа (EfficientRep), которая позволяет модели использовать сложные структуры во время обучения для лучшего изучения признаков и сворачиваться в более простые и быстрые структуры во время вывода. Эта техника значительно снижает затраты на доступ к памяти и улучшает задержку вычислений.

Ключевые архитектурные инновации включают:

  • Двунаправленная конкатенация (BiC): Этот модуль повышает точность локализации за счет улучшения распространения признаков.
  • Обучение с помощью якоря (AAT): Стратегия, объединяющая преимущества детекторов с якорем и без якоря для стабилизации тренировок и повышения эффективности.
  • Самодистилляция: В YOLOv6.0 используются методы самораспространения, когда модель ученика учится на собственных предсказаниях модели учителя, повышая точность без необходимости использования внешних больших моделей.

Сильные и слабые стороны

Основное достоинство YOLOv6.0 заключается в скорости вычислений. Как показывают бенчмарки, младшие варианты (например, YOLOv6.0n) исключительно быстро работают на GPU , что делает их идеальными для конвейеров видеоаналитики, которые должны обрабатывать высокую частоту кадров. Кроме того, поддержка квантования модели облегчает развертывание на оборудовании с ограниченными ресурсами.

Однако ранние версии YOLOv6 в основном ограничивались обнаружением объектов, не обладая универсальностью, присущей более комплексным фреймворкам, которые поддерживают сегментацию или оценку позы из коробки. Кроме того, несмотря на высокую эффективность, поддержка экосистемы не столь обширна, как в других проектах, управляемых сообществом.

Идеальные варианты использования

YOLOv6.0 отлично справляется с такими сценариями, как:

  • Производственные линии: Там, где требуется высокоскоростное обнаружение дефектов на конвейерных лентах.
  • Аналитика розничной торговли: Для управления очередями и отслеживания запасов, когда вычислительные ресурсы ограничены.
  • Встраиваемые системы: развертывание на таких устройствах, как серия NVIDIA Jetson.

Узнайте больше о YOLOv6

YOLOv7: Оптимизация обучаемого мешка с бесплатными вещами

YOLOv7 использует другой подход, уделяя большое внимание архитектурным реформам, чтобы максимизировать точность без увеличения стоимости вывода. Авторы представили "обучаемый мешок бесплатных вещей" - методы оптимизации, которые улучшают производительность модели во время обучения, но не изменяют архитектуру и скорость вывода.

Авторы: Chien-Yao Wang, Alexey Bochkovskiy, and Hong-Yuan Mark Liao
Organization:Institute of Information Science, Academia Sinica, Taiwan
Date: 2022-07-06
Arxiv:https://arxiv.org/abs/2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
Docsultralytics

Архитектура и ключевые особенности

В YOLOv7 появилась сеть E-ELAN (Extended Efficient Layer Aggregation Network). Эта архитектура позволяет модели изучать более разнообразные характеристики, контролируя кратчайшие и длинные градиентные пути, обеспечивая эффективную сходимость сети.

К числу выдающихся особенностей относятся:

  • Масштабирование модели: В отличие от предыдущих методов, которые масштабировали только глубину или ширину, YOLOv7 предлагает комбинированный метод масштабирования, который объединяет слои, а не просто изменяет их размер, сохраняя оптимизационные свойства модели.
  • Обучение с помощью вспомогательной головы: В процессе обучения модель использует вспомогательную голову для помощи ведущей голове. Эта техника глубокого контроля улучшает обучение промежуточных слоев, но удаляется во время вывода для сохранения скорости.
  • Запланированная перепараметризованная свертка: Специализированное применение повторной параметризации, которое позволяет избежать соединений идентичности в определенных слоях для предотвращения снижения производительности.

Сильные и слабые стороны

YOLOv7 славится своей высокой точностью, достигая впечатляющих показателей средней точности (mAP) на наборе данных COCO . Он эффективно преодолевает разрыв между ограничениями реального времени и необходимостью высокоточного обнаружения.

С другой стороны, сложность архитектуры и использование вспомогательных головок может сделать процесс обучения более трудоемким по сравнению с более простыми архитектурами. Несмотря на эффективность в процессе вывода, этап обучения требует значительного объема памяти GPU , особенно для больших вариантов "E6E".

Идеальные варианты использования

YOLOv7 особенно хорошо подходит для:

  • Детальное наблюдение: Идентификация мелких объектов или едва заметных действий на сложных записях камер наблюдения.
  • Автономное вождение: Точность - важнейшее условие безопасности и навигации.
  • Научные исследования: Приложения, требующие высоких показателей AP , такие как медицинская визуализация или биологические исследования.

Узнайте больше о YOLOv7

Сравнение производительности: Метрики и анализ

В следующей таблице представлены результаты работы вариантов YOLOv6.0 и YOLOv7 на наборе данных для проверки COCO . В ней показаны компромиссы между размером модели, вычислительной нагрузкой (FLOPs) и скоростью.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0m64050.0-5.2834.985.8
YOLOv6.0l64052.8-8.9559.6150.7
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Интерпретация контрольных показателей

Хотя YOLOv7x достигает наивысшей точности(53,1% mAP), он требует значительно больше параметров (71,3M) и FLOPs (189,9B). В отличие от этого, YOLOv6.0n оптимизирован для экстремальной скорости, достигая 1,17 мс на GPU T4, что примерно в 10 раз быстрее, чем самый большой вариант YOLOv7 , хотя и с меньшей точностью.

Данные показывают четкое различие: YOLOv6.0 доминирует в средах с низкой задержкой, в то время как YOLOv7 превосходит его, когда приоритетом является максимальное качество обнаружения, а аппаратных ресурсов больше.

Преимущество Ultralytics : За пределами сырых показателей

Хотя YOLOv6 и YOLOv7 предлагают широкие возможности, сфера компьютерного зрения быстро развивается. Для разработчиков и исследователей, ищущих перспективное, универсальное и удобное решение, Ultralytics YOLO11 и YOLOv8 обладают неоспоримыми преимуществами, выходящими за пределы базовых показателей.

Простота использования и экосистема

Одним из самых серьезных препятствий на пути внедрения передовых моделей искусственного интеллекта является сложность их реализации. Модели Ultralytics известны своим упрощенным пользовательским интерфейсом. Благодаря простому API наPython и CLI пользователи могут обучать, проверять и развертывать модели всего в нескольких строках кода. Это контрастирует с репозиториями, ориентированными на исследования, которые часто требуют сложных настроек среды и конфигураций.

from ultralytics import YOLO

# Load a model (YOLO11n recommended for speed/accuracy balance)
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

Универсальность в решении различных задач

В отличие от предыдущих версий YOLO , которые были предназначены в основном для обнаружения, модели Ultralytics являются мультимодальными. Единый фреймворк поддерживает:

Баланс производительности и эффективность

Ultralytics модели, такие как YOLO11разработаны таким образом, чтобы обеспечить оптимальный баланс между скоростью и точностью. Они часто достигают более высокого mAP , чем YOLOv7 , сохраняя при этом скорость вычислений, характерную для таких эффективных архитектур, как YOLOv6. Кроме того, модели Ultralytics разработаны с учетом эффективности обучения и требуют меньшего объема памяти GPU по сравнению с моделями на основе трансформаторов (например, RT-DETR), что ускоряет циклы экспериментов и снижает затраты на облачные вычисления.

Хорошо поддерживаемая экосистема

Выбор модели Ultralytics означает покупку поддерживаемой экосистемы. Она включает в себя:

  • Частые обновления: Регулярные улучшения архитектуры и веса.
  • Широкая поддержка экспорта: Бесперебойный экспорт в ONNX, TensorRT, CoreML и TFLite для развертывания на любом устройстве.
  • Сообщество: Масштабное сообщество разработчиков и обширная документация гарантируют, что помощь всегда доступна.

Заключение

И YOLOv6.0, и YOLOv7 внесли значительный вклад в область компьютерного зрения. YOLOv6.0 - лучший выбор для промышленных приложений, требующих сверхбыстрого вывода и поддержки квантования. YOLOv7 остается сильным соперником в сценариях, где точность обнаружения имеет первостепенное значение, а аппаратные ограничения являются гибкими.

Однако для комплексного решения, сочетающего в себе современную производительность с непревзойденной простотой использования, универсальностью и гибкостью развертывания, Ultralytics YOLO11 является лучшим выбором для современной разработки ИИ. Вне зависимости от того, развертываете ли вы решение на границе или масштабируете его в облаке, экосистема Ultralytics предоставляет все необходимые инструменты для достижения успеха.

Для более подробного ознакомления изучите наши сравнения по YOLOX или рассмотрите возможности RT-DETR для обнаружения на основе трансформаторов.


Комментарии