YOLOv6-3.0 vs YOLOv7: подробное техническое сравнение
Выбор оптимальной модели обнаружения объектов — критически важное решение в проектах компьютерного зрения, требующее баланса между точностью, скоростью и использованием ресурсов. На этой странице представлено подробное техническое сравнение между YOLOv6-3.0 и YOLOv7, двумя известными моделями, известными своими возможностями обнаружения объектов. Мы углубимся в их архитектуры, эталонные показатели производительности и подходящие приложения, чтобы помочь вам в процессе выбора модели.
YOLOv6-3.0: разработан для промышленной скорости
YOLOv6-3.0, разработанная компанией Meituan, разработана для промышленных приложений, требующих высокопроизводительного обнаружения объектов с акцентом на скорость и эффективность. Версия 3.0 значительно улучшает своих предшественников, предлагая повышенную точность и более быстрое время логического вывода, что делает ее сильным конкурентом для систем реального времени.
Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu и Xiangxiang Chu
Организация: Meituan
Дата: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
Документация: https://docs.ultralytics.com/models/yolov6/
Архитектура и ключевые особенности
YOLOv6-3.0 представляет аппаратный дизайн нейронной сети, который использует эффективный репараметризованный backbone. Этот выбор дизайна является центральным для его способности ускорять скорость инференса, что является критическим фактором для промышленного развертывания. Архитектура также включает структуру гибридных блоков, которая тщательно разработана для достижения оптимального баланса между точностью и вычислительной эффективностью. Этот акцент на удобстве использования оборудования гарантирует, что модель хорошо работает на различных платформах развертывания, от серверов до периферийных устройств.
Сильные стороны
- Высокая скорость инференса: Оптимизирована для быстрого инференса, что делает ее очень подходящей для приложений со строгими требованиями к задержке.
- Промышленная направленность: Разработана с учетом практических промышленных сценариев, обеспечивая надежность и эффективность в таких областях, как ИИ в производстве.
- Адаптация к оборудованию: Архитектура разработана для эффективной работы на различных аппаратных платформах, включая CPU и GPU.
Слабые стороны
- Компромисс в точности: Несмотря на высокую эффективность, она может демонстрировать немного более низкую точность на сложных наборах данных по сравнению с моделями, такими как YOLOv7, которые приоритезируют максимальную точность.
- Ограниченная универсальность: Оригинальный фреймворк в основном ориентирован на обнаружение объектов, с отдельными реализациями для других задач, в отличие от более интегрированных моделей.
Случаи использования
YOLOv6-3.0 превосходен в приложениях, где скорость и эффективность имеют первостепенное значение:
- Промышленная автоматизация: Идеально подходит для контроля качества, мониторинга процессов и других промышленных применений, требующих быстрого обнаружения.
- Системы реального времени: Подходят для развертывания в системах видеонаблюдения в реальном времени, робототехнике и приложениях со строгими ограничениями по задержке.
- Edge Computing: Его эффективная конструкция делает его отличным выбором для развертывания на устройствах с ограниченными ресурсами. Ознакомьтесь с нашим руководством по развертыванию на таких устройствах, как NVIDIA Jetson.
YOLOv7: Расширение границ точности
YOLOv7, разработанная исследователями из Института информатики Academia Sinica, Тайвань, представляет собой значительный скачок в обнаружении объектов в реальном времени, уделяя особое внимание достижению высокой точности при сохранении эффективности.
Авторы: Чен-Яо Ванг, Алексей Бочковский и Хонг-Юань Марк Ляо
Организация: Институт информатики, Academia Sinica, Тайвань
Дата: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Документация: https://docs.ultralytics.com/models/yolov7/
Архитектура и ключевые особенности
YOLOv7 представляет несколько архитектурных инноваций и стратегий обучения, направленных на повышение производительности без значительного увеличения затрат на inference. Ключевые особенности включают в себя:
- E-ELAN (Extended-Efficient Layer Aggregation Networks): Эта новая конструкция сети повышает способность модели эффективно изучать признаки, улучшая как параметры, так и вычислительную эффективность. Более подробную информацию можно найти в оригинальной статье.
- Составное масштабирование модели: Реализует методы составного масштабирования для глубины и ширины модели, оптимизируя производительность для разных размеров модели.
- Улучшения "Bag-of-Freebies": YOLOv7 включает передовые методы обучения, такие как улучшенное расширение данных и стратегии назначения меток, которые повышают точность без дополнительных затрат на вывод. Изучите аналогичные методы в нашем руководстве по расширению данных.
- Обучение с использованием вспомогательной головы: Использует вспомогательные головы на этапе обучения для усиления изучения признаков. Затем эти головы удаляются для обеспечения высокой скорости инференса.
Сильные стороны
- Высокая точность: Достигает самой современной точности на стандартных эталонных наборах данных, таких как набор данных COCO.
- Эффективная производительность: Обеспечивает высокую точность при конкурентоспособной скорости инференса, что делает его подходящим для многих приложений реального времени.
- Универсальность: Официальный репозиторий демонстрирует поддержку сообществом задач, помимо обнаружения, включая оценку позы и сегментацию экземпляров.
Слабые стороны
- Сложность: Продвинутые архитектурные особенности и методы обучения могут сделать модель более сложной для понимания и тонкой настройки по сравнению с более простыми архитектурами.
- Интенсивное обучение с использованием ресурсов: Более крупные варианты YOLOv7 (например, YOLOv7-E6E) требуют значительных вычислительных ресурсов для обучения.
Случаи использования
YOLOv7 — отличный выбор для приложений, где высокая точность является основной целью:
- Продвинутое наблюдение: Обнаружение незаметных или небольших объектов в людных местах для повышения безопасности.
- Автономные системы: Обеспечение точного обнаружения объектов для безопасной навигации в автомобилях с автоматическим управлением или дронах.
- Научные исследования: Анализ сложных визуальных данных, где высокая точность имеет решающее значение для получения точных результатов.
Сравнение производительности: YOLOv6-3.0 против YOLOv7
В таблице ниже приведены сводные метрики производительности для сопоставимых вариантов YOLOv6-3.0 и YOLOv7 на наборе данных COCO.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Примечание: Показатели скорости могут варьироваться в зависимости от оборудования, программного обеспечения (TensorRT, ONNX, OpenVINO), размера пакета и конкретных конфигураций. Значения mAP обычно сообщаются для набора данных COCO val.
Судя по таблице, YOLOv7x достигает наивысшего значения mAP, что свидетельствует о превосходной точности. Однако модели YOLOv6-3.0, особенно небольшие варианты, такие как YOLOv6-3.0n, предлагают значительно более высокую скорость инференса, особенно на GPU с оптимизацией TensorRT. Они также имеют меньше параметров и FLOPs, что делает их очень эффективными. Выбор зависит от того, что является приоритетом: максимальная точность (YOLOv7) или оптимальная скорость и эффективность (YOLOv6-3.0).
Преимущество Ultralytics: Почему стоит выбрать YOLOv8 и YOLO11?
Несмотря на то, что YOLOv6 и YOLOv7 являются мощными моделями, разработчикам и исследователям, ищущим современное решение в рамках комплексной и удобной экосистемы, следует обратить внимание на последние модели Ultralytics YOLO. Такие модели, как Ultralytics YOLOv8 и новейшая YOLO11, предлагают ряд ключевых преимуществ:
- Простота использования: Модели Ultralytics разработаны с учетом опыта разработчиков и отличаются оптимизированным Python API, обширной документацией и простыми командами CLI, которые упрощают обучение, проверку и развертывание.
- Развитая экосистема: Воспользуйтесь преимуществами активной разработки, сильного сообщества открытого исходного кода, частых обновлений и бесшовной интеграции с такими инструментами, как Ultralytics HUB для сквозного MLOps.
- Универсальность: Такие модели, как YOLOv8 и YOLO11, являются настоящими многозадачными системами, поддерживающими обнаружение объектов, сегментацию, классификацию, оценку позы и обнаружение ориентированных объектов (OBB) в рамках единой унифицированной структуры.
- Баланс производительности: Модели Ultralytics обеспечивают превосходный компромисс между скоростью и точностью, что делает их подходящими для широкого спектра реальных сценариев, от периферийных устройств до облачных серверов.
- Эффективность обучения: Воспользуйтесь преимуществами эффективных процессов обучения, легкодоступных предварительно обученных весов и более быстрого времени сходимости, экономя ценное время и вычислительные ресурсы.
Заключение
YOLOv6-3.0 и YOLOv7 — это мощные модели обнаружения объектов, которые расширили границы возможного в компьютерном зрении. YOLOv6-3.0 превосходен в сценариях, где приоритетом является скорость и эффективность инференса, что делает его идеальным для промышленных приложений и развертывания на периферийных устройствах. В отличие от этого, YOLOv7 предлагает более высокую пиковую точность, что делает его сильным выбором для задач, где точность является основной задачей, хотя и с потенциально более высокими вычислительными затратами.
Пользователям, заинтересованным в изучении других современных вариантов, Ultralytics предлагает такие модели, как YOLOv8 и YOLO11, которые обеспечивают превосходный баланс производительности, универсальности и простоты использования. Для дальнейшего изучения вам также могут быть полезны наши сравнения с другими моделями, такими как YOLOX и RT-DETR.