YOLOv6-3.0 vs YOLOv8: подробное техническое сравнение
Выбор подходящей модели обнаружения объектов — это критически важное решение, которое напрямую влияет на производительность, эффективность и масштабируемость любого проекта компьютерного зрения. На этой странице представлено всестороннее техническое сравнение YOLOv6-3.0, разработанной компанией Meituan, и Ultralytics YOLOv8, современной модели от Ultralytics. Мы углубимся в их архитектурные различия, показатели производительности и идеальные варианты использования, чтобы помочь вам выбрать лучшую структуру для ваших нужд. Несмотря на то, что обе модели являются мощными, YOLOv8 выделяется своей превосходной универсальностью, простотой использования и надежной, хорошо поддерживаемой экосистемой.
YOLOv6-3.0
Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu и Xiangxiang Chu
Организация: Meituan
Дата: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
Документация: https://docs.ultralytics.com/models/yolov6/
YOLOv6-3.0 — это фреймворк обнаружения объектов, разработанный с особым акцентом на промышленные приложения. Его разработка направлена на создание эффективного баланса между скоростью инференса и точностью обнаружения, что делает его жизнеспособным вариантом для сценариев реального развертывания, где производительность имеет решающее значение.
Архитектура и ключевые особенности
YOLOv6-3.0 представил несколько архитектурных инноваций, направленных на повышение эффективности. Он имеет аппаратный дизайн сети с эффективным репараметризованным backbone и упрощенным neck (Rep-PAN). Процесс обучения включает самодистилляцию для повышения производительности без увеличения стоимости инференса. Фреймворк также предлагает специализированные модели, такие как YOLOv6Lite, которые оптимизированы для мобильных развертываний и развертываний на базе CPU.
Сильные стороны
- Высокая скорость инференса на GPU: Модели YOLOv6-3.0 демонстрируют отличную скорость инференса на GPU, особенно при оптимизации с помощью TensorRT, что делает их подходящими для приложений реального времени со специализированным оборудованием GPU.
- Поддержка квантования: Платформа обеспечивает хорошую поддержку и учебные пособия по квантованию моделей, что полезно для развертывания моделей на оборудовании с ограниченными ресурсами.
- Ориентация на промышленность: Модель специально разработана для промышленного использования и превосходно подходит для сценариев, где скорость имеет первостепенное значение.
Слабые стороны
- Ограниченная универсальность: YOLOv6 - это в первую очередь детектор объектов. Ему не хватает встроенной поддержки других задач компьютерного зрения, таких как сегментация экземпляров, оценка позы или классификация изображений, которые являются стандартными в YOLOv8.
- Более высокое использование ресурсов: Для сопоставимых уровней точности модели YOLOv6 часто имеют больше параметров и более высокие FLOPs, чем их аналоги YOLOv8, что может привести к увеличению вычислительных требований.
- Экосистема и обслуживание: Будучи проектом с открытым исходным кодом, экосистема вокруг YOLOv6 не так всеобъемлюща и активно поддерживается, как платформа Ultralytics. Это может привести к замедлению обновлений, меньшему количеству интеграций и уменьшению поддержки сообщества.
Ultralytics YOLOv8
Авторы: Glenn Jocher, Ayush Chaurasia и Jing Qiu
Организация: Ultralytics
Дата: 2023-01-10
Arxiv: None
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolov8/
Ultralytics YOLOv8 — это современная, передовая модель, основанная на успехе предыдущих версий YOLO. Она разработана, чтобы быть быстрой, точной и простой в использовании, предоставляя комплексную платформу для широкого спектра задач компьютерного зрения. Ее архитектура и ориентированная на разработчиков экосистема делают ее рекомендуемым выбором для большинства приложений.
Архитектура и ключевые особенности
YOLOv8 представляет значительные архитектурные улучшения, включая новый backbone, новую detection head без anchor boxes и новую функцию потерь. В результате получается модель, которая не только более точна, но и более эффективна с точки зрения параметров и вычислительной нагрузки. Как детектор без anchor boxes, YOLOv8 упрощает выходной слой и улучшает обобщение.
Сильные стороны
- Превосходный баланс производительности: YOLOv8 достигает исключительного компромисса между скоростью и точностью. Как показано в таблице ниже, он часто обеспечивает более высокие показатели mAP с меньшим количеством параметров и FLOPs по сравнению с YOLOv6, что делает его очень эффективным.
- Беспрецедентная универсальность: YOLOv8 — это многозадачный фреймворк, поддерживающий обнаружение объектов, сегментацию экземпляров, классификацию изображений, оценку позы и отслеживание объектов из коробки. Эта универсальность позволяет разработчикам использовать единый, согласованный фреймворк для различных приложений.
- Простота использования: Экосистема Ultralytics разработана для оптимизации работы пользователей. Благодаря простому Python API и CLI, обширной документации и легкодоступным предварительно обученным весам, начать работу с YOLOv8 невероятно просто.
- Хорошо поддерживаемая экосистема: YOLOv8 поддерживается активной разработкой со стороны Ultralytics, что обеспечивает частые обновления, сильную поддержку сообщества через GitHub и Discord, и бесшовную интеграцию с такими инструментами, как Ultralytics HUB для обучения и развертывания без кода.
- Эффективность обучения: Модель разработана для эффективных процессов обучения. Часто требует меньше памяти, чем другие архитектуры, особенно модели на основе трансформеров, и выигрывает от оптимизированных стратегий увеличения данных.
Слабые стороны
- Обнаружение мелких объектов: Как и большинство одноэтапных детекторов, YOLOv8 иногда может сталкиваться с проблемами при обнаружении очень маленьких или плотно упакованных объектов по сравнению со специализированными двухэтапными детекторами.
Сравнение производительности
В следующей таблице сравниваются показатели производительности различных моделей YOLOv8 и YOLOv6-3.0 на наборе данных COCO val2017. Лучшее значение в каждом столбце выделено жирным шрифтом.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
На основании данных о производительности можно сделать несколько ключевых выводов:
- Точность и эффективность: Модели YOLOv8 стабильно достигают сопоставимых или немного лучших показателей mAP со значительно меньшим количеством параметров и FLOPs. Например, YOLOv8m достигает более высокого mAP (50,2 против 50,0), чем YOLOv6-3.0m, при этом используя примерно на 26% меньше параметров и примерно на 8% меньше FLOPs.
- Скорость CPU vs. GPU: YOLOv6-3.0 показывает очень конкурентоспособные скорости инференса на NVIDIA T4 GPU с TensorRT. Однако YOLOv8 демонстрирует отличную производительность CPU с ONNX, что является критическим преимуществом для развертывания на более широком спектре периферийных устройств и облачных экземпляров без выделенных GPU.
- Общая ценность: YOLOv8 предлагает более убедительный пакет. Его архитектурная эффективность приводит к снижению требований к ресурсам для заданного уровня точности, что является большим преимуществом для практических применений.
Заключение и рекомендации
Несмотря на то, что YOLOv6-3.0 является эффективным детектором объектов с впечатляющей скоростью GPU для промышленных приложений, Ultralytics YOLOv8 является лучшим выбором для подавляющего большинства пользователей и проектов.
Ключевые преимущества YOLOv8 — многозадачность, исключительный баланс скорости и точности, низкие требования к ресурсам и удобная экосистема — делают ее более мощным и гибким инструментом. Независимо от того, являетесь ли вы исследователем, расширяющим границы ИИ, или разработчиком, создающим надежные решения для реального мира, YOLOv8 предоставляет более комплексную, эффективную и перспективную платформу.
Изучение других моделей
Для тех, кто заинтересован в дальнейшем изучении, Ultralytics предлагает широкий спектр моделей. Вы можете сравнить YOLOv8 с ее предшественниками, такими как YOLOv5 и YOLOv7, или изучить новейшие современные модели, такие как YOLOv10 и YOLO11. Кроме того, сравнения с другими архитектурами, такими как RT-DETR, доступны в документации Ultralytics.