Перейти к содержанию

PP-YOLOE+ vs YOLOv6-3.0: подробное техническое сравнение

Выбор подходящей модели обнаружения объектов имеет решающее значение для балансировки точности, скорости и размера модели в зависимости от конкретного приложения компьютерного зрения. На этой странице представлено техническое сравнение PP-YOLOE+ и YOLOv6-3.0 — двух популярных моделей, чтобы помочь разработчикам в принятии обоснованных решений. Мы проанализируем их архитектуры, показатели производительности и идеальные варианты использования.

PP-YOLOE+

PP-YOLOE+, улучшенная версия PP-YOLOE (Probabilistic and Point-wise YOLOv3 Enhancement), была разработана авторами PaddlePaddle в Baidu и выпущена 2 апреля 2022 года. Эта модель усовершенствует архитектуру YOLO, внедряя anchor-free обнаружение, отделенную голову и гибридное channel pruning для достижения оптимального баланса между точностью и эффективностью. PP-YOLOE+ доступен в различных размерах (t, s, m, l, x), что позволяет пользователям выбирать конфигурацию, соответствующую их вычислительным ресурсам и потребностям в производительности.

Технические детали:

Архитектура и ключевые особенности

Архитектура PP-YOLOE+ включает в себя магистральную сеть CSPRepResNet, шейку PAFPN и динамическую голову. Ключевым нововведением является его конструкция без anchor, которая упрощает конвейер обнаружения, устраняя необходимость в предопределенных anchor boxes и уменьшая настройку гиперпараметров. Он также использует Task Alignment Learning (TAL), специализированную функцию потерь, которая улучшает выравнивание между задачами классификации и локализации, что приводит к более точным обнаружениям.

Сильные и слабые стороны

  • Преимущества: PP-YOLOE+ признана за ее эффективный дизайн и высокую производительность, особенно в достижении высокой точности. Она хорошо документирована и глубоко интегрирована в экосистему PaddlePaddle, что делает ее отличным выбором для разработчиков, уже использующих этот фреймворк.

  • Недостатки: Основным ограничением модели является ее зависимость от экосистемы. Для разработчиков, работающих вне PaddlePaddle, интеграция может быть сложной и трудоемкой. По сравнению с моделями в экосистеме Ultralytics, у нее может быть меньшее сообщество, что приведет к меньшему количеству сторонних ресурсов и более медленной поддержке при устранении неполадок.

Идеальные варианты использования

PP-YOLOE+ хорошо подходит для приложений, где высокая точность имеет первостепенное значение, и среда разработки основана на PaddlePaddle. Типичные примеры использования включают:

Узнайте больше о PP-YOLOE+

YOLOv6-3.0

YOLOv6-3.0 был разработан командой Meituan и выпущен 13 января 2023 года. Это фреймворк для обнаружения объектов, разработанный с особым акцентом на промышленные приложения, стремящийся обеспечить оптимальный баланс между скоростью и точностью инференса. Модель претерпела несколько изменений, при этом версия 3.0 представила значительные улучшения по сравнению с предыдущими версиями.

Технические детали:

Архитектура и ключевые особенности

YOLOv6-3.0 имеет эффективный репараметризованный backbone и гибридный канальный neck для ускорения инференса. Он также включает самодистилляцию во время обучения для повышения производительности без увеличения вычислительных затрат во время инференса. Одной из его примечательных особенностей является доступность моделей YOLOv6Lite, которые специально оптимизированы для мобильного развертывания или развертывания на базе CPU, что делает его универсальным выбором для приложений периферийного ИИ.

Сильные и слабые стороны

  • Преимущества: YOLOv6-3.0 превосходит в скорости инференса в реальном времени, что делает ее сильным конкурентом для приложений, где задержка является критическим фактором. Ее отличная поддержка квантования и мобильно-оптимизированные варианты еще больше повышают ее пригодность для развертывания на оборудовании с ограниченными ресурсами, таком как NVIDIA Jetson.

  • Недостатки: Основным недостатком YOLOv6-3.0 является ее ограниченная универсальность задач. Она разработана исключительно для обнаружения объектов, не имея встроенной поддержки других задач компьютерного зрения, таких как сегментация экземпляров, классификация или оценка позы. Кроме того, ее экосистема не так всеобъемлюща и активно поддерживается, как платформа Ultralytics, что может привести к более медленным обновлениям и меньшей поддержке сообщества.

Идеальные варианты использования

YOLOv6-3.0 — отличный выбор для проектов, требующих быстрого и эффективного обнаружения объектов, особенно в промышленных условиях. Его идеальные применения включают:

  • Видеоаналитика в реальном времени: Подходит для мониторинга трафика и систем охранного видеонаблюдения.
  • Промышленная автоматизация: Полезна для контроля качества и мониторинга процессов на производственных линиях, где скорость имеет важное значение.
  • Робототехника: Обеспечение обнаружения объектов в реальном времени для навигации и взаимодействия в робототехнических приложениях.

Узнайте больше о YOLOv6

Сравнение производительности

При сравнении PP-YOLOE+ и YOLOv6-3.0 выявляется явный компромисс между точностью и скоростью. Модели PP-YOLOE+ обычно достигают более высоких показателей mAP, при этом самая большая модель, PP-YOLOE+x, достигает mAP 54,7. Однако эта точность достигается за счет более низкой скорости инференса.

В отличие от них, YOLOv6-3.0 отдает приоритет скорости. Самая маленькая модель, YOLOv6-3.0n, может похвастаться впечатляющим временем инференса всего 1,17 мс на GPU T4, что делает ее одним из самых быстрых доступных вариантов. Хотя ее точность ниже, чем у моделей PP-YOLOE+, она предлагает убедительный баланс для приложений, где производительность в реальном времени является обязательным условием. Модели YOLOv6-3.0 также, как правило, имеют меньше параметров и более низкие FLOP, что делает их более эффективными в вычислительном отношении.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT
(мс)
параметры
(M)
FLOPs
(B)
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59
YOLOv6-3.0n 640 37.5 - 1.17 4.7 11.4
YOLOv6-3.0s 640 45.0 - 2.66 18.5 45.3
YOLOv6-3.0m 640 50.0 - 5.28 34.9 85.8
YOLOv6-3.0l 640 52.8 - 8.95 59.6 150.7

Заключение и рекомендации

PP-YOLOE+ и YOLOv6-3.0 — мощные модели обнаружения объектов, но они ориентированы на разные приоритеты. PP-YOLOE+ — выбор для пользователей, которым нужна максимальная точность и которые работают в рамках PaddlePaddle. YOLOv6-3.0 идеально подходит для приложений, требующих высокой скорости вывода, особенно в промышленных сценариях и сценариях периферийных вычислений.

Однако, для разработчиков, ищущих более целостное и удобное решение, мы рекомендуем рассмотреть модели из серии Ultralytics YOLO, такие как YOLOv8 или последняя версия Ultralytics YOLO11. Эти модели предлагают несколько существенных преимуществ:

  • Простота использования: Модели Ultralytics поставляются с оптимизированным API на языке Python, подробной документацией и интуитивно понятным пользовательским интерфейсом, что значительно сокращает время разработки.
  • Хорошо поддерживаемая экосистема: Экосистема Ultralytics, включая Ultralytics HUB, предоставляет интегрированную платформу для обучения, проверки и развертывания. Она выигрывает от активной разработки, частых обновлений и сильной поддержки сообщества.
  • Универсальность: В отличие от моделей, ориентированных на одну задачу, модели Ultralytics YOLO поддерживают широкий спектр задач, включая обнаружение, сегментацию, классификацию и оценку позы, и все это в рамках единой унифицированной структуры.
  • Производительность и эффективность: Модели Ultralytics высоко оптимизированы для обеспечения превосходного баланса между скоростью и точностью. Они также разработаны для эффективного обучения, часто требуя меньшего использования памяти и выигрывая от легкодоступных предварительно обученных весов.

Для комплексного решения, сочетающего в себе передовую производительность с беспрецедентной простотой использования и универсальностью, модели Ultralytics YOLO представляют собой превосходный выбор для большинства проектов компьютерного зрения.

Сравнения с другими моделями

Если вы изучаете другие модели, эти сравнения могут быть вам полезны:



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии