PP-YOLOE+ vs YOLOv8: техническое сравнение
Выбор подходящей модели обнаружения объектов — это критически важное решение, которое уравновешивает точность, скорость и простоту реализации. На этой странице представлено всестороннее техническое сравнение PP-YOLOE+, высокоточной модели от Baidu, и Ultralytics YOLOv8, современной модели, известной своей универсальностью и производительностью. Мы углубимся в их архитектуры, показатели производительности и идеальные варианты использования, чтобы помочь вам выбрать лучшую модель для вашего проекта компьютерного зрения.
PP-YOLOE+: Высокая точность в экосистеме PaddlePaddle
PP-YOLOE+ — это модель обнаружения объектов, разработанная Baidu в рамках их пакета PaddleDetection. Выпущенная в 2022 году, она построена на архитектуре YOLO с акцентом на достижение высокой точности при сохранении разумной эффективности, в основном в рамках фреймворка глубокого обучения PaddlePaddle.
Технические детали:
- Авторы: Авторы PaddlePaddle
- Организация: Baidu
- Дата: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- Документация: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
Архитектура и ключевые особенности
PP-YOLOE+ — это одноэтапный детектор без anchor boxes, который вносит несколько улучшений в структуру YOLO.
- Эффективная согласованная по задачам голова (ET-Head): Использует отделенную голову с Varifocal Loss и Distribution Focal Loss для повышения точности.
- Обучение выравниванию задач (TAL): Стратегия выравнивания задач классификации и локализации, которая помогает повысить точность обнаружения.
- Backbone и Neck: Часто использует backbone CSPRepResNet и neck Path Aggregation Network (PAN) для надежного извлечения и объединения признаков.
Сильные и слабые стороны
Преимущества:
- Высокая точность: Более крупные модели PP-YOLOE+ достигают очень высоких показателей mAP на наборе данных COCO, что делает их подходящими для задач, где точность имеет первостепенное значение.
- Эффективная структура без привязки к якорям: Упрощает головку обнаружения и уменьшает количество настраиваемых гиперпараметров.
Слабые стороны:
- Зависимость от экосистемы: PP-YOLOE+ глубоко интегрирован с фреймворком PaddlePaddle, что может быть существенным барьером для разработчиков и исследователей, работающих в основном с PyTorch или TensorFlow.
- Ограниченная универсальность: Модель в основном ориентирована на обнаружение объектов и не имеет встроенной поддержки других задач компьютерного зрения, которые предлагают более комплексные фреймворки.
- Сообщество и поддержка: Сообщество и доступные ресурсы могут быть менее обширными по сравнению с огромной экосистемой, окружающей модели Ultralytics YOLO.
Ultralytics YOLOv8: Современная универсальность и производительность
Ultralytics YOLOv8 — это передовая модель, разработанная Ultralytics. Выпущенная в 2023 году, она устанавливает новый стандарт скорости, точности и простоты использования. YOLOv8 — это не просто модель обнаружения объектов; это комплексная платформа, разработанная для достижения превосходных результатов в различных задачах компьютерного зрения.
Технические детали:
- Авторы: Гленн Джокер, Аюш Чаурасия и Цзин Цю
- Организация: Ultralytics
- Дата: 10.01.2023
- GitHub: https://github.com/ultralytics/ultralytics
- Документация: https://docs.ultralytics.com/models/yolov8/
Преимущества Архитектуры и Экосистемы
YOLOv8 имеет продвинутую архитектуру без anchor boxes с backbone C2f и decoupled head, обеспечивая превосходный баланс производительности и эффективности. Однако ее истинная сила заключается в целостной экосистеме, частью которой она является.
- Беспрецедентная универсальность: YOLOv8 предоставляет унифицированный фреймворк для обнаружения объектов, сегментации экземпляров, классификации изображений, оценки позы и отслеживания объектов. Эта многозадачность делает его универсальным решением для сложных проектов компьютерного зрения.
- Простота использования: Ultralytics уделяет первостепенное внимание удобству разработки. YOLOv8 поставляется с простым и интуитивно понятным Python API и CLI, подкрепленным обширной документацией и учебными пособиями.
- Хорошо поддерживаемая экосистема: Модель активно разрабатывается и поддерживается Ultralytics и большим сообществом с открытым исходным кодом. Это обеспечивает частые обновления, новые функции и быстрое решение проблем. Интеграция с такими инструментами, как Ultralytics HUB, предоставляет решения для обучения и развертывания без кода.
- Эффективность обучения: YOLOv8 разработан для эффективного обучения, требуя меньше памяти и времени по сравнению со многими альтернативами. Предварительно обученные веса легко доступны, что позволяет быстро разрабатывать и точно настраивать пользовательские наборы данных.
Случаи использования
Сочетание производительности, скорости и универсальности делает YOLOv8 идеальным выбором для широкого спектра приложений:
- Аналитика в реальном времени: Идеально подходит для мониторинга дорожного движения, охранного видеонаблюдения и спортивной аналитики, где скорость имеет решающее значение.
- Промышленная автоматизация: Используется для контроля качества в производстве, обнаружения дефектов и управления роботами.
- Edge Deployment: Облегченные модели, такие как YOLOv8n, оптимизированы для устройств с ограниченными ресурсами, таких как NVIDIA Jetson и Raspberry Pi.
- Здравоохранение: Применяется в анализе медицинских изображений для таких задач, как обнаружение опухолей и сегментация клеток.
Прямое сравнение производительности: скорость, точность и эффективность
При сравнении производительности становится ясно, что обе модели обладают большими возможностями. Однако YOLOv8 предлагает более убедительный пакет, если рассматривать полную картину скорости, точности и вычислительных затрат.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
На основании таблицы можно сделать несколько выводов:
- Точность: В то время как самая большая модель PP-YOLOE+x превосходит YOLOv8x по mAP, модели YOLOv8 очень конкурентоспособны и часто превосходят модели малого и среднего размера (например, YOLOv8s/m).
- Эффективность: Модели YOLOv8 значительно более эффективны с точки зрения параметров и FLOPs, особенно в больших масштабах. Например, YOLOv8l достигает того же mAP, что и PP-YOLOE+l, с меньшим количеством параметров, а YOLOv8x почти так же точен, как PP-YOLOE+x, используя только 70% параметров.
- Скорость: YOLOv8n — самая быстрая модель на GPU в целом. В целом, скорости инференса сопоставимы, но YOLOv8 предоставляет исчерпывающие тесты CPU, подчеркивающие ее доступность для развертывания на более широком спектре оборудования без необходимости использования GPU.
Заключение: почему YOLOv8 является рекомендуемым выбором
Хотя PP-YOLOE+ — мощная модель, обеспечивающая высокую точность, ее зависимость от экосистемы PaddlePaddle делает ее нишевым выбором. Для подавляющего большинства разработчиков, исследователей и предприятий Ultralytics YOLOv8 — превосходный вариант.
YOLOv8 не только обеспечивает современную производительность, но и делает это в рамках гибкой, удобной и всеобъемлющей структуры. Ее ключевые преимущества — универсальность в различных задачах, простота использования, исключительная эффективность обучения и развертывания, а также поддержка динамичной экосистемы — делают ее наиболее практичным и мощным выбором для создания современных решений в области vision AI. Независимо от того, что является вашим приоритетом: скорость в реальном времени на периферийном устройстве или максимальная точность в облаке, семейство моделей YOLOv8 предоставляет масштабируемое и надежное решение.
Для тех, кто заинтересован в изучении других современных моделей, Ultralytics также предлагает сравнения с моделями, такими как YOLOv10, YOLO11 и RT-DETR.