Перейти к содержанию

PP-YOLOE+ vs YOLOv8: техническое сравнение

Выбор подходящей модели обнаружения объектов — это критически важное решение, которое уравновешивает точность, скорость и простоту реализации. На этой странице представлено всестороннее техническое сравнение PP-YOLOE+, высокоточной модели от Baidu, и Ultralytics YOLOv8, современной модели, известной своей универсальностью и производительностью. Мы углубимся в их архитектуры, показатели производительности и идеальные варианты использования, чтобы помочь вам выбрать лучшую модель для вашего проекта компьютерного зрения.

PP-YOLOE+: Высокая точность в экосистеме PaddlePaddle

PP-YOLOE+ — это модель обнаружения объектов, разработанная Baidu в рамках их пакета PaddleDetection. Выпущенная в 2022 году, она построена на архитектуре YOLO с акцентом на достижение высокой точности при сохранении разумной эффективности, в основном в рамках фреймворка глубокого обучения PaddlePaddle.

Технические детали:

Узнайте больше о PP-YOLOE+

Архитектура и ключевые особенности

PP-YOLOE+ — это одноэтапный детектор без anchor boxes, который вносит несколько улучшений в структуру YOLO.

  • Эффективная согласованная по задачам голова (ET-Head): Использует отделенную голову с Varifocal Loss и Distribution Focal Loss для повышения точности.
  • Обучение выравниванию задач (TAL): Стратегия выравнивания задач классификации и локализации, которая помогает повысить точность обнаружения.
  • Backbone и Neck: Часто использует backbone CSPRepResNet и neck Path Aggregation Network (PAN) для надежного извлечения и объединения признаков.

Сильные и слабые стороны

Преимущества:

  • Высокая точность: Более крупные модели PP-YOLOE+ достигают очень высоких показателей mAP на наборе данных COCO, что делает их подходящими для задач, где точность имеет первостепенное значение.
  • Эффективная структура без привязки к якорям: Упрощает головку обнаружения и уменьшает количество настраиваемых гиперпараметров.

Слабые стороны:

  • Зависимость от экосистемы: PP-YOLOE+ глубоко интегрирован с фреймворком PaddlePaddle, что может быть существенным барьером для разработчиков и исследователей, работающих в основном с PyTorch или TensorFlow.
  • Ограниченная универсальность: Модель в основном ориентирована на обнаружение объектов и не имеет встроенной поддержки других задач компьютерного зрения, которые предлагают более комплексные фреймворки.
  • Сообщество и поддержка: Сообщество и доступные ресурсы могут быть менее обширными по сравнению с огромной экосистемой, окружающей модели Ultralytics YOLO.

Ultralytics YOLOv8: Современная универсальность и производительность

Ultralytics YOLOv8 — это передовая модель, разработанная Ultralytics. Выпущенная в 2023 году, она устанавливает новый стандарт скорости, точности и простоты использования. YOLOv8 — это не просто модель обнаружения объектов; это комплексная платформа, разработанная для достижения превосходных результатов в различных задачах компьютерного зрения.

Технические детали:

Узнайте больше о YOLOv8

Преимущества Архитектуры и Экосистемы

YOLOv8 имеет продвинутую архитектуру без anchor boxes с backbone C2f и decoupled head, обеспечивая превосходный баланс производительности и эффективности. Однако ее истинная сила заключается в целостной экосистеме, частью которой она является.

  • Беспрецедентная универсальность: YOLOv8 предоставляет унифицированный фреймворк для обнаружения объектов, сегментации экземпляров, классификации изображений, оценки позы и отслеживания объектов. Эта многозадачность делает его универсальным решением для сложных проектов компьютерного зрения.
  • Простота использования: Ultralytics уделяет первостепенное внимание удобству разработки. YOLOv8 поставляется с простым и интуитивно понятным Python API и CLI, подкрепленным обширной документацией и учебными пособиями.
  • Хорошо поддерживаемая экосистема: Модель активно разрабатывается и поддерживается Ultralytics и большим сообществом с открытым исходным кодом. Это обеспечивает частые обновления, новые функции и быстрое решение проблем. Интеграция с такими инструментами, как Ultralytics HUB, предоставляет решения для обучения и развертывания без кода.
  • Эффективность обучения: YOLOv8 разработан для эффективного обучения, требуя меньше памяти и времени по сравнению со многими альтернативами. Предварительно обученные веса легко доступны, что позволяет быстро разрабатывать и точно настраивать пользовательские наборы данных.

Случаи использования

Сочетание производительности, скорости и универсальности делает YOLOv8 идеальным выбором для широкого спектра приложений:

  • Аналитика в реальном времени: Идеально подходит для мониторинга дорожного движения, охранного видеонаблюдения и спортивной аналитики, где скорость имеет решающее значение.
  • Промышленная автоматизация: Используется для контроля качества в производстве, обнаружения дефектов и управления роботами.
  • Edge Deployment: Облегченные модели, такие как YOLOv8n, оптимизированы для устройств с ограниченными ресурсами, таких как NVIDIA Jetson и Raspberry Pi.
  • Здравоохранение: Применяется в анализе медицинских изображений для таких задач, как обнаружение опухолей и сегментация клеток.

Прямое сравнение производительности: скорость, точность и эффективность

При сравнении производительности становится ясно, что обе модели обладают большими возможностями. Однако YOLOv8 предлагает более убедительный пакет, если рассматривать полную картину скорости, точности и вычислительных затрат.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8

На основании таблицы можно сделать несколько выводов:

  • Точность: В то время как самая большая модель PP-YOLOE+x превосходит YOLOv8x по mAP, модели YOLOv8 очень конкурентоспособны и часто превосходят модели малого и среднего размера (например, YOLOv8s/m).
  • Эффективность: Модели YOLOv8 значительно более эффективны с точки зрения параметров и FLOPs, особенно в больших масштабах. Например, YOLOv8l достигает того же mAP, что и PP-YOLOE+l, с меньшим количеством параметров, а YOLOv8x почти так же точен, как PP-YOLOE+x, используя только 70% параметров.
  • Скорость: YOLOv8n — самая быстрая модель на GPU в целом. В целом, скорости инференса сопоставимы, но YOLOv8 предоставляет исчерпывающие тесты CPU, подчеркивающие ее доступность для развертывания на более широком спектре оборудования без необходимости использования GPU.

Хотя PP-YOLOE+ — мощная модель, обеспечивающая высокую точность, ее зависимость от экосистемы PaddlePaddle делает ее нишевым выбором. Для подавляющего большинства разработчиков, исследователей и предприятий Ultralytics YOLOv8 — превосходный вариант.

YOLOv8 не только обеспечивает современную производительность, но и делает это в рамках гибкой, удобной и всеобъемлющей структуры. Ее ключевые преимущества — универсальность в различных задачах, простота использования, исключительная эффективность обучения и развертывания, а также поддержка динамичной экосистемы — делают ее наиболее практичным и мощным выбором для создания современных решений в области vision AI. Независимо от того, что является вашим приоритетом: скорость в реальном времени на периферийном устройстве или максимальная точность в облаке, семейство моделей YOLOv8 предоставляет масштабируемое и надежное решение.

Для тех, кто заинтересован в изучении других современных моделей, Ultralytics также предлагает сравнения с моделями, такими как YOLOv10, YOLO11 и RT-DETR.



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии