Перейти к содержанию

PP-YOLOE+ vs YOLOv8: техническое сравнение

Выбор оптимальной архитектуры обнаружения объектов является ключевым шагом в разработке надежных приложений компьютерного зрения. Это решение часто связано со сложным компромиссом между скоростью вывода, точностью обнаружения и гибкостью развертывания. В данном руководстве приводится подробное техническое сравнение PP-YOLOE+, высокоточной модели из экосистемы Baidu PaddlePaddle , и Ultralytics YOLOv8всемирно известной модели, которая славится своей универсальностью, скоростью и дружественной экосистемой для разработчиков.

PP-YOLOE+: Точность в экосистеме PaddlePaddle

PP-YOLOE+ - это усовершенствованная версия PP-YOLOE, разработанная командой PaddleDetection в Baidu. Она представляет собой значительную итерацию в семействе YOLO , специально оптимизированную для фреймворка PaddlePaddle . Выпущенная с целью улучшения предыдущих современных эталонов (SOTA), она уделяет большое внимание оптимизации компромисса между эффективностью обучения и точностью выводов.

Технические детали: Авторы: PaddlePaddle Авторы
Организация: Baidu
Дата: 2022-04-02
ArXiv: https://arxiv.org/abs/2203.16250
GitHub: https:PaddlePaddle
Docs: https:PaddlePaddle

Узнайте больше о PP-YOLOE+

Архитектура и основные функции

PP-YOLOE+ использует современную безъякорную архитектуру, которая упрощает процесс обучения, устраняя необходимость вычисления оптимальных размеров якорного блока для конкретных наборов данных.

  • Магистраль: В модели используется основа CSPRepResNet, которая сочетает в себе преимущества градиентного потока CSPNet с возможностью репараметризации RepVGG. Это позволяет модели иметь сложную структуру во время обучения для изучения богатых характеристик, но более простую и быструю структуру во время вывода.
  • Шея: В модели используется сеть Path Aggregation Network (PAN) для улучшения слияния признаков в разных масштабах, что очень важно для обнаружения объектов разного размера.
  • Голова: Ключевым новшеством является эффективная голова с выравниванием задач (ET-Head). Этот механизм головки разделяет функции классификации и локализации, используя Task Alignment Learning (TAL), чтобы гарантировать, что самые высокие баллы доверия соответствуют самым точным ограничительным рамкам.

Сильные стороны и ограничения

Сильные стороны: PP-YOLOE+ рассчитан на высокую производительность на стандартных эталонах, таких как набор данныхCOCO . Его реализация варифокальных потерь и распределенных фокальных потерь способствует впечатляющей способности справляться с дисбалансом классов и неоднозначностью локализации.

Слабые стороны: Основным ограничением для многих разработчиков является его глубокая зависимость от фреймворка PaddlePaddle . Несмотря на свою мощь, PaddlePaddle имеет меньшее глобальное сообщество по сравнению с PyTorchчто потенциально усложняет интеграцию в существующие конвейеры MLOps, которые полагаются на стандартные инструменты. Кроме того, PP-YOLOE+ ориентирован преимущественно на обнаружение, и в нем отсутствуют встроенные многозадачные возможности, присущие более полным наборам.

Ultralytics YOLOv8: стандарт универсальности и производительности

Ultralytics YOLOv8 представляет собой смену парадигмы в разработке и внедрении моделей ИИ. Разработанная компанией Ultralytics, она создана не просто как модель, а как полноценный фреймворк, способный решать широкий спектр задач компьютерного зрения, от обнаружения до сложного пространственного анализа.

Технические детали: Авторы: Гленн Джочер, Аюш Чаурасия и Цзин Цю.
Организация: Ultralytics
Дата: 2023-01-10
GitHub: https:ultralytics
Docs: https:yolov8

Узнайте больше о YOLOv8

Архитектура и экосистема

YOLOv8 опирается на наследие предыдущих версий YOLO с усовершенствованной основой C2f, которая заменяет модуль C3 для улучшения градиентного потока и эффективности извлечения признаков.

Преимущество Ultralytics

YOLOv8 отличается простотой использования. Пакет Ultralytics Python позволяет проводить обучение, проверку и прогнозирование всего в нескольких строках кода.

from ultralytics import YOLO

# Load a pre-trained YOLOv8 model
model = YOLO("yolov8n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100)

Эта простота подкреплена хорошо поддерживаемой экосистемой. Пользователи получают преимущества от бесшовной интеграции с такими инструментами, как Ultralytics HUB для облачного обучения, TensorBoard для визуализации, а также с различными форматами экспорта, включая ONNX, TensorRT и OpenVINO. Благодаря этому модели становятся не просто артефактами исследований, а готовы к внедрению в реальный мир.

Сравнительный анализ: Метрики и производительность

При оценке этих моделей важно смотреть не только на точность, но и на эффективность. В таблице ниже представлено подробное сравнение ключевых показателей.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Скорость и эффективность

Полученные данные подчеркивают превосходную эффективность YOLOv8. Сайт YOLOv8n (нано-) модель выделяется среди приложений краевого ИИ, достигая поразительной скорости вычислений 1,47 мс на GPU T4, что значительно быстрее, чем у самого маленького PP-YOLOE+t. Кроме того, YOLOv8n требует всего 3,2M параметров и 8,7B FLOPs, что делает ее гораздо более легкой, чем ее аналоги.

Точность против ресурсов

Хотя PP-YOLOE+x достигает несколько более высокого показателя mAP - 54,7, это дается значительной ценой: почти 100 миллионов параметров. В отличие от него, YOLOv8x обеспечивает конкурентоспособный mAP 53,9 при примерно на 30 % меньшем количестве параметров (68,2 М). Для большинства практических приложений YOLOv8 предлагает более сбалансированный профиль производительности, обеспечивая точность SOTA без огромных вычислительных затрат.

Эффективность памяти

Модели Ultralytics YOLO известны тем, что занимают мало памяти как при обучении, так и при выводах. В отличие от некоторых моделей на основе трансформаторов или тяжелых архитектур, YOLOv8 оптимизирована для эффективной работы на аппаратном обеспечении потребительского класса, что снижает потребность в дорогостоящих облачных вычислительных ресурсах.

Идеальные варианты использования и применения

Выбор между этими моделями часто зависит от конкретных ограничений вашего проекта.

Когда выбирать YOLOv8

YOLOv8 является рекомендуемым выбором для подавляющего большинства разработчиков благодаря своей универсальности и простоте использования.

  • Пограничное развертывание: Легкие модели, такие как YOLOv8n, идеально подходят для развертывания на Raspberry Pi, NVIDIA Jetson или мобильных устройствах.
  • Многозадачные конвейеры: Если ваш проект требует отслеживания объектов наряду с сегментацией или оценкой позы (например, спортивная аналитика), YOLOv8 предоставляет все эти возможности в единой унифицированной библиотеке.
  • Быстрое создание прототипов: Наличие предварительно обученных весов и простого API позволяет командам перейти от концепции к доказательству концепции за считанные часы.
  • Поддержка кросс-платформенности: Отличная поддержка для ONNX, OpenVINOи CoreML гарантирует, что ваша модель будет работать в любом месте.

Когда стоит рассмотреть PP-YOLOE+

PP-YOLOE+ остается сильным соперником специально для пользователей, глубоко интегрированных в экосистему Baidu.

  • Рабочие процессыPaddlePaddle : Команды, уже использующие пакет PaddlePaddle для решения других задач искусственного интеллекта, обнаружат, что PP-YOLOE+ органично вписывается в существующую инфраструктуру.
  • Максимальная теоретическая точность: Для исследовательских конкурсов или сценариев, где каждая доля mAP подсчитывается, а вычислительные ресурсы неограниченны, самые большие модели PP-YOLOE+ очень хороши.

Заключение

В то время как PP-YOLOE+ демонстрирует возможности системы PaddlePaddle с впечатляющими показателями точности, Ultralytics YOLOv8 выделяется как более практичное и мощное решение для широкого сообщества специалистов по компьютерному зрению. Выигрышное сочетание высокой скорости, эффективности использования ресурсов и богатого набора функций, включая встроенную поддержку сегментации и оценки позы, делаетего лучшим выбором для современной разработки ИИ.

Благодаря активному сообществу разработчиков с открытым исходным кодом, обширной документации и постоянным обновлениям, YOLOv8 обеспечивает разработчиков перспективными инструментами для эффективного решения реальных задач.

Изучите другие модели

Если вам интересно узнать о последних достижениях в области обнаружения объектов, обратите внимание на эти связанные сравнения:

  • YOLO11 против YOLOv8 - Узнайте, как новейший YOLO11 улучшает архитектуру v8.
  • YOLOv8 против RT-DETR - сравнение YOLO на основе CNN с обнаружением на основе трансформатора.
  • YOLOv10 против PP-YOLOE+ - посмотрите, как новые модели реального времени конкурируют с предложением Baidu.

Комментарии