Перейти к содержанию

YOLO11 против PP-YOLOE+: Подробное техническое сравнение

Выбор оптимальной архитектуры обнаружения объектов - это ключевое решение, которое влияет на скорость, точность и возможность развертывания проектов компьютерного зрения. В данном руководстве приводится подробное техническое сравнение между Ultralytics YOLO11последней современной моделью от Ultralytics, и PP-YOLOE+, надежным детектором из экосистемы PaddlePaddle от Baidu. Хотя обе модели обеспечивают высокую производительность, YOLO11 отличается исключительной вычислительной эффективностью, бесшовной интеграцией с PyTorch и всеобъемлющей экосистемой, предназначенной для ускорения разработки для исследователей и инженеров.

Ultralytics YOLO11: эффективность и универсальность

YOLO11 представляет собой новейшую разработку в знаменитой серии YOLO (You Only Look Once), выпущенную компанией Ultralytics для расширения границ обнаружения объектов в реальном времени. Разработанная Гленом Джошером и Цзином Цю, эта модель усовершенствует безъякорную архитектуру, чтобы обеспечить превосходную точность при значительном снижении вычислительных затрат.

Авторы: Гленн Джочер, Цзин Цю
Организация:Ultralytics
Дата: 2024-09-27
GitHubultralytics
Docsyolo11

Архитектура и основные сильные стороны

В YOLO11 используется оптимизированный дизайн сети, который оптимизирует извлечение и объединение признаков. В отличие от традиционных детекторов на основе якорей, которые полагаются на предопределенные ящики, YOLO11 напрямую предсказывает центры и масштабы объектов. Такой подход упрощает головную часть модели и уменьшает количество гиперпараметров, необходимых для настройки.

Архитектура модели очень универсальна и поддерживает широкий спектр задач компьютерного зрения, помимо простого обнаружения. Она поддерживает сегментацию объектов, оценку позы, классификацию изображений и ориентированные ограничительные рамки (OBB)- все в рамках единой унифицированной структуры.

Опыт разработчиков

Одним из самых значительных преимуществ YOLO11 является его интеграция в ultralytics Пакет Python . Это обеспечивает согласованный API для обучения, проверки и развертывания, позволяя разработчикам переключаться между задачами или экспортировать модели в такие форматы, как ONNX и TensorRT с помощью одной строчки кода.

Ключевые преимущества

  • Превосходный баланс производительности: YOLO11 достигает лучшего в отрасли компромисса между mAP и задержкой вывода, что делает его подходящим для приложений реального времени на пограничных устройствах.
  • Эффективность вычислений: Модель требует меньшего количества параметров и FLOP (операций с плавающей запятой) по сравнению с конкурентами, такими как PP-YOLOE+, что приводит к ускорению выполнения и снижению энергопотребления.
  • Малый объем памяти: Оптимизированный для эффективного использования памяти, YOLO11 обучается быстрее и может работать на оборудовании с ограниченным объемом VRAM, отличаясь от ресурсоемких моделей-трансформеров.
  • Надежная экосистема: Пользователи получают преимущества от активного сопровождения, обширной документации и поддержки сообщества, что обеспечивает долгосрочную жизнеспособность корпоративных проектов.

Узнайте больше о YOLO11

PP-YOLOE+: высокая точность в экосистеме PaddlePaddle

PP-YOLOE+ - это развитие серии YOLO , разработанное исследователями Baidu. Выпущенный в 2022 году, он является частью набора инструментов PaddleDetection и предназначен для эффективной работы в рамках фреймворка глубокого обучения PaddlePaddle .

Авторы: PaddlePaddle Authors
Organization:Baidu
Date: 2022-04-02
ArXiv:https://arxiv.org/abs/2203.16250
GitHubPaddlePaddle
Docs:PaddleDetection Documentation

Архитектура и особенности

PP-YOLOE+ использует основу CSPRepResNet и эффективную головку с выравниванием задач (ET-Head). Она включает динамическое присвоение меток с помощью Task Alignment Learning (TAL) и использует Varifocal Loss для улучшения качества классификации объектов. Модель оптимизирована специально для механизма вывода PaddlePaddle и использует интеграцию TensorRT для развертывания.

Сильные стороны и ограничения

В то время как PP-YOLOE+ обеспечивает конкурентоспособную точность в таких эталонах, как COCOон сталкивается с трудностями при внедрении из-за своей зависимости от фреймворка. Большая часть мирового исследовательского сообщества полагается на PyTorchчто делает переход на PaddlePaddle источником трений. Кроме того, модели PP-YOLOE+ обычно требуют большего количества параметров, чтобы соответствовать точности более новых архитектур, таких как YOLO11, что приводит к увеличению вычислительных затрат как при обучении, так и при выводе.

Узнайте больше о PP-YOLOE+

Анализ производительности: Эффективность и скорость

Прямое сравнение показателей производительности показывает, что YOLO11 стабильно превосходит PP-YOLOE+ по эффективности и скорости, сохраняя при этом современную точность.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Критические замечания

  1. Доминирование эффективности: Эффективность YOLO11 по параметрам просто поразительна. Например, YOLO11x достигает соответствия 54,7 mAP по сравнению с PP-YOLOE+x, но при этом использует всего 56,9 М параметров против 98,42 М. Это означает, что YOLO11x примерно на 42 % меньше, что облегчает развертывание на устройствах с ограниченным объемом памяти.
  2. Скорость вывода: в реальных сценариях развертывания скорость имеет решающее значение. YOLO11n обеспечивает невероятное время вывода на T4 GPU- 1,5 мс, что значительно быстрее, чем 2,84 мс у сопоставимого PP-YOLOE+t. Это преимущество в скорости позволяет обрабатывать данные с более высокой частотой кадров в таких приложениях, как автономные транспортные средства и робототехника.
  3. ПроизводительностьCPU : Наличие оптимизированных CPU бенчмарков для YOLO11 подчеркивает его гибкость. Достижение 56,1 мс на CPU с помощью YOLO11n позволяет создавать жизнеспособные приложения реального времени даже без специального GPU , которое часто отсутствует или менее оптимизировано в конкурирующих платформах.

Реальные примеры использования

Архитектурные преимущества YOLO11 напрямую отражаются в преимуществах для различных отраслей промышленности.

  • Инфраструктура "умного города": Высокая пропускная способность YOLO11 позволяет осуществлять мониторинг трафика в режиме реального времени и анализ загруженности дорог с использованием нескольких потоков камер при меньшем количестве серверов.
  • Промышленное производство: Благодаря высочайшей точности при низких задержках YOLO11 отлично подходит для контроля качества и обнаружения дефектов на высокоскоростных сборочных линиях.
  • Аналитика розничной торговли: Способность модели эффективно обрабатывать подсчет объектов и создавать тепловые карты помогает ритейлерам оптимизировать планировку магазинов и управление запасами.
  • Медицинская визуализация: Возможность сегментации помогает проводить точный анализ медицинских изображений, например, выявлять опухоли или анализировать клеточные структуры.

Обучение и интеграция экосистем

Главным отличием является простота обучения и развертывания моделей разработчиками. Экосистема Ultralytics построена на упрощении пути пользователя.

Оптимизированный рабочий процесс

Обучение модели YOLO11 на пользовательском наборе данных требует минимального количества кода. Фреймворк автоматически справляется со сложными задачами, такими как увеличение данных, эволюция гиперпараметров и обучение на нескольких GPU .

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

В отличие от этого, использование PP-YOLOE+ часто связано со сложностями экосистемы PaddlePaddle , конфигурационными файлами и потенциальными скриптами преобразования, если исходный конвейер данных PyTorch.

Гибкость развертывания

Ultralytics предоставляет встроенные режимы экспорта для огромного количества форматов, включая ONNX, OpenVINO, CoreML и TFLite. Это гарантирует, что модель, обученная один раз, может быть развернута в любом месте, от пограничного устройства NVIDIA Jetson до смартфона iOS или облачного API.

Заключение

В то время как PP-YOLOE+ остается эффективной моделью в контексте экосистемы Baidu, Ultralytics YOLO11 является лучшим выбором для более широкого сообщества компьютерного зрения. Сочетание значительно меньшего количества параметров, более высокой скорости вычислений и удобства использования PyTorch устраняет барьеры для входа и ускоряет время выхода на рынок.

Для разработчиков, которые ищут перспективное решение, сочетающее в себе современную производительность и простоту использования, YOLO11 представляет собой надежную, универсальную и высокоэффективную платформу для создания следующего поколения приложений искусственного интеллекта.

Изучите другие модели

Если вы заинтересованы в изучении других архитектур в экосистеме Ultralytics , рассмотрите эти сравнения:


Комментарии