Перейти к содержанию

YOLO11 vs PP-YOLOE+: Подробное сравнение моделей

Выбор подходящей модели обнаружения объектов — это критически важное решение, которое уравновешивает требования к точности, скорости и эффективности развертывания. На этой странице представлено всестороннее техническое сравнение Ultralytics YOLO11, новейшей современной модели от Ultralytics, и PP-YOLOE+, мощной модели из экосистемы PaddlePaddle от Baidu. Хотя обе модели обладают большими возможностями, YOLO11 выделяется превосходным балансом производительности, исключительной простотой использования и интеграцией в универсальную, хорошо поддерживаемую экосистему, что делает ее рекомендуемым выбором для широкого спектра приложений компьютерного зрения.

Ultralytics YOLO11: Современная производительность и универсальность

Ultralytics YOLO11 – это новейшая флагманская модель от Ultralytics, разработанная Гленном Джохером и Цзин Цю. Выпущенная 27 сентября 2024 года, она опирается на наследие очень успешных предшественников, таких как YOLOv8, чтобы установить новый стандарт в обнаружении объектов в реальном времени и за его пределами. YOLO11 разработана для максимальной эффективности, универсальности и удобства использования, что делает передовое компьютерное зрение доступным для разработчиков и исследователей во всем мире.

Авторы: Гленн Джокер, Цзин Цю
Организация: Ultralytics
Дата: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolo11/

Архитектура и ключевые особенности

YOLO11 имеет сложную одноэтапную anchor-free архитектуру, которая оптимизирует компромисс между скоростью и точностью. Его оптимизированная структура сети уменьшает количество параметров и вычислительную нагрузку, что приводит к более высокой скорости инференса и снижению требований к памяти. Эта эффективность делает YOLO11 идеальным для развертывания на различном оборудовании, от периферийных устройств с ограниченными ресурсами, таких как NVIDIA Jetson, до мощных облачных серверов.

Одной из самых сильных сторон YOLO11 является его универсальность. Это не просто модель обнаружения объектов, а комплексная платформа машинного зрения, поддерживающая сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB). Эта многозадачность легко интегрирована в экосистему Ultralytics, которая славится своей простотой использования. Благодаря простому Python API и CLI, обширной документации и поддерживающему сообществу разработчики могут начать работу за считанные минуты. Экосистема также включает в себя такие инструменты, как Ultralytics HUB для обучения и развертывания без кода, что еще больше снижает порог входа.

Сильные стороны

  • Превосходный баланс производительности: Достигает отличного компромисса между скоростью и точностью, часто превосходя конкурентов с меньшим количеством параметров.
  • Исключительная эффективность: Оптимизирован для высокоскоростного инференса как на CPU, так и на GPU, с меньшим использованием памяти во время обучения и развертывания.
  • Беспрецедентная универсальность: Единый фреймворк поддерживает широкий спектр задач компьютерного зрения, предоставляя унифицированное решение для сложных проектов.
  • Простота использования: Отличается оптимизированным пользовательским интерфейсом с простым API, исчерпывающей документацией и множеством учебных пособий.
  • Хорошо поддерживаемая экосистема: Преимущества активной разработки, частых обновлений, сильной поддержки сообщества и бесшовной интеграции с инструментами MLOps.
  • Эффективное обучение: Поставляется с готовыми предварительно обученными весами и оптимизированными процедурами обучения, что позволяет ускорить циклы разработки.

Слабые стороны

  • Как одностадийный детектор, он может столкнуться с проблемами при работе с очень маленькими объектами в плотных сценах по сравнению со специализированными двухстадийными детекторами.
  • Самые крупные модели, такие как YOLO11x, требуют значительных вычислительных ресурсов для достижения производительности в реальном времени, что является общей чертой для моделей с высокой точностью.

Случаи использования

Сочетание скорости, точности и универсальности YOLO11 делает ее идеальным выбором для широкого спектра требовательных приложений:

Узнайте больше о YOLO11

PP-YOLOE+: Высокая точность в экосистеме PaddlePaddle

PP-YOLOE+ — это модель обнаружения объектов, разработанная Baidu и выпущенная в 2022 году как часть пакета PaddleDetection. Это одноступенчатый детектор без привязки к anchor boxes, который фокусируется на достижении высокой точности при сохранении разумной эффективности, особенно в рамках фреймворка глубокого обучения PaddlePaddle.

Авторы: Авторы PaddlePaddle
Организация: Baidu
Дата: 2022-04-02
ArXiv: https://arxiv.org/abs/2203.16250
GitHub: https://github.com/PaddlePaddle/PaddleDetection/
Документация: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md

Архитектура и ключевые особенности

PP-YOLOE+ также использует дизайн без anchor boxes для упрощения головы обнаружения. В его архитектуре часто используются backbones, такие как CSPRepResNet, и используются такие методы, как Varifocal Loss и эффективный ET-Head, для повышения производительности. Модель хорошо оптимизирована для экосистемы PaddlePaddle, что является ее основным конструктивным соображением.

Сильные и слабые стороны

PP-YOLOE+ — это мощный инструмент, обеспечивающий высокие показатели mAP, особенно с его более крупными вариантами моделей. Однако его главный недостаток заключается в зависимости от экосистемы. Привязка к PaddlePaddle может представлять собой значительную кривую обучения и проблему интеграции для подавляющего большинства разработчиков и исследователей, работающих с PyTorch. Кроме того, как показано в таблице производительности, его моделям часто требуется значительно больше параметров и FLOP для достижения точности, сопоставимой с YOLO11, что делает их менее эффективными с вычислительной точки зрения.

Случаи использования

PP-YOLOE+ хорошо подходит для приложений, где высокая точность имеет первостепенное значение, и среда разработки уже основана на PaddlePaddle.

  • Промышленный контроль: Обнаружение дефектов на производственных линиях.
  • Розница: Автоматизация проверок и анализа запасов.
  • Переработка: Идентификация материалов для автоматизированной сортировки.

Узнайте больше о PP-YOLOE+

Анализ производительности: YOLO11 против PP-YOLOE+

При сравнении показателей производительности Ultralytics YOLO11 демонстрирует явное преимущество в эффективности и скорости, обеспечивая при этом современную точность.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59
  • Точность и эффективность: YOLO11 стабильно достигает более высоких показателей mAP, чем PP-YOLOE+ при сопоставимых масштабах моделей (например, YOLO11m против PP-YOLOE+m). Важно отметить, что это достигается со значительно меньшим количеством параметров и FLOPs. Например, YOLO11x соответствует mAP PP-YOLOE+x, но при этом использует только 58% параметров и меньшее количество FLOPs, что делает ее гораздо более эффективной моделью.
  • Скорость инференса: YOLO11 значительно быстрее во всех отношениях. На T4 GPU каждый вариант YOLO11 превосходит свой аналог PP-YOLOE+. Доступность тестов CPU для YOLO11 еще больше подчеркивает гибкость его развертывания, что является ключевым преимуществом для приложений без выделенных GPU.

Обучение, удобство использования и экосистема

Помимо производительности, Ultralytics YOLO11 действительно блистает в опыте разработчика. Экосистема Ultralytics построена на PyTorch, самой популярной платформе глубокого обучения, обеспечивающей огромное сообщество, обширные ресурсы и широкую поддержку оборудования. Обучение, валидация и развертывание упрощены до простых, интуитивно понятных команд.

В отличие от них, PP-YOLOE+ ограничена фреймворком PaddlePaddle. Будучи мощной, эта экосистема менее распространена, что потенциально приводит к более крутой кривой обучения, меньшему количеству ресурсов, предоставляемых сообществом, и большему трению при интеграции с другими инструментами. Процесс обучения и использование памяти YOLO11 также хорошо оптимизированы, что позволяет быстрее экспериментировать и развертывать на более широком спектре оборудования.

Хотя PP-YOLOE+ является похвальной моделью обнаружения объектов, Ultralytics YOLO11 — превосходный выбор для подавляющего большинства случаев использования. Она предлагает более убедительный пакет современной точности, исключительной скорости логического вывода и выдающейся вычислительной эффективности.

Ключевые преимущества YOLO11:

  • Better Overall Performance: Более высокая точность с меньшими вычислительными ресурсами.
  • Бо́льшая универсальность: Единый, унифицированный фреймворк для различных задач компьютерного зрения.
  • Непревзойденная простота использования: Удобный API и экосистема, ускоряющие разработку.
  • Broader Community and Support: Построен на базе PyTorch и поддерживается активной командой и сообществом Ultralytics.

Для разработчиков и исследователей, ищущих мощную, гибкую и простую в использовании модель vision AI, YOLO11 является явным лидером, позволяющим создавать передовые приложения с большей скоростью и эффективностью.

Изучите другие модели

Если вы изучаете различные архитектуры, вас также могут заинтересовать другие современные модели, доступные в экосистеме Ultralytics. Ознакомьтесь с другими нашими страницами сравнения:



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии