YOLO11 vs PP-YOLOE+: Подробное сравнение моделей
Выбор подходящей модели обнаружения объектов — это критически важное решение, которое уравновешивает требования к точности, скорости и эффективности развертывания. На этой странице представлено всестороннее техническое сравнение Ultralytics YOLO11, новейшей современной модели от Ultralytics, и PP-YOLOE+, мощной модели из экосистемы PaddlePaddle от Baidu. Хотя обе модели обладают большими возможностями, YOLO11 выделяется превосходным балансом производительности, исключительной простотой использования и интеграцией в универсальную, хорошо поддерживаемую экосистему, что делает ее рекомендуемым выбором для широкого спектра приложений компьютерного зрения.
Ultralytics YOLO11: Современная производительность и универсальность
Ultralytics YOLO11 – это новейшая флагманская модель от Ultralytics, разработанная Гленном Джохером и Цзин Цю. Выпущенная 27 сентября 2024 года, она опирается на наследие очень успешных предшественников, таких как YOLOv8, чтобы установить новый стандарт в обнаружении объектов в реальном времени и за его пределами. YOLO11 разработана для максимальной эффективности, универсальности и удобства использования, что делает передовое компьютерное зрение доступным для разработчиков и исследователей во всем мире.
Авторы: Гленн Джокер, Цзин Цю
Организация: Ultralytics
Дата: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolo11/
Архитектура и ключевые особенности
YOLO11 имеет сложную одноэтапную anchor-free архитектуру, которая оптимизирует компромисс между скоростью и точностью. Его оптимизированная структура сети уменьшает количество параметров и вычислительную нагрузку, что приводит к более высокой скорости инференса и снижению требований к памяти. Эта эффективность делает YOLO11 идеальным для развертывания на различном оборудовании, от периферийных устройств с ограниченными ресурсами, таких как NVIDIA Jetson, до мощных облачных серверов.
Одной из самых сильных сторон YOLO11 является его универсальность. Это не просто модель обнаружения объектов, а комплексная платформа машинного зрения, поддерживающая сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB). Эта многозадачность легко интегрирована в экосистему Ultralytics, которая славится своей простотой использования. Благодаря простому Python API и CLI, обширной документации и поддерживающему сообществу разработчики могут начать работу за считанные минуты. Экосистема также включает в себя такие инструменты, как Ultralytics HUB для обучения и развертывания без кода, что еще больше снижает порог входа.
Сильные стороны
- Превосходный баланс производительности: Достигает отличного компромисса между скоростью и точностью, часто превосходя конкурентов с меньшим количеством параметров.
- Исключительная эффективность: Оптимизирован для высокоскоростного инференса как на CPU, так и на GPU, с меньшим использованием памяти во время обучения и развертывания.
- Беспрецедентная универсальность: Единый фреймворк поддерживает широкий спектр задач компьютерного зрения, предоставляя унифицированное решение для сложных проектов.
- Простота использования: Отличается оптимизированным пользовательским интерфейсом с простым API, исчерпывающей документацией и множеством учебных пособий.
- Хорошо поддерживаемая экосистема: Преимущества активной разработки, частых обновлений, сильной поддержки сообщества и бесшовной интеграции с инструментами MLOps.
- Эффективное обучение: Поставляется с готовыми предварительно обученными весами и оптимизированными процедурами обучения, что позволяет ускорить циклы разработки.
Слабые стороны
- Как одностадийный детектор, он может столкнуться с проблемами при работе с очень маленькими объектами в плотных сценах по сравнению со специализированными двухстадийными детекторами.
- Самые крупные модели, такие как YOLO11x, требуют значительных вычислительных ресурсов для достижения производительности в реальном времени, что является общей чертой для моделей с высокой точностью.
Случаи использования
Сочетание скорости, точности и универсальности YOLO11 делает ее идеальным выбором для широкого спектра требовательных приложений:
- Промышленная автоматизация: Для контроля качества в производстве и робототехники.
- Умные города: Обеспечение работы мониторинга трафика в реальном времени и общественных систем безопасности.
- Аналитика розничной торговли: Улучшение управления запасами и предотвращение краж.
- Здравоохранение: Помощь в анализе медицинских изображений для более быстрой диагностики.
PP-YOLOE+: Высокая точность в экосистеме PaddlePaddle
PP-YOLOE+ — это модель обнаружения объектов, разработанная Baidu и выпущенная в 2022 году как часть пакета PaddleDetection. Это одноступенчатый детектор без привязки к anchor boxes, который фокусируется на достижении высокой точности при сохранении разумной эффективности, особенно в рамках фреймворка глубокого обучения PaddlePaddle.
Авторы: Авторы PaddlePaddle
Организация: Baidu
Дата: 2022-04-02
ArXiv: https://arxiv.org/abs/2203.16250
GitHub: https://github.com/PaddlePaddle/PaddleDetection/
Документация: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
Архитектура и ключевые особенности
PP-YOLOE+ также использует дизайн без anchor boxes для упрощения головы обнаружения. В его архитектуре часто используются backbones, такие как CSPRepResNet, и используются такие методы, как Varifocal Loss и эффективный ET-Head, для повышения производительности. Модель хорошо оптимизирована для экосистемы PaddlePaddle, что является ее основным конструктивным соображением.
Сильные и слабые стороны
PP-YOLOE+ — это мощный инструмент, обеспечивающий высокие показатели mAP, особенно с его более крупными вариантами моделей. Однако его главный недостаток заключается в зависимости от экосистемы. Привязка к PaddlePaddle может представлять собой значительную кривую обучения и проблему интеграции для подавляющего большинства разработчиков и исследователей, работающих с PyTorch. Кроме того, как показано в таблице производительности, его моделям часто требуется значительно больше параметров и FLOP для достижения точности, сопоставимой с YOLO11, что делает их менее эффективными с вычислительной точки зрения.
Случаи использования
PP-YOLOE+ хорошо подходит для приложений, где высокая точность имеет первостепенное значение, и среда разработки уже основана на PaddlePaddle.
- Промышленный контроль: Обнаружение дефектов на производственных линиях.
- Розница: Автоматизация проверок и анализа запасов.
- Переработка: Идентификация материалов для автоматизированной сортировки.
Анализ производительности: YOLO11 против PP-YOLOE+
При сравнении показателей производительности Ultralytics YOLO11 демонстрирует явное преимущество в эффективности и скорости, обеспечивая при этом современную точность.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
- Точность и эффективность: YOLO11 стабильно достигает более высоких показателей mAP, чем PP-YOLOE+ при сопоставимых масштабах моделей (например, YOLO11m против PP-YOLOE+m). Важно отметить, что это достигается со значительно меньшим количеством параметров и FLOPs. Например, YOLO11x соответствует mAP PP-YOLOE+x, но при этом использует только 58% параметров и меньшее количество FLOPs, что делает ее гораздо более эффективной моделью.
- Скорость инференса: YOLO11 значительно быстрее во всех отношениях. На T4 GPU каждый вариант YOLO11 превосходит свой аналог PP-YOLOE+. Доступность тестов CPU для YOLO11 еще больше подчеркивает гибкость его развертывания, что является ключевым преимуществом для приложений без выделенных GPU.
Обучение, удобство использования и экосистема
Помимо производительности, Ultralytics YOLO11 действительно блистает в опыте разработчика. Экосистема Ultralytics построена на PyTorch, самой популярной платформе глубокого обучения, обеспечивающей огромное сообщество, обширные ресурсы и широкую поддержку оборудования. Обучение, валидация и развертывание упрощены до простых, интуитивно понятных команд.
В отличие от них, PP-YOLOE+ ограничена фреймворком PaddlePaddle. Будучи мощной, эта экосистема менее распространена, что потенциально приводит к более крутой кривой обучения, меньшему количеству ресурсов, предоставляемых сообществом, и большему трению при интеграции с другими инструментами. Процесс обучения и использование памяти YOLO11 также хорошо оптимизированы, что позволяет быстрее экспериментировать и развертывать на более широком спектре оборудования.
Заключение: почему YOLO11 является рекомендуемым выбором
Хотя PP-YOLOE+ является похвальной моделью обнаружения объектов, Ultralytics YOLO11 — превосходный выбор для подавляющего большинства случаев использования. Она предлагает более убедительный пакет современной точности, исключительной скорости логического вывода и выдающейся вычислительной эффективности.
Ключевые преимущества YOLO11:
- Better Overall Performance: Более высокая точность с меньшими вычислительными ресурсами.
- Бо́льшая универсальность: Единый, унифицированный фреймворк для различных задач компьютерного зрения.
- Непревзойденная простота использования: Удобный API и экосистема, ускоряющие разработку.
- Broader Community and Support: Построен на базе PyTorch и поддерживается активной командой и сообществом Ultralytics.
Для разработчиков и исследователей, ищущих мощную, гибкую и простую в использовании модель vision AI, YOLO11 является явным лидером, позволяющим создавать передовые приложения с большей скоростью и эффективностью.
Изучите другие модели
Если вы изучаете различные архитектуры, вас также могут заинтересовать другие современные модели, доступные в экосистеме Ultralytics. Ознакомьтесь с другими нашими страницами сравнения: