Сравнение моделей: PP-YOLOE+ против YOLO11 для обнаружения объектов
При выборе модели компьютерного зрения для обнаружения объектов важно понимать сильные и слабые стороны различных архитектур. На этой странице представлено подробное техническое сравнение PP-YOLOE+ и Ultralytics YOLO11, двух самых современных моделей, которое поможет вам принять взвешенное решение.
Ultralytics YOLO11: передовая эффективность и универсальность
Ultralytics YOLO11, авторами которого являются Гленн Джочер и Цзин Цю из Ultralytics , выпущенный 2024-09-27, является последней итерацией в известной серии YOLO . Она предназначена для обнаружения объектов в режиме реального времени и отличается превосходным балансом между скоростью и точностью в различных приложениях. YOLO11 опирается на предыдущие модели YOLO , внося архитектурные усовершенствования для повышения производительности и универсальности в таких задачах, как классификация изображений, сегментация объектов и оценка позы.
Архитектура и ключевые особенности
YOLO11 сохраняет одноэтапную парадигму обнаружения без якорей, приоритет отдается скорости вывода. Ключевые архитектурные особенности включают:
- Efficient Backbone: Оптимизированная основа для быстрого извлечения признаков.
- Масштабируемость: Доступны различные размеры (n, s, m, l, x) для удовлетворения различных вычислительных потребностей и сред развертывания, от граничных устройств, таких как NVIDIA Jetson, до облачных серверов.
- Универсальность: Поддерживает различные задачи компьютерного зрения, помимо обнаружения объектов, предлагая гибкое решение в экосистеме Ultralytics .
Показатели производительности
YOLO11 демонстрирует высокий баланс скорости и точности, что делает его пригодным для использования в приложениях реального времени.
- mAP: Достижение наилучшей средней точности (mAP) на таких наборах данных, как COCO. Подробную информацию о mAP и других показателях оценки см. в руководстве по метрикам производительностиYOLO .
- Скорость вывода: Оптимизирована для быстрого вывода, что очень важно для обработки в реальном времени, как в потоковых приложениях ИИ для зрения.
- Размер модели: Сохраняет компактный размер модели, что облегчает развертывание на устройствах с ограниченными ресурсами.
Сильные и слабые стороны
Сильные стороны:
- Универсальность и точность: Превосходно справляется с различными задачами технического зрения, обеспечивая высокую точность и скорость.
- Удобная экосистема: Бесшовная интеграция в экосистему Ultralytics с всеобъемлющим Python и документацией по использованиюCLI .
- Масштабируемое развертывание: Несколько типоразмеров моделей обеспечивают адаптацию к различным аппаратным средствам.
Слабые стороны:
- Вычислительная потребность: Большие модели могут требовать больших вычислительных затрат, что требует мощного оборудования для оптимальной работы в режиме реального времени.
- Сложность для новых пользователей: Несмотря на удобство использования, тонкая настройка и понимание нюансов архитектуры может оказаться сложной задачей для новичков в области компьютерного зрения.
Идеальные варианты использования
YOLO11 хорошо подходит для приложений, требующих обнаружения объектов в реальном времени с высокой точностью:
- Видеоаналитика в реальном времени: Такие приложения, как управление очередями и системы безопасности, выигрывают от его скорости и точности.
- Развертывание краевого ИИ: Эффективна для обработки на устройствах на таких платформах, как Raspberry Pi.
- Автономные системы: Идеально подходит для самоуправляемых автомобилей и робототехники, требующей быстрого и точного восприятия, как показано в разделе " ИИ зрения в приложениях для самоуправляемых автомобилей".
PP-YOLOE+: Ориентированность на точность и эффективность
PP-YOLOE+ (Practical YOLO with Evolved Enhancement), разработанный авторами PaddlePaddle в Baidu и выпущенный 2022-04-02, предназначен для высокоточного обнаружения объектов с разумной эффективностью. Это усовершенствованная версия серии PP-YOLOE, ориентированная на промышленные приложения, где точность имеет первостепенное значение. PP-YOLOE+ ставит во главу угла точность без существенного снижения скорости вывода и является частью зоопарка моделей PaddleDetection.
Архитектура и ключевые особенности
PP-YOLOE+ также использует безъякорный подход, подчеркивая точность и эффективность. Ключевые особенности включают:
- Высокая точность: Архитектурно доработана для достижения высочайшей точности в задачах обнаружения объектов.
- Эффективный дизайн: Баланс между точностью и скоростью вывода, подходящий для сложных приложений.
- Интеграция сPaddlePaddle : Использует фреймворк глубокого обучения PaddlePaddle , получая преимущества от его оптимизаций и экосистемы.
Показатели производительности
PP-YOLOE+ превосходит по точности, сохраняя при этом конкурентоспособную скорость:
- Высокая mAP: Достигает высокой средней точности (mAP), демонстрируя высокую точность на эталонных наборах данных, таких как COCO, как подробно описано в документации PP-YOLOE+.
- Эффективный вывод: Обеспечивает хороший баланс между точностью и скоростью вывода, подходит для промышленных приложений, требующих анализа в реальном времени.
- Размер модели: Предлагает различные размеры моделей для использования различных вычислительных ресурсов.
Сильные и слабые стороны
Сильные стороны:
- Исключительная точность: Приоритет отдается высокой точности обнаружения, что очень важно для критически важных приложений, таких как контроль качества в производстве.
- Промышленная направленность: Хорошо подходит для промышленных сред, требующих надежного и точного обнаружения объектов.
- ЭкосистемаPaddlePaddle : Воспользуйтесь преимуществами экосистемы и оптимизаций фреймворка PaddlePaddle .
Слабые стороны:
- Замкнутость экосистемы: В основном в рамках экосистемы PaddlePaddle , что может стать проблемой для пользователей, глубоко внедренных в другие фреймворки, такие как PyTorch используемый в Ultralytics YOLO.
- Менее универсален в контексте Ultralytics : Несмотря на свои возможности, он не так хорошо интегрирован в универсальную структуру задач Ultralytics , как YOLO11.
Идеальные варианты использования
PP-YOLOE+ идеально подходит для применения в тех случаях, когда точность имеет первостепенное значение:
- Контроль качества в промышленности: Приложения, требующие точного обнаружения дефектов и обеспечения качества в производственных процессах, как, например, при улучшении производства с помощью компьютерного зрения.
- Точное сельское хозяйство: Такие задачи, как мониторинг посевов и оценка урожайности, где точное обнаружение влияет на принятие решений, продемонстрировано в ИИ, стимулирующем инновации в сельском хозяйстве.
- Медицинская визуализация: Анализ медицинских изображений, где точность обнаружения имеет решающее значение для диагностики, например, обнаружение опухолей в медицинской визуализации.
Сравнительная таблица моделей
Модель | размер (пикселей) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4TensorRT10 (мс) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Заключение
PP-YOLOE+ и YOLO11 - надежные модели обнаружения объектов, каждая из которых обладает уникальными преимуществами. YOLO11 представляет собой универсальное, высокопроизводительное решение в экосистеме Ultralytics , идеально подходящее для приложений, требующих баланса скорости и точности в различных задачах технического зрения. PP-YOLOE+ отличается точностью и эффективностью, что особенно полезно для пользователей в рамках PaddlePaddle и тех, кому важна точность в промышленных условиях.
Пользователи, заинтересованные в изучении других моделей в экосистеме Ultralytics , могут также рассмотреть их:
- YOLOv8 - Универсальная и удобная модель в серии YOLO .
- YOLOv9 - известен своими достижениями в области точности и эффективности.
- YOLO - модели, разработанные с помощью нейронной архитектуры для оптимизации производительности.
- RT-DETR - Real-Time DEtection Transformer, предлагающий другой архитектурный подход.
- YOLOv7, YOLOv6 и YOLOv5 - Предыдущие версии семейства YOLO , каждая со своими характеристиками и достоинствами.