PP-YOLOE+ против YOLO11: комплексное техническое сравнение
Выбор оптимальной модели обнаружения объектов требует тщательного анализа архитектуры, скорости вывода и возможностей интеграции. В данном руководстве приводится подробное техническое сравнение PP-YOLOE+, высокоточной модели из экосистемы Baidu PaddlePaddle , и Ultralytics YOLO11последней современной разработкой в серии YOLO . Хотя оба фреймворка предлагают надежные возможности обнаружения, YOLO11 отличается превосходной вычислительной эффективностью, унифицированным многозадачным фреймворком и беспрецедентной простотой использования для разработчиков.
PP-YOLOE+: высокая точность в экосистеме PaddlePaddle
PP-YOLOE+ - это усовершенствованная версия PP-YOLOE, разработанная исследователями из Baidu. Это одноступенчатый детектор объектов без якорей, разработанный для повышения скорости сходимости обучения и улучшения качества выполнения последующих задач. Построенный строго в рамках PaddlePaddle , он использует основу CSPRepResNet и стратегию динамического присвоения меток для достижения конкурентоспособной точности на таких эталонах, как COCO.
Авторы: PaddlePaddle Authors
Organization:Baidu
Date: 2022-04-02
Arxiv:https://arxiv.org/abs/2203.16250
GitHubPaddlePaddle
DocsPaddlePaddle
Основные архитектурные особенности
Архитектура PP-YOLOE+ направлена на улучшение компромисса между скоростью и точностью. Она включает в себя эффективную головку с выравниванием задач (ET-Head) для лучшего баланса задач классификации и локализации. В модели используется механизм присвоения меток, известный как Task Alignment Learning (TAL), который помогает отбирать высококачественные позитивы во время обучения. Однако, поскольку она в значительной степени опирается на экосистему PaddlePaddle , ее интеграция в рабочие процессыPyTorch часто требует сложных процессов преобразования модели.
Ultralytics YOLO11: новый стандарт искусственного интеллекта для зрения
Ultralytics YOLO11 представляет собой передовой край компьютерного зрения в реальном времени. Разработанная Гленом Джошером и Цзин Цю, она опирается на успех YOLOv8 чтобы создать более быструю, точную и значительно более эффективную модель. YOLO11 - это не просто детектор объектов; это универсальная базовая модель, способная обрабатывать сегментацию объектов, оценивать позу, классифицировать изображения и определять ориентированные ограничительные рамки (OBB) в рамках единой унифицированной кодовой базы.
Авторы: Гленн Джочер, Цзин Цю
Организация:Ultralytics
Дата: 2024-09-27
GitHubultralytics
Docsyolo11
Архитектура и преимущества
YOLO11 представляет усовершенствованную архитектуру, которая обеспечивает максимальную эффективность извлечения признаков при минимизации вычислительных затрат. В ней используется улучшенная конструкция магистрали и головки, которая уменьшает общее количество параметров по сравнению с предыдущими поколениями и конкурентами, такими как PP-YOLOE+. Такое снижение сложности позволяет повысить скорость вычислений как на пограничных устройствах, так и на облачных GPU без ущерба для точности. Кроме того, YOLO11 разработан с учетом эффективности использования памяти, требуя меньше памяти GPU во время обучения по сравнению с моделями на основе трансформаторов или старыми тяжелыми архитектурами.
Анализ производительности: Метрики и контрольные показатели
Сравнение показателей производительности выявило явные различия в эффективности и масштабируемости между двумя моделями. YOLO11 неизменно демонстрирует превосходный баланс скорости и точности, особенно если учесть требуемые вычислительные ресурсы.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Эффективность и скорость Интерпретация
Полученные данные свидетельствуют о значительном преимуществе YOLO11 в плане эффективности модели. Например, YOLO11x соответствует 54,7 mAP PP-YOLOE+x, но достигает этого всего с 56,9M параметрами по сравнению с массивными 98,42M параметрами модели PaddlePaddle . Это означает сокращение размера модели более чем на 40 %, что напрямую связано с меньшими требованиями к хранению данных и более быстрым временем загрузки.
Что касается выводов в реальном времени, YOLO11 превосходит PP-YOLOE+ во всех размерах моделей в бенчмарках T4 GPU . Эта разница крайне важна для чувствительных к задержкам приложений, таких как автономное вождение или высокоскоростная промышленная сортировка. Кроме того, наличие CPU для YOLO11 подчеркивает его оптимизацию для различных аппаратных сред, включая те, в которых нет специализированных ускорителей.
Методология обучения и простота использования
Пользовательский опыт этих двух моделей существенно различается, что во многом обусловлено их базовыми экосистемами.
Преимущество экосистемы Ultralytics
Ultralytics YOLO11 пользуется преимуществами зрелой, хорошо поддерживаемой экосистемы, в которой приоритетом является производительность разработчиков.
- Простота использования: Благодаря простому API на Python разработчики могут загружать, обучать и развертывать модели всего в нескольких строках кода. Барьер для входа исключительно низок, что делает продвинутый ИИ доступным как для новичков, так и для экспертов.
- Эффективность тренировок: YOLO11 поддерживает эффективное обучение с помощью легкодоступных предварительно обученных весов. Фреймворк автоматически справляется со сложными задачами, такими как расширение данных и настройка гиперпараметров.
- Требования к памяти: Модели YOLO оптимизированы таким образом, чтобы потреблять меньше памяти CUDA во время обучения по сравнению с другими архитектурами, что позволяет пользователям обучать большие партии или более высокие разрешения на оборудовании потребительского класса.
Простой интерфейс Python
Обучение модели YOLO11 на пользовательском наборе данных не сложнее, чем указать на файл YAML:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt")
# Train the model
model.train(data="coco8.yaml", epochs=100, imgsz=640)
Рабочий процесс PP-YOLOE+
Работа с PP-YOLOE+, как правило, требует использования фреймворка PaddlePaddle . Несмотря на свою мощь, эта экосистема менее распространена, чем PyTorch, что потенциально может привести к более сложной кривой обучения для команд, уже освоившихся в средах PyTorch или TensorFlow . Пользовательское обучение часто связано с изменением сложных конфигурационных файлов, а не с использованием упрощенного программного интерфейса, а ресурсы сообщества, хотя и растут, не столь обширны, как у глобального сообщества YOLO .
Универсальность и применение в реальных условиях
Основное различие между ними заключается в их универсальности. PP-YOLOE+ в первую очередь ориентирован на обнаружение объектов. В отличие от YOLO11 является многозадачным устройством.
YOLO11: За гранью обнаружения
Архитектура YOLO11 поддерживает широкий спектр задач компьютерного зрения:
- Сегментация объектов: Точное выделение объектов для таких приложений, как анализ медицинских изображений или восприятие автономных транспортных средств.
- Оценка позы: Отслеживание ключевых точек для спортивной аналитики или мониторинга физиотерапии.
- Ориентированные граничные коробки (Oriented Bounding Boxes, OBB): Обнаружение повернутых объектов, что очень важно для анализа аэрофотоснимков и спутников.
Идеальные варианты использования
- Производство и контроль качества: Высокая скорость YOLO11 позволяет ему идти в ногу с быстрыми сборочными линиями, обнаруживая дефекты в режиме реального времени. Его возможности сегментации позволяют определить точную форму дефектов.
- Пограничные вычисления: Благодаря сбалансированной производительности и меньшему количеству параметров, YOLO11 является лучшим выбором для развертывания на пограничных устройствах, таких как NVIDIA Jetson или Raspberry Pi.
- Умные города: Для таких приложений, как мониторинг дорожного движения, способность YOLO11 track объекты и оценивать скорость предлагает комплексное решение в одной модели.
Заключение: Рекомендуемый выбор
В то время как PP-YOLOE+ остается способным детектором в сфере PaddlePaddle , Ultralytics YOLO11 является лучшим выбором для подавляющего большинства разработчиков и исследователей.
YOLO11 предлагает более выгодный компромисс между скоростью и точностью, потребляет меньше вычислительных ресурсов и обеспечивает непревзойденную универсальность при решении различных задач технического зрения. В сочетании с активным сообществом, обширной документацией и легкой интеграцией с такими инструментами, как Ultralytics HUB, YOLO11 позволяет пользователям создавать и внедрять надежные решения в области искусственного интеллекта с большей эффективностью и легкостью.
Для тех, кто стремится использовать весь потенциал современного компьютерного зрения без трения, связанного с привязкой к фреймворку, YOLO11 - это окончательный путь вперед.
Изучите другие сравнения
Чтобы лучше понять, как YOLO11 смотрится на фоне конкурентов, изучите другие подробные сравнения: