YOLOv5 против PP-YOLOE+: Техническое сравнение для обнаружения объектов
Выбор оптимальной модели обнаружения объектов - важнейшее решение, влияющее на эффективность, точность и масштабируемость проектов в области компьютерного зрения. В этом подробном руководстве сравниваются Ultralytics YOLOv5легендарную модель, известную своим удобством и скоростью, против PP-YOLOE+, высокоточной модели из экосистемы PaddlePaddle компании Baidu. Анализируя их архитектуры, показатели производительности и рабочие процессы развертывания, мы стремимся помочь разработчикам и исследователям выбрать лучшее решение для их конкретных нужд.
Ultralytics YOLOv5: стандарт удобства и скорости
YOLOv5, выпущенная компанией Ultralytics в 2020 году, кардинально изменила ландшафт искусственного интеллекта зрения, сделав ультрасовременное обнаружение объектов доступным для всех. В отличие от своих предшественников, это была первая модель YOLO , реализованная на родном языке в PyTorchчто упрощает процесс обучения и развертывания для мирового сообщества специалистов по науке о данных. Философия дизайна YOLO - это баланс между скоростью вывода в реальном времени и высокой точностью, упакованный в невероятно удобную экосистему.
Авторы: Гленн Джочер
Организация:Ultralytics
Дата: 2020-06-26
GitHubyolov5
Docsyolov5
Основные сильные стороны
- Простота использования: YOLOv5 славится своими возможностями "из коробки". Благодаря оптимизированному APIPython и интуитивно понятным командамCLI разработчики могут начать обучение на пользовательских наборах данных за считанные минуты.
- Хорошо поддерживаемая экосистема: Благодаря поддержке Ultralytics, он часто обновляется и имеет большое и активное сообщество. Это обеспечивает долгосрочную поддержку и богатый запас знаний на таких платформах, как GitHub Issues.
- Баланс производительности: Он обеспечивает исключительную скорость вычислений в реальном времени, особенно на периферийных устройствах, таких как Raspberry Pi, не жертвуя при этом значительной точностью.
- Универсальность: Помимо стандартного обнаружения, YOLOv5 поддерживает сегментацию экземпляров и классификацию изображений, что делает его гибким инструментом для решения различных задач технического зрения.
PP-YOLOE+: высокая точность в экосистеме весла
PP-YOLOE+ - это эволюция серии YOLO , разработанная исследователями из Baidu. Выпущенная в 2022 году, она служит флагманской моделью в наборе инструментов PaddleDetection. В ней используется безъякорная архитектура и передовые стратегии обучения, позволяющие расширить границы точности на таких эталонных наборах данных, как COCO.
Авторы: PaddlePaddle Authors
Organization:Baidu
Date: 2022-04-02
ArXiv:https://arxiv.org/abs/2203.16250
GitHubPaddlePaddle
DocsPaddlePaddle
Архитектура и особенности
PP-YOLOE+ использует основу CSPRepResNet и уникальную головку обнаружения без прототипов. Являясь безъякорным детектором, он снижает сложность настройки гиперпараметров, связанных с якорными ящиками. Он отлично работает в сценариях, где главной целью является максимизация средней точности (mAP), часто достигая немного более высоких результатов, чем сопоставимые модели, основанные на якорях, ценой повышенной вычислительной сложности. Однако его зависимость от фреймворка PaddlePaddle может оказаться сложной для обучения команд, стандартизированных на PyTorch или TensorFlow.
Анализ производительности: Метрики и эффективность
При сравнении YOLOv5 и PP-YOLOE+ компромисс обычно лежит между исходной точностью и операционной эффективностью (скоростью и простотой развертывания).
Скорость против точности
Модели PP-YOLOE+, как правило, демонстрируют более высокий уровень mAPval на наборе данных COCO , что демонстрирует их сильные стороны в плане чистого обнаружения. Например. PP-YOLOE+l достигает замечательного показателя 52,9 mAP. Однако это часто сопровождается более высокой задержкой на стандартном оборудовании по сравнению с YOLOv5.
Ultralytics YOLOv5 сияет в скорость вывода. YOLOv5n (Nano) невероятно легкая модель, достигающая 28,0 mAP при молниеносном времени вывода 1,12 мс на GPU T4 с использованием TensorRT. Это делает YOLOv5 лучшим выбором для краевые приложения искусственного интеллекта где важна миллисекундная задержка.
Вычислительная эффективность
Модели YOLOv5 разработаны с учетом ограничений памяти. Они обычно требуют меньше памяти CUDA при обучении и выводах по сравнению со сложными безъякорными архитектурами или моделями на основе трансформаторов. Такая эффективность способствует более плавному развертыванию на аппаратном обеспечении с ограниченными ресурсами, таком как модули NVIDIA Jetson, без значительных усилий по оптимизации.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Экосистема обучения и удобство использования
"Мягкие" показатели опыта разработчиков часто диктуют успех проекта. Здесь разница между двумя моделями наиболее ярко выражена.
Экосистема Ultralytics
YOLOv5 использует преимущества интегрированной экосистемыUltralytics , которая оптимизирует весь цикл MLOps.
- PyTorch Native: Построение на PyTorch обеспечивает совместимость с подавляющим большинством инструментов и библиотек с открытым исходным кодом.
- Бесшовные интеграции: Встроенная поддержка для Weights & Biases, Cometи ClearML позволяет легко отслеживать результаты экспериментов.
- Эффективность обучения: Предварительно обученные веса легко доступны и автоматически загружаются, что позволяет быстро перевести обучение.
- Развертывание: Режим экспорта поддерживает преобразование одним щелчком мыши в ONNX, CoreML, TFLiteи многое другое.
Упрощение рабочего процесса с помощью Ultralytics HUB
С помощью Ultralytics HUB вы можете обучать, просматривать и развертывать модели YOLOv5 , не написав ни строчки кода. Эта веб-платформа управляет вашими наборами данных и тренировочными циклами, делая интеллектуальный анализ видения доступным для команд любого уровня подготовки.
Экосистема PaddlePaddle
PP-YOLOE+ опирается на PaddlePaddle, фреймворк глубокого обучения от Baidu. Несмотря на свою мощь и популярность в Азии, он имеет меньший след в западном исследовательском сообществе по сравнению с PyTorch. Использование PP-YOLOE+ часто требует создания отдельного окружения и изучения синтаксиса, специфичного для Paddle (paddle.io, paddle.nn). В то время как документацию является всеобъемлющей, но экосистема сторонних инструментов и поддержка сообщества менее обширны, чем у YOLOv5.
Пример кода: Простота YOLOv5
Следующий код Python демонстрирует, как легко загрузить предварительно обученную модель YOLOv5 и выполнить вывод с помощью PyTorch Hub.
import torch
# Load a YOLOv5s model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)
# Define an image source
img = "https://ultralytics.com/images/zidane.jpg"
# Run inference
results = model(img)
# Print results to console
results.print()
# Show the image with bounding boxes
results.show()
Реальные примеры использования
В чем преимущества YOLOv5
- Промышленная автоматизация: Высокая скорость позволяет обнаруживать дефекты в режиме реального времени на быстро движущихся сборочных линиях.
- Автономная робототехника: Низкая нагрузка на память делает его идеальным для роботов с ограниченным количеством встроенных вычислений, например, используемых в логистике.
- Приложения для "умных городов": Эффективная производительность CPU позволяет широкомасштабное развертывание для мониторинга трафика на существующей инфраструктуре.
Где PP-YOLOE+ подходит
- Высокоточные исследования: Академические проекты, в которых выжать последний 1% mAP важнее, чем скорость вывода.
- Среды, ориентированные на весла: Корпоративные среды, уже вложившие значительные средства в инфраструктуру экосистемы Baidu.
Заключение: какая модель подходит именно вам?
Для подавляющего большинства разработчиков и коммерческих приложений, Ultralytics YOLOv5 остается рекомендованным выбором. Непревзойденная простота использования, надежная поддержка сообщества и гибкость развертывания делают его решением с низким уровнем риска и высокой отдачей. Возможность развертывания практически на любой платформе - от мобильных телефонов до облачных серверов - с минимальным трением дает ему решающее преимущество в производственных средах.
PP-YOLOE+ - это мощная альтернатива для пользователей, которым требуется архитектура без якорей, или для тех, кто уже интегрирован в рабочий процесс PaddlePaddle . Его высокая точность заслуживает похвалы, но фрагментация экосистемы может замедлить развитие для тех, кто привык к стандартным рабочим процессам PyTorch .
Изучите другие модели
Компьютерное зрение развивается быстро. Несмотря на то, что сравнение этих известных моделей очень ценно, мы рекомендуем вам изучить последние достижения семейства Ultralytics YOLO , которые предлагают еще большую производительность и возможности.
- YOLO11: новейшая современная модель, обеспечивающая высочайшую точность и эффективность обнаружения, сегментации и оценки позы.
- YOLOv8: популярный унифицированный фреймворк, поддерживающий задачи OBB и классификации.
- RT-DETR: детектор на основе трансформатора, оптимизированный для работы в режиме реального времени.
Для более широкого обзора ознакомьтесь с нашей основной страницей сравнения моделей, чтобы сопоставить различные архитектуры с вашими конкретными требованиями.