Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 против PP-YOLOE+#

Выбор правильной архитектуры нейронной сети важен для любого современного проекта в области компьютерного зрения. Когда разработчики и исследователи оценивают модели для обнаружения объектов в реальном времени, решение часто сводится к поиску баланса между точностью, скоростью вывода и простотой развертывания. Это техническое сравнение рассматривает YOLOv5 и PP-YOLOE+, исследуя их архитектуры, показатели производительности и методологии обучения, чтобы помочь тебе выбрать оптимальное решение для твоего приложения.

Link to this sectionПонимание архитектур#

Обе модели оказали значительное влияние на ландшафт ИИ в компьютерном зрении, но они подходят к задачам обнаружения объектов через разные структурные методологии и зависимости от фреймворков.

Link to this sectionUltralytics YOLOv5: отраслевой стандарт#

Выпущенный в середине 2020 года, Ultralytics YOLOv5 совершил революцию в доступности передовых моделей компьютерного зрения. Став первой нативной реализацией PyTorch в семействе YOLO, он значительно снизил порог вхождения для Python-разработчиков и ML-инженеров по всему миру.

Детали YOLOv5:

YOLOv5 использует модифицированный бэкбон CSPDarknet, который эффективно фиксирует богатые представления признаков, сохраняя при этом небольшое количество параметров. Он внедрил автоматическое обучение якорных рамок (anchor boxes), автоматически рассчитывая оптимальные размеры якорей для пользовательских наборов данных еще до начала обучения. Кроме того, интеграция аугментации данных MixUp значительно повышает способность модели обнаруживать мелкие объекты и обобщать данные в различных пространственных контекстах.

Одна из величайших сильных сторон YOLOv5 — это его невероятная универсальность. В отличие от стандартных детекторов объектов, семейство YOLOv5 легко поддерживает классификацию изображений, сегментацию экземпляров и обнаружение ограничивающих рамок (BBox) в рамках единого API. Его высокооптимизированная архитектура также обеспечивает существенно меньшее использование памяти во время обучения и вывода по сравнению с тяжелыми трансформерными сетями.

Узнай больше о YOLOv5

Link to this sectionPP-YOLOE+: Конкурент от PaddlePaddle#

Представленный примерно два года спустя, PP-YOLOE+ опирается на фундамент предыдущих итераций PP-YOLO. Разработанный для демонстрации возможностей фреймворка глубокого обучения Baidu, он вводит ряд архитектурных улучшений для повышения средней точности (mAP).

Подробности PP-YOLOE+:

PP-YOLOE+ опирается на парадигму без якорей и использует бэкбон CSPRepResNet. Он включает мощную технику выравнивания задач Task Alignment Learning и эффективную «голову» с выравниванием задач для повышения точности. Хотя PP-YOLOE+ достигает впечатляющих показателей точности, его главный недостаток заключается в строгой зависимости от фреймворка PaddlePaddle. Это часто создает крутую кривую обучения и трения в экосистеме для исследовательских групп и предприятий, которые уже глубоко интегрированы в среду PyTorch или TensorFlow.

Узнай больше о PP-YOLOE+

Link to this sectionПроизводительность и бенчмарки#

При оценке этих моделей для продакшена крайне важно понимать компромиссы между точностью, скоростью вывода и объемом параметров. В таблице ниже приведены ключевые показатели производительности для различных вариантов по размеру.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

В то время как PP-YOLOE+ достигает высоких пределов точности, YOLOv5 последовательно демонстрирует превосходную эффективность параметров и более быстрый вывод на ограниченном оборудовании. Для развертывания на граничных устройствах (edge), где памяти недостаточно, YOLOv5n предлагает непревзойденную скорость и экстремально малый размер.

Эффективность памяти

Модели Ultralytics специально разработаны для эффективности обучения. По сравнению с тяжелыми трансформерами зрения, такими как RT-DETR, YOLOv5 использует значительно меньше памяти CUDA, что позволяет тебе обучать модели на больших размерах батчей или на потребительском оборудовании.

Link to this sectionПреимущество Ultralytics: экосистема и простота использования#

Истинная ценность архитектуры машинного обучения выходит за рамки сухих цифр; она охватывает весь опыт разработчика. Платформа Ultralytics и соответствующие инструменты с открытым исходным кодом предоставляют высококлассную, хорошо поддерживаемую экосистему, которая радикально ускоряет циклы разработки.

  • Простота использования: Ultralytics избавляет тебя от сложного шаблонного кода. Ты можешь обучать, проверять и тестировать модели с помощью интуитивно понятного Python API или CLI.
  • Гибкость развертывания: Экспорт моделей невероятно прост. Одной командой ты можешь конвертировать обученные веса YOLOv5 в такие форматы, как ONNX, TensorRT или OpenVINO, обеспечивая широкую совместимость в средах Edge и облачных инфраструктурах.
  • Активное сообщество: Живое сообщество гарантирует частые обновления, обширную документацию и надежные решения распространенных задач компьютерного зрения.

Напротив, PP-YOLOE+ сильно полагается на сложные файлы конфигурации, специфичные для PaddleDetection, что может замедлить быстрое прототипирование и усложнить интеграцию в современные MLOps-конвейеры.

Link to this sectionПрактическое применение и примеры кода#

Начать работу с Ultralytics невероятно просто. Вот готовый к запуску пример того, как загрузить предобученную модель YOLOv5, обучить ее на пользовательском наборе данных и экспортировать результаты:

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset for 50 epochs
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on a sample image
predict_results = model("https://ultralytics.com/images/bus.jpg")

# Export the optimized model to ONNX format
path = model.export(format="onnx")

Link to this sectionСценарии использования и рекомендации#

Выбор между YOLOv5 и PP-YOLOE+ зависит от твоих конкретных требований проекта, ограничений развертывания и предпочтений в экосистеме.

Link to this sectionКогда стоит выбрать YOLOv5#

YOLOv5 — отличный выбор для:

  • Проверенных производственных систем: существующих развертываний, где ценятся долгая история стабильности YOLOv5, обширная документация и огромная поддержка сообщества.
  • Обучения с ограниченными ресурсами: сред с ограниченными ресурсами GPU, где эффективный конвейер обучения YOLOv5 и более низкие требования к памяти являются преимуществом.
  • Обширной поддержки форматов экспорта: проектов, требующих развертывания во многих форматах, включая ONNX, TensorRT, CoreML и TFLite.

Link to this sectionКогда выбирать PP-YOLOE+#

PP-YOLOE+ рекомендуется для:

  • Интеграция с экосистемой PaddlePaddle: Организации с существующей инфраструктурой, построенной на фреймворке и инструментах Baidu PaddlePaddle.
  • Развертывание на периферии с Paddle Lite: Развертывание на оборудовании с высокооптимизированными ядрами вывода, специально предназначенными для движка Paddle Lite или Paddle.
  • Серверное обнаружение с высокой точностью: Сценарии, где приоритетом является максимальная точность обнаружения на мощных GPU-серверах, где зависимость от фреймворка не является проблемой.

Link to this sectionКогда выбирать Ultralytics (YOLO26)#

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionДругие современные модели, которые стоит рассмотреть#

Хотя YOLOv5 является надежным и проверенным стандартом, область компьютерного зрения движется быстро. Для команд, начинающих новые проекты, мы настоятельно рекомендуем изучить наши более новые архитектуры.

Link to this sectionUltralytics YOLO26#

Выпущенная в январе 2026 года, YOLO26 представляет собой абсолютную вершину наших исследований. Она обеспечивает огромные улучшения как в точности, так и в скорости. Ключевые инновации включают:

  • End-to-End дизайн без NMS: Основываясь на концепциях из YOLOv10, YOLO26 нативно исключает постпроцессинг Non-Maximum Suppression (NMS), сокращая задержку и упрощая логику развертывания.
  • Удаление DFL: Убрав Distribution Focal Loss, YOLO26 достигает до 43% более быстрого вывода на CPU, что делает ее невероятно мощной для маломощных граничных устройств.
  • Оптимизатор MuSGD: Вдохновленный передовыми методами обучения LLM, этот гибрид SGD и Muon обеспечивает исключительно стабильные прогоны обучения и более быструю сходимость.
  • ProgLoss + STAL: Эти продвинутые функции потерь обеспечивают заметные улучшения в распознавании мелких объектов, что критически важно для изображений с дронов и умного сельского хозяйства.

Кроме того, ты можешь рассмотреть YOLO11, которая предлагает отличную производительность и служит высоконадежным мостом между устаревшими системами и передовыми возможностями YOLO26.

Link to this sectionРеальные сценарии использования#

Выбор между YOLOv5 и PP-YOLOE+ в конечном итоге зависит от твоей среды развертывания и ограничений проекта.

Идеальные приложения для YOLOv5: Минимальные требования к ресурсам и невероятная простота использования YOLOv5 делают его лучшим выбором для Edge AI. Он превосходен в приложениях, требующих высокой частоты кадров на ограниченном оборудовании, таких как робототехника в реальном времени, интеграция в мобильные приложения и системы мониторинга трафика с несколькими камерами. Его способность одновременно выполнять оценку позы и задачи с ориентированными ограничивающими рамками (OBB) в рамках одной и той же структуры делает его легко адаптируемым.

Идеальные приложения для PP-YOLOE+: PP-YOLOE+ лучше всего подходит для сценариев, где абсолютная максимальная точность на статических изображениях важнее ограничений обработки в реальном времени. Он находит нишевое применение в промышленных инспекционных конвейерах, особенно в азиатских производственных секторах, где уже есть устоявшиеся технические стеки, сильно зависящие от экосистемы Baidu и PaddlePaddle.

В итоге, хотя PP-YOLOE+ показывает сильные бенчмарки точности, модели Ultralytics YOLO обеспечивают непревзойденное сочетание баланса производительности, бесшовного развертывания и удобного для разработчика дизайна, что способствует успешной реализации проектов компьютерного зрения от концепции до продакшена.

Контрибьюторы

Комментарии