Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ против YOLOv5#

При выборе подходящего фреймворка глубокого обучения для компьютерного зрения разработчики часто сравнивают возможности различных архитектур, чтобы найти идеальный баланс между скоростью, точностью и простотой развертывания. В этом глубоком обзоре мы изучим технические нюансы между PP-YOLOE+ и YOLOv5. Анализируя их архитектуры, показатели производительности и идеальные сценарии развертывания, ты сможешь принять обоснованное решение для своего следующего проекта, будь то робототехника реального времени, развертывание на периферийных устройствах или облачная видеоаналитика.

Link to this sectionПроисхождение моделей и метаданные#

Обе модели созданы высококвалифицированными инженерными командами, но ориентированы на несколько разные экосистемы. Понимание их происхождения дает ценный контекст для выбора их архитектурного дизайна.

Подробности PP-YOLOE+:

Узнай больше о PP-YOLOE+

Детали YOLOv5:

Узнай больше о YOLOv5

Link to this sectionАрхитектурное сравнение#

Link to this sectionАрхитектура PP-YOLOE+#

PP-YOLOE+ — это эволюция в экосистеме Baidu, построенная на базе предыдущих моделей, таких как PP-YOLOv2. Она представляет сильно оптимизированный бэкбон CSPRepResNet, который улучшает извлечение признаков за счет объединения принципов сетей Cross Stage Partial (CSP) с методами репараметризации. Это позволяет модели сохранять высокую точность во время обучения, сворачиваясь в более упрощенную архитектуру для ускорения вывода.

Кроме того, PP-YOLOE+ использует Task Alignment Learning (TAL) и Efficient Task-aligned head (ET-head). Эта комбинация направлена на решение проблемы рассогласования задач классификации и локализации, что является распространенным «бутылочным горлышком» в детекторах плотных объектов. Несмотря на структурную впечатляемость, архитектура тесно связана с фреймворком PaddlePaddle, что может создавать проблемы интеграции для команд, использующих другие популярные библиотеки машинного обучения.

Link to this sectionАрхитектура YOLOv5#

В отличие от нее, YOLOv5 была разработана нативно на PyTorch, отраслевом стандарте как для академических исследований, так и для промышленного производства. В ней используется модифицированный бэкбон CSPDarknet53, известный своей исключительной эффективностью потока градиентов и параметров.

Отличительной чертой YOLOv5 является алгоритм AutoAnchor, который динамически проверяет и корректирует размеры анкорных рамок на основе твоего пользовательского набора данных перед обучением. Это устраняет необходимость ручной настройки гиперпараметров для ограничивающих рамок. Нек (neck) модели Path Aggregation Network (PANet) обеспечивает надежное слияние признаков в разных масштабах, что делает ее очень эффективной при обнаружении объектов разных размеров.

Оптимизированное развертывание в PyTorch

Поскольку YOLOv5 построена непосредственно на PyTorch, экспорт в оптимизированные форматы, такие как ONNX и TensorRT, требует значительно меньше настройки промежуточного ПО, чем модели, привязанные к локализованным фреймворкам.

Link to this sectionАнализ производительности#

Оценка этих моделей требует рассмотрения компромисса между средней точностью (mAP) и задержкой. В следующей таблице представлены показатели для разных размеров моделей.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Хотя PP-YOLOE+ достигает очень конкурентоспособных оценок mAP в больших масштабах (например, вариант X), YOLOv5 обеспечивает превосходную скорость и меньшее количество параметров в меньшем сегменте спектра. YOLOv5 Nano (YOLOv5n) требует всего 2,6 миллиона параметров, что делает ее очень подходящей для ограниченных периферийных устройств, где требования к памяти строги. Кроме того, обучение моделей YOLO обычно потребляет меньше памяти CUDA по сравнению с тяжелыми альтернативами на базе Transformer, такими как RT-DETR.

Link to this sectionПреимущество Ultralytics#

При выборе архитектуры сухие метрики — это лишь часть уравнения. Опыт разработчика, поддержка экосистемы и конвейеры развертывания часто определяют реальный успех проекта. Именно здесь модели Ultralytics проявляют себя наилучшим образом.

Link to this sectionНепревзойденная простота использования#

Python API для Ultralytics избавляет от сложного шаблонного кода. Ты можешь легко запускать обучение, проверять производительность и развертывать модели. Документация обширна, поддерживается в актуальном состоянии и опирается на огромное глобальное сообщество с открытым исходным кодом.

Link to this sectionУниверсальность в задачах#

В то время как PP-YOLOE+ — это специализированный детектор объектов, экосистема Ultralytics позволяет пользователям решать несколько задач компьютерного зрения с помощью единого унифицированного API. С YOLOv5 и ее преемниками ты можешь легко переходить от стандартных ограничивающих рамок к рабочим процессам сегментации изображений и классификации.

Link to this sectionПример кода: Обучение YOLOv5#

Для начала работы требуются лишь несколько строк кода. Эта простота значительно ускоряет циклы исследований и разработки.

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run fast inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Link to this sectionРеальные сценарии использования#

Когда стоит выбрать PP-YOLOE+: Если твоя организация глубоко интегрирована в программный стек Baidu или сильно зависит от специализированного оборудования, требующего фреймворк PaddlePaddle, PP-YOLOE+ — надежное решение. Она часто используется в специализированных производственных конвейерах в Азии, где существует устаревшая интеграция с Paddle.

Когда стоит выбрать YOLOv5: Для подавляющего большинства международных разработчиков, исследователей и предприятий YOLOv5 остается мощным инструментом. Ее корни в PyTorch означают мгновенную совместимость с такими инструментами, как Weights & Biases для отслеживания, а также чистый экспорт в TensorRT для ускорения на графических процессорах NVIDIA или CoreML для устройств Apple. Она превосходно показывает себя в различных областях — от мониторинга сельскохозяйственных культур до высокоскоростной навигации дронов.

Link to this sectionБудущее детектирования: Ultralytics YOLO26#

Хотя YOLOv5 — культовая модель, горизонты компьютерного зрения продвинулись вперед. Для всех новых разработок мы настоятельно рекомендуем перейти на YOLO26, выпущенную в январе 2026 года. Доступная через платформу Ultralytics, YOLO26 полностью переопределяет эффективность.

Узнай больше о YOLO26

Ключевые инновации в YOLO26:

  • Комплексный дизайн без NMS: YOLO26 полностью исключает постобработку Non-Maximum Suppression. Это снижает вариативность задержки и значительно упрощает конвейер развертывания.
  • До 43% быстрее вывод на CPU: Благодаря стратегическому удалению Distribution Focal Loss (DFL), YOLO26 значительно увеличивает скорость на периферийных устройствах без графических процессоров.
  • Оптимизатор MuSGD: Вдохновленный передовыми большими языковыми моделями, этот гибридный оптимизатор стабилизирует динамику обучения и позволяет достичь гораздо более быстрой сходимости на пользовательских наборах данных.
  • Специализированные улучшения задач: Функции включают передовые функции потерь, такие как ProgLoss и STAL, обеспечивающие беспрецедентную точность на мелких объектах. Модель нативно поддерживает детектирование Oriented Bounding Box (OBB) для аэрофотосъемки.

Если ты изучаешь современные модели компьютерного зрения, тебе может быть интересно сравнить их с предыдущим поколением YOLO11 или подходами на базе трансформеров, такими как RT-DETR. В конечном счете, надежная экосистема в сочетании с передовыми архитектурными достижениями закрепляет за Ultralytics статус главного выбора для современных задач компьютерного зрения.

Участники

Комментарии