Zum Inhalt springen

PP-YOLOE+ vs. YOLOv10: Vergleich moderner Objekterkennungssysteme

Die Landschaft der Echtzeit-Objekterkennung hat sich rasant weiterentwickelt, angetrieben durch den Bedarf an Modellen, die eine hohe Genauigkeit mit geringer Latenz verbinden. Zwei bedeutende Beiträge zu diesem Bereich sind PP-YOLOE+, entwickelt von Baidu als Teil der PaddleDetection-Suite, und YOLOv10, eine akademische Veröffentlichung der Tsinghua-Universität, die das NMS Training eingeführt hat.

Dieser Leitfaden enthält einen detaillierten technischen Vergleich dieser Architekturen, wobei deren Leistungsmetriken, Trainingsmethoden und Eignung für verschiedene Computer-Vision-Anwendungen untersucht werden. Beide Modelle bieten beeindruckende Fähigkeiten, aber wir zeigen auch auf, wie das Ultralytics und neuere Modelle wie YOLO26 einen einheitlicheren und effizienteren Weg für die Bereitstellung bieten.

Modellübersicht und technische Daten

Das Verständnis der Herkunft und der Designphilosophie jedes Modells hilft Ihnen bei der Auswahl des richtigen Werkzeugs für Ihre spezifischen technischen Anforderungen.

PP-YOLOE+

PP-YOLOE+ ist eine verbesserte Version von PP-YOLOE, deren Schwerpunkt auf der Verfeinerung des ankerfreien Mechanismus und der Trainingseffizienz liegt. Es ist tief in das PaddlePaddle integriert.

  • Autoren:PaddlePaddle
  • Organisation:Baidu
  • Datum: April 2022
  • Referenz:arXiv:2203.16250
  • Wichtige Architektur: Verwendet ein CSPRepResNet-Backbone mit einer Task Alignment Learning (TAL)-Labelzuweisungsstrategie. Es basiert auf einem standardmäßigen ankerfreien Head-Design.

Erfahren Sie mehr über PP-YOLOE+

YOLOv10

YOLOv10 markierte eine bedeutende Veränderung in der YOLO , indem es ein End-to-End-Design einführte, das die Notwendigkeit einer Nicht-Maximal-Unterdrückung (NMS) während der Inferenz beseitigt.

  • Autoren: Ao Wang, Hui Chen, et al.
  • Organisation:Tsinghua University
  • Datum: Mai 2024
  • Referenz:arXiv:2405.14458
  • Key Architecture: Bietet konsistente doppelte Zuweisungen für NMS Training und ein ganzheitliches, auf Effizienz und Genauigkeit ausgerichtetes Modelldesign.

Erfahren Sie mehr über YOLOv10

Leistungsbenchmarks

Die folgende Tabelle vergleicht die Modelle anhand des COCO . Zu den wichtigsten Kennzahlen zählen die mittlere durchschnittliche Genauigkeit (mAP) und die Inferenzgeschwindigkeit auf verschiedenen Hardwarekonfigurationen. Beachten Sie die erheblichen Effizienzsteigerungen in der YOLOv10 , insbesondere hinsichtlich der Parameteranzahl.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Leistungsanalyse

YOLOv10 überragende Effizienz YOLOv10 und erzielt oft eine ähnliche oder bessere Genauigkeit mit deutlich weniger Parametern. So erreicht YOLOv10x beispielsweise fast denselben mAP PP-YOLOE+x, jedoch mit rund 42 % weniger Parametern, wodurch es sich weitaus besser für den Einsatz in Umgebungen mit begrenzter Speicherkapazität eignet.

Architektur: Detaillierte Analyse

PP-YOLOE+ Design

PP-YOLOE+ baut auf dem soliden Fundament von PP-YOLOv2 auf. Es nutzt ein skalierbares Backbone namens CSPRepResNet, das Restverbindungen mit stufenübergreifenden Teilnetzwerken kombiniert, um den Gradientenfluss zu verbessern. Der Kopf ist ankerfrei, was den Hyperparameter-Suchraum im Vergleich zu ankerbasierten Vorgängern wie YOLOv4 vereinfacht.

PP-YOLOE+ ist jedoch auf komplexe Nachbearbeitungsschritte angewiesen. Obwohl es genau ist, NMS die Abhängigkeit von NMS in überfüllten Szenen, in denen sich viele Begrenzungsrahmen überlappen, zu Latenzengpässen führen.

YOLOv10 : End-to-End-Verarbeitung

YOLOv10 einen Paradigmenwechsel YOLOv10 , indem es NMS eliminiert. Dies wird durch konsistente doppelte Zuweisungen erreicht:

  1. Eins-zu-Viele-Zuordnung: Wird während des Trainings verwendet, um umfangreiche Überwachungssignale bereitzustellen.
  2. Eins-zu-Eins-Zuordnung: Wird für die Inferenz verwendet, um eindeutige Vorhersagen pro Objekt sicherzustellen.

Durch diese Ausrichtung kann das Modell ohne den Rechenaufwand für das Sortieren und Filtern von Boxen eingesetzt werden, was für Echtzeitanwendungen ein großer Vorteil ist.

Ökosystem und Benutzerfreundlichkeit

Das Ökosystem rund um ein Modell ist oft genauso wichtig wie die Architektur selbst. Hier wird der Unterschied zwischen PaddlePaddle Modellen und Ultralytics Modellen am deutlichsten.

Der Ultralytics Vorteil

Sowohl YOLOv10 das neuere YOLO26 werden im Ultralytics Python unterstützt und bieten Entwicklern eine nahtlose Erfahrung.

  • Einheitliche API: Wechseln Sie zwischen Modellen (z. B. von YOLOv8 YOLOv10 YOLO26), indem Sie ein einziges String-Argument ändern.
  • Plattformintegration: Benutzer können die Ultralytics nutzen, um Datensätze zu verwalten, Trainingsläufe zu visualisieren und Modelle mit wenigen Klicks auf Web- und Edge-Endpunkten bereitzustellen.
  • Umfassende Exportunterstützung: Während PP-YOLOE+ für die Paddle-Inferenz optimiert ist, lassen sich Ultralytics nativ in ONNX, TensorRT, CoreMLund OpenVINO, wodurch ein breiteres Spektrum an Einsatzhardware abgedeckt wird.
from ultralytics import YOLO

# Load a pretrained YOLOv10 model
model = YOLO("yolov10n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for broad compatibility
path = model.export(format="onnx")

PP-YOLOE+ Workflow

PP-YOLOE+ erfordert in der Regel die Installation von PaddlePaddle das Klonen des PaddleDetection-Repositorys. Dieses Ökosystem ist leistungsstark, kann jedoch für Benutzer, die an PyTorch gewöhnt sind, weniger zugänglich sein. Der Exportprozess priorisiert häufig die Paddle-Inferenz-Engine, was zusätzliche Konvertierungsschritte für eine generische Bereitstellung erforderlich machen kann.

Die Zukunft: YOLO26

Während YOLOv10 das NMS Konzept YOLOv10 , wurde kürzlich YOLO26 diese Innovationen weiterentwickelt und erweitert.

YOLO26 ist von Haus aus durchgängig NMS und gewährleistet so schnellstmögliche Inferenzgeschwindigkeiten ohne Verzögerungen durch Nachbearbeitung. Es verfügt über den MuSGD-Optimierer, eine Mischung aus SGD Muon (inspiriert durch LLM-Training), der eine stabile Konvergenz gewährleistet. Darüber hinaus ist YOLO26 durch den Wegfall des Distribution Focal Loss (DFL) deutlich einfacher zu exportieren und auf Edge-Geräten mit geringer Leistung auszuführen.

Für Entwickler, die absolute Spitzenwerte bei Geschwindigkeit und Genauigkeit suchen – insbesondere für die Erkennung kleiner Objekte über ProgLoss und STAL– ist YOLO26 der empfohlene Upgrade-Pfad.

Erfahren Sie mehr über YOLO26

Anwendungsfälle in der Praxis

Wann PP-YOLOE+ wählen?

  • Baidu Cloud-Bereitstellung: Wenn Ihre Infrastruktur bereits auf Baidu Cloud basiert oder Paddle Serving verwendet, bietet PP-YOLOE+ native Optimierung.
  • Spezifische Hardware: Bestimmte KI-Chips für den asiatischen Markt bieten spezielle Unterstützung für Modelle PaddlePaddle

Wann sollte man sich für Ultralytics YOLOv10 YOLO26) entscheiden?

  • Edge Computing: Mit CPU bis zu 43 % schnelleren CPU in YOLO26 eignen sich diese Modelle ideal für Raspberry Pi, Jetson Nano oder mobile Einsätze.
  • Komplexe Aufgaben: Über die Erkennung hinaus unterstützt die Ultralytics die Posenschätzung, Instanzsegmentierung und orientierte Objekterkennung (OBB), sodass Sie mit einem einzigen Tool vielfältige Probleme lösen können.
  • Rapid Prototyping: Die einfache Schulung und Validierung ermöglicht Teams schnelle Iterationen, was in agilen Entwicklungsumgebungen ein entscheidender Faktor ist.

Speichereffizienz

Ultralytics YOLO sind für ihren geringen Speicherbedarf bekannt. Im Gegensatz zu transformatorlastigen Architekturen, die große Mengen an CUDA verbrauchen, ermöglichen effiziente YOLO wie YOLO26 größere Batch-Größen auf handelsüblichen GPUs und demokratisieren so den Zugang zu High-End-KI-Training.

Fazit

Sowohl PP-YOLOE+ als auch YOLOv10 leistungsfähige Modelle. PP-YOLOE+ ist eine gute Wahl für das PaddlePaddle , während YOLOv10 mit seinem NMS Design neue Maßstäbe in Sachen Effizienz YOLOv10 . Für eine optimierte Entwicklungserfahrung, breiteste Hardwareunterstützung und innovative Funktionen wie den MuSGD-Optimierer und ProgLoss ist Ultralytics jedoch die beste Wahl für moderne Computer-Vision-Ingenieure.

Um weitere Optionen zu erkunden, sollten Sie sich mit YOLOv8 oder das transformatorbasierte RT-DETR für Szenarien mit hoher Genauigkeit.


Kommentare