Zum Inhalt springen

YOLOv5 vs. PP-YOLOE+: Ein technischer Vergleich zur Objekterkennung

Die Auswahl des optimalen Objekterkennungsmodells ist eine wichtige Entscheidung, die sich auf die Effizienz, Genauigkeit und Skalierbarkeit von Computer Vision-Projekten auswirkt. Dieser umfassende Leitfaden vergleicht Ultralytics YOLOv5ein legendäres Modell, das für seine Benutzerfreundlichkeit und Geschwindigkeit bekannt ist, mit PP-YOLOE+, einem hochpräzisen Modell aus dem PaddlePaddle von Baidu. Durch die Analyse ihrer Architekturen, Leistungsmetriken und Bereitstellungsabläufe wollen wir Entwicklern und Forschern helfen, die beste Lösung für ihre spezifischen Anforderungen zu wählen.

Ultralytics YOLOv5: Der Standard für Benutzerfreundlichkeit und Geschwindigkeit

YOLOv5, das von Ultralytics im Jahr 2020 veröffentlicht wurde, veränderte die Landschaft der künstlichen Intelligenz grundlegend, indem es modernste Objekterkennung für jedermann zugänglich machte. Im Gegensatz zu seinen Vorgängern war es das erste YOLO , das nativ in PyTorchimplementiert, was den Trainings- und Einsatzprozess für die globale Data-Science-Community vereinfacht. Seine Designphilosophie legt den Schwerpunkt auf ein Gleichgewicht zwischen Echtzeit-Inferenzgeschwindigkeit und hoher Genauigkeit, verpackt in einem unglaublich benutzerfreundlichen Ökosystem.

Autoren: Glenn Jocher
Organisation:Ultralytics
Datum: 26.06.2020
GitHubyolov5
Docsyolov5

Zentrale Stärken

  • Benutzerfreundlichkeit YOLOv5 ist bekannt für seine "Out-of-the-Box"-Erfahrung. Mit einer optimierten Python und intuitiven CLI können Entwickler innerhalb von Minuten mit dem Training auf benutzerdefinierten Datensätzen beginnen.
  • Gut gepflegtes Ökosystem: Unterstützt von Ultralytics genießt es häufige Updates und eine große, aktive Community. Dies gewährleistet langfristigen Support und eine Fülle von gemeinsamem Wissen auf Plattformen wie GitHub Issues.
  • Ausgewogene Leistung: Sie liefert außergewöhnliche Echtzeit-Inferenzgeschwindigkeiten, insbesondere auf Edge-Geräten wie dem Raspberry Pi, ohne dass die Genauigkeit darunter leidet.
  • Vielseitigkeit: Über die Standarderkennung hinaus unterstützt YOLOv5 die Segmentierung von Instanzen und die Klassifizierung von Bildern und ist damit ein flexibles Werkzeug für verschiedene Bildverarbeitungsaufgaben.

Erfahren Sie mehr über YOLOv5

PP-YOLOE+: Hohe Genauigkeit im Paddel-Ökosystem

PP-YOLOE+ ist eine Weiterentwicklung der YOLO , die von Forschern bei Baidu entwickelt wurde. Es wurde im Jahr 2022 veröffentlicht und dient als Flaggschiffmodell innerhalb des PaddleDetection-Toolkits. Es verwendet eine verankerungsfreie Architektur und fortschrittliche Trainingsstrategien, um die Grenzen der Präzision bei Benchmark-Datensätzen wie COCO.

Authors: PaddlePaddle Authors
Organisation:Baidu
Datum: 2022-04-02
ArXiv:https://arxiv.org/abs/2203.16250
GitHubPaddlePaddle
DocsPaddlePaddle

Architektur und Funktionen

PP-YOLOE+ verwendet ein CSPRepResNet-Backbone und einen einzigartigen prototypfreien Detektionskopf. Da es sich um einen ankerfreien Detektor handelt, reduziert es die Komplexität der Hyperparameter-Abstimmung im Zusammenhang mit Ankerboxen. Er zeichnet sich in Szenarien aus, in denen die Maximierung der durchschnittlichen Genauigkeit (Mean Average Precision,mAP) das primäre Ziel ist, und erreicht oft etwas höhere Werte als vergleichbare ankerbasierte Modelle, allerdings auf Kosten einer höheren Rechenkomplexität. Seine Abhängigkeit vom PaddlePaddle kann jedoch eine Lernkurve für Teams darstellen, die auf PyTorch oder TensorFlow standardisiert sind.

Erfahren Sie mehr über PP-YOLOE+

Leistungsanalyse: Metriken und Effizienz

Beim Vergleich von YOLOv5 und PP-YOLOE+ besteht in der Regel ein Kompromiss zwischen der reinen Genauigkeit und der operativen Effizienz (Geschwindigkeit und Einfachheit des Einsatzes).

Geschwindigkeit vs. Genauigkeit

PP-YOLOE+-Modelle weisen im Allgemeinen höhere mAPvalidieren Ergebnisse auf dem COCO , was ihre Stärke bei der reinen Erkennungsleistung zeigt. Zum Beispiel sind die PP-YOLOE+l erreicht einen bemerkenswerten Wert von 52,9 mAP. Dies geht jedoch oft mit einer höheren Latenz auf Standard-Hardware im Vergleich zu YOLOv5 einher.

Ultralytics YOLOv5 glänzt in Inferenzgeschwindigkeit. Der YOLOv5n (Nano)-Modell ist unglaublich leicht und erreicht 28,0 mAP mit einer blitzschnellen Inferenzzeit von 1,12 ms auf einem GPU mit TensorRT. Damit ist YOLOv5 die beste Wahl für Edge-KI-Anwendungen wo die Millisekunden-Latenzzeit entscheidend ist.

Rechnerische Effizienz

Die YOLOv5 wurden unter Berücksichtigung von Speicherbeschränkungen entwickelt. Sie benötigen in der Regel weniger CUDA während des Trainings und der Inferenz im Vergleich zu komplexen ankerlosen Architekturen oder transformatorbasierten Modellen. Diese Effizienz ermöglicht einen reibungsloseren Einsatz auf ressourcenbeschränkter Hardware, wie z. B. NVIDIA Jetson-Modulen, ohne umfangreichen Optimierungsaufwand.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Schulungsökosystem und Benutzerfreundlichkeit

Die "weichen" Metriken der Entwicklererfahrung entscheiden oft über den Erfolg eines Projekts. Hier ist der Unterschied zwischen den beiden Modellen am deutlichsten.

Ultralytics Ökosystem

YOLOv5 profitiert von dem integrierten Ultralytics , das die gesamte MLOps-Pipeline rationalisiert.

  • PyTorch nativ: Die Entwicklung auf Basis von PyTorch gewährleistet die Kompatibilität mit der großen Mehrheit der Open-Source-Tools und -Bibliotheken.
  • Nahtlose Integrationen: Eingebaute Unterstützung für Weights & Biases, Cometund ClearML macht die Verfolgung von Experimenten mühelos.
  • Effizientes Training: Vorgefertigte Gewichte sind sofort verfügbar und werden automatisch heruntergeladen, was ein schnelles Transfer-Lernen ermöglicht.
  • Einsatz: Der Exportmodus unterstützt die Ein-Klick-Konvertierung in ONNX, CoreML, TFLiteund mehr.

Vereinfachung des Arbeitsablaufs mit Ultralytics HUB

Mit Ultralytics HUB können Sie YOLOv5 trainieren, in der Vorschau anzeigen und bereitstellen, ohne eine einzige Zeile Code zu schreiben. Diese webbasierte Plattform verwaltet Ihre Datensätze und Trainingsläufe und macht Vision AI für Teams aller Qualifikationsstufen zugänglich.

PaddlePaddle

PP-YOLOE+ basiert auf PaddlePaddle, dem Deep-Learning-Framework von Baidu. Es ist zwar leistungsfähig und in Asien beliebt, hat aber im Vergleich zu PyTorch eine geringere Verbreitung in der westlichen Forschungsgemeinschaft. Die Übernahme von PP-YOLOE+ erfordert häufig die Einrichtung einer separaten Umgebung und das Erlernen der Paddle-spezifischen Syntax (paddle.io, paddle.nn). Während die Dokumentation umfassend ist, ist das Ökosystem von Drittanbieter-Tools und die Unterstützung durch die Gemeinschaft weniger umfangreich als das von YOLOv5.

Code-Beispiel: Die Einfachheit von YOLOv5

Der folgende Python zeigt, wie einfach es ist, ein vortrainiertes YOLOv5 zu laden und mit PyTorch Hub Inferenzen durchzuführen.

import torch

# Load a YOLOv5s model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)

# Define an image source
img = "https://ultralytics.com/images/zidane.jpg"

# Run inference
results = model(img)

# Print results to console
results.print()

# Show the image with bounding boxes
results.show()

Anwendungsfälle in der Praxis

Was YOLOv5 auszeichnet

  • Industrielle Automatisierung: Seine hohe Geschwindigkeit ermöglicht die Fehlererkennung in Echtzeit an schnell laufenden Montagelinien.
  • Autonome Robotik: Der geringe Speicherbedarf macht es ideal für Roboter mit begrenzter Rechenleistung, wie sie beispielsweise in der Logistik eingesetzt werden.
  • Smart City-Anwendungen: Effiziente CPU ermöglicht den großflächigen Einsatz für die Verkehrsüberwachung in der bestehenden Infrastruktur.

Wo PP-YOLOE+ hineinpasst

  • Hochpräzise Forschung: Akademische Projekte, bei denen es wichtiger ist, die letzten 1 % der mAP herauszuholen als die Geschwindigkeit der Schlussfolgerungen.
  • Paddle-zentrierte Umgebungen: Unternehmensumgebungen, die bereits stark in die Infrastruktur des Baidu-Ökosystems investiert haben.

Fazit: Welches Modell ist das Richtige für Sie?

Für die große Mehrheit der Entwickler und kommerziellen Anwendungen, Ultralytics YOLOv5 bleibt die empfohlene Wahl. Seine unvergleichliche Benutzerfreundlichkeit, der solide Community-Support und die Flexibilität bei der Bereitstellung machen es zu einer Lösung mit geringem Risiko und hohem Nutzen. Die Möglichkeit der Bereitstellung auf praktisch jeder Plattform - von Mobiltelefonen bis zu Cloud-Servern - mit minimalen Reibungsverlusten verschafft ihr einen entscheidenden Vorteil in Produktionsumgebungen.

PP-YOLOE+ ist eine wirksame Alternative für Nutzer, die speziell eine ankerfreie Architektur benötigen oder die bereits in den PaddlePaddle integriert sind. Seine hohe Genauigkeit ist lobenswert, aber die Fragmentierung des Ökosystems kann die Entwicklung für diejenigen verlangsamen, die an PyTorch gewöhnt sind.

Andere Modelle entdecken

Die Computer Vision entwickelt sich schnell. Auch wenn ein Vergleich dieser etablierten Modelle sinnvoll ist, möchten wir Sie ermutigen, die neuesten Entwicklungen in der Ultralytics YOLO zu erkunden, die noch mehr Leistung und Funktionen bieten.

  • YOLO11: Das neueste Modell auf dem neuesten Stand der Technik, das eine hervorragende Genauigkeit und Effizienz bei der Erkennung, Segmentierung und Posenschätzung bietet.
  • YOLOv8: Ein sehr beliebtes, einheitliches Framework, das OBB- und Klassifizierungsaufgaben unterstützt.
  • RT-DETR: Ein transformatorbasierter Detektor, der für die Echtzeitleistung optimiert ist.

Wenn Sie sich einen Überblick verschaffen möchten, besuchen Sie unsere Seite mit dem Modellvergleich, um die verschiedenen Architekturen mit Ihren spezifischen Anforderungen zu vergleichen.


Kommentare