Zum Inhalt springen

PP-YOLOE+ vs. YOLOv5: Ein technischer Vergleich der Echtzeit-Objekterkennung

In der wettbewerbsintensiven Landschaft der Computervision ist die Auswahl der richtigen Objektdetektionsarchitektur eine wichtige Entscheidung für Entwickler und Forscher. PP-YOLOE+, entwickelt vom PaddlePaddle von Baidu, und YOLOv5von Ultralytics sind zwei herausragende Ansätze zur Lösung von Herausforderungen bei der Echtzeit-Objekterkennung. Während PP-YOLOE+ den Schwerpunkt auf ankerfreie Mechanismen innerhalb des PaddlePaddle legt, YOLOv5 den Industriestandard für Benutzerfreundlichkeit, Flexibilität bei der Bereitstellung und Community-Support innerhalb von PyTorch gesetzt.

Dieser Leitfaden enthält eine detaillierte technische Analyse dieser beiden einflussreichen Modelle und vergleicht deren Architekturen, Leistungskennzahlen und Eignung für reale Anwendungen wie Fertigungsautomatisierung und Edge-Computing.

Modellübersicht

PP-YOLOE+

PP-YOLOE+ ist eine Weiterentwicklung von PP-YOLOE, die darauf ausgelegt ist, die Trainingskonvergenz und die Leistung nachgelagerter Aufgaben zu verbessern. Es läuft auf dem PaddlePaddle und nutzt ein ankerfreies Paradigma, um den Erkennungskopf zu vereinfachen. Durch die Integration eines stärkeren Backbones und verfeinerter Trainingsstrategien soll es eine hohe Präzision für industrielle Anwendungen bieten, bei denen cloudbasierte Inferenz üblich ist.

Ultralytics YOLOv5

YOLOv5 hat die Benutzererfahrung bei der Objekterkennung revolutioniert. Das von Ultralytics veröffentlichte Produkt legt den Schwerpunkt auf „Deployment-First“-Engineering und stellt sicher, dass die Modelle nicht nur genau sind, sondern auch unglaublich einfach zu trainieren, zu exportieren und auf unterschiedlicher Hardware auszuführen sind. Seine ankerbasierte Architektur ist in hohem Maße auf Geschwindigkeit optimiert, was es zu einem Favoriten für Echtzeit-Inferenzen auf Edge-Geräten macht.

Erfahren Sie mehr über YOLOv5

Technischer Architekturvergleich

Die Architekturphilosophien von PP-YOLOE+ und YOLOv5 erheblich, was sich auf ihr Trainingsverhalten und ihre Einsatzmerkmale auswirkt.

Backbone und Merkmalsextraktion

YOLOv5 nutzt ein CSPDarknet (Cross Stage Partial Network) Backbone. Dieses Design verbessert den Gradientenfluss und reduziert die Anzahl der Parameter, ohne die Leistung zu beeinträchtigen. Die Architektur ist hochgradig modular, was schnelle Experimente mit verschiedenen Modelltiefen und -breiten (Nano bis X-Large) ermöglicht. Diese Modularität ist entscheidend für Entwickler, die in ressourcenbeschränkten Umgebungen wie Raspberry Pi oder mobilen Geräten arbeiten.

PP-YOLOE+ hingegen verwendet in der Regel ein CSPRepResStage-Backbone, das Restverbindungen mit Reparametrisierungstechniken kombiniert. Diese Struktur ist zwar effektiv für die Extraktion reichhaltiger Merkmale, führt jedoch im Vergleich zur optimierten Effizienz der YOLOv5 häufig zu einer höheren Komplexität während der Trainingsphase.

Detektionsköpfe: Ankerbasiert vs. ankerfrei

Ein grundlegender Unterschied liegt in den Detektionsköpfen:

  1. YOLOv5 Anchor-Based): Verwendet vordefinierte Ankerboxen, um Objektpositionen vorherzusagen. Dies erfordert zwar eine anfängliche Konfiguration (die Ultralytics über AutoAnchor Ultralytics ), bietet jedoch stabile Trainingsgradienten und historisch robuste Leistung bei Standarddatensätzen wie COCO.
  2. PP-YOLOE+ (Anchor-Free): Prognostiziert Objektzentren und -größen direkt, wodurch die Anpassung der Hyperparameter für Ankerboxen entfällt. Dieser Ansatz eignet sich gut für Objekte mit extremen Seitenverhältnissen, kann jedoch empfindlicher auf die Qualität der Trainingsdaten und die anfängliche Verlustkonvergenz reagieren.

Entwicklung hin zu ankerfreien Systemen

Während YOLOv5 Anker YOLOv5 einsetzt, nutzen neuere Ultralytics wie YOLOv8 und das hochmoderne YOLO26 auf ankerfreie Designs umgestellt und kombinieren so das Beste aus beiden Welten: Benutzerfreundlichkeit und überlegene geometrische Generalisierung.

Leistungsmetriken

Bei der Bewertung der Leistung ist es entscheidend, das Verhältnis zwischen der mittleren durchschnittlichen Präzision (mAP) und der Latenz zu betrachten. Die folgende Tabelle zeigt, dass PP-YOLOE+ zwar eine hohe Genauigkeit erzielt, YOLOv5 einen Wettbewerbsvorteil in Bezug auf CPU und Einsatzvielseitigkeit YOLOv5 und für neue Benutzer deutlich niedrigere Einstiegshürden aufweist.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Analyse von Geschwindigkeit und Effizienz

Ultralytics YOLOv5 außergewöhnliche EffizienzYOLOv5 , insbesondere in den Varianten „Nano” und „Small”. Das YOLOv5n-Modell mit nur 1,9 Millionen Parametern wurde speziell für extrem eingeschränkte Umgebungen wie mobile Apps oder IoT-Sensoren entwickelt. Während PP-YOLOE+ starke mAP bietet, können die Komplexität der Einrichtung und die Abhängigkeit vom PaddlePaddle zu Reibungsverlusten in Produktionspipelines führen, die auf PyTorch ONNX basieren.

Darüber hinaus sprechen auch die Speicheranforderungen für YOLOv5. Während des Trainings ermöglichen die optimierten Datenlader und die Speicherverwaltung YOLOv5 im Vergleich zu vielen Mitbewerbern größere Batch-Größen auf handelsüblichen GPUs, wodurch die Hardware-Barriere für KI-Ingenieure verringert wird.

Training und Ökosystem

Das Ökosystem rund um ein Modell ist oft genauso wichtig wie das Modell selbst. Hier Ultralytics einen entscheidenden Vorteil.

Benutzerfreundlichkeit und Dokumentation

YOLOv5 bekannt für seine „Zero-to-Hero”-Erfahrung. Ein Entwickler kann innerhalb weniger Minuten von der Installation der Bibliothek zum Training eines benutzerdefinierten Modells auf einem Datensatz wie VisDrone übergehen.

from ultralytics import YOLO

# Load a pretrained YOLO model (YOLOv5 or the newer YOLO26)
model = YOLO("yolov5s.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()

Im Vergleich dazu erfordert PP-YOLOE+ die Installation von PaddlePaddle das Klonen des PaddleDetection-Repositorys. Die Konfiguration umfasst häufig die Änderung mehrerer YAML-Dateien und die Navigation durch eine komplexere Verzeichnisstruktur, was für diejenigen, die an die Python-Einfachheit von Ultralytics gewöhnt sind, eine steilere Lernkurve bedeuten kann.

Vielseitigkeit und Aufgabenunterstützung

Während PP-YOLOE+ in erster Linie auf die Erkennung ausgerichtet ist, bietet das Ultralytics native Unterstützung für ein breiteres Spektrum an Bildverarbeitungsaufgaben innerhalb einer einzigen API:

Diese Vielseitigkeit ermöglicht es Entwicklern, zwischen Aufgaben zu wechseln, ohne neue Frameworks erlernen oder Datenpipelines neu schreiben zu müssen.

Anwendungen in der realen Welt

Wann PP-YOLOE+ wählen?

PP-YOLOE+ ist eine gute Wahl, wenn Ihre Infrastruktur bereits tief in die Technologieplattform von Baidu integriert ist. Für Nutzer in Regionen, in denen PaddlePaddle das dominierende Framework PaddlePaddle , oder für bestimmte serverseitige Bereitstellungen, bei denen mAP gegenüber der Einfachheit der Bereitstellung Vorrang mAP , bleibt PP-YOLOE+ eine praktikable Option.

Wann sollten Sie sich für Ultralytics YOLO entscheiden?

Für die überwiegende Mehrheit der Entwickler, Start-ups und Unternehmensteams weltweit Ultralytics YOLOv5 (und seine Nachfolger) die empfohlene Wahl, und zwar aus folgenden Gründen:

  1. Edge-Bereitstellung: Nahtloser Export nach TFLite, CoreML und OpenVINO sorgt dafür, dass Modelle auf Endbenutzergeräten effizient ausgeführt werden.
  2. Community-Support: Eine große, aktive Community trägt zu häufigen Updates bei, sodass Fehler behoben und regelmäßig neue Funktionen wie die automatische Annotation hinzugefügt werden.
  3. Ganzheitliche Plattform: Die Ultralytics vereinfacht den gesamten Lebenszyklus, von der Verwaltung von Datensätzen über das Modelltraining bis hin zur Cloud-Bereitstellung.

Die Zukunft: YOLO26 betritt die Bühne

YOLOv5 zwar YOLOv5 ein robustes und zuverlässiges Tool, doch der Bereich der Computervision entwickelt sich rasant weiter. Ultralytics kürzlich YOLO26eingeführt, das in puncto Effizienz und Leistung den absoluten Stand der Technik repräsentiert.

YOLO26 bietet gegenüber YOLOv5 PP-YOLOE+ mehrere bahnbrechende Verbesserungen:

  • End-to-End NMS: YOLO26 macht Non-Maximum Suppression (NMS) überflüssig, einen Nachbearbeitungsschritt, der die Inferenz verlangsamt. Das führt zu einer einfacheren Bereitstellungslogik und geringerer Latenz.
  • MuSGD-Optimierer: Inspiriert vom LLM-Training sorgt dieser hybride Optimierer für stabile Konvergenz und schnellere Trainingszeiten.
  • Verbesserte Erkennung kleiner Objekte: Durch ProgLoss und STAL (Task-Alignment Loss) zeichnet sich YOLO26 durch eine hervorragende Erkennung kleiner Objekte aus, was für Drohneninspektionen und die Präzisionslandwirtschaft von entscheidender Bedeutung ist.
  • 43 % schnellere CPU : Durch die Entfernung von Distribution Focal Loss (DFL) ist YOLO26 speziell für CPUs optimiert und damit die beste Wahl für kostengünstiges Edge-Computing.

Entwicklern, die 2026 neue Projekte starten, empfehlen wir dringend, YOLO26 zu evaluieren, um ihre Anwendungen mit den neuesten Fortschritten in der neuronalen Netzwerkarchitektur zukunftssicher zu machen.

Erfahren Sie mehr über YOLO26


Kommentare