Zum Inhalt springen

YOLOv5 . PP-YOLOE+: Ein technischer Vergleich von Echtzeit-Objektdetektoren

Die Auswahl der optimalen Architektur für die Objekterkennung ist eine wichtige Entscheidung, die sich auf die Effizienz, Genauigkeit und Skalierbarkeit von Computer-Vision-Anwendungen auswirkt. Dieser Leitfaden enthält einen detaillierten technischen Vergleich zwischen YOLOv5, dem weltweit anerkannten Standard für barrierefreie KI, und PP-YOLOE+, einer sich weiterentwickelnden Architektur aus dem PaddlePaddle .

Während PP-YOLOE+ interessante ankerfreie Konzepte einführt, YOLOv5 bleibt aufgrund seines unvergleichlichen Ökosystems, seiner Robustheit und seiner Ausgewogenheit zwischen Geschwindigkeit und Genauigkeit eine dominierende Kraft. Für Entwickler, die in die Zukunft blicken, gehen wir auch auf YOLO26 ein, das mit NMS Inferenz die neueste Leistungsstufe definiert.

Leistungsmetriken und Benchmarks

Der Kompromiss zwischen mittlerer durchschnittlicher Präzision (mAP) und Inferenzlatenz bestimmt den Nutzen eines Modells. Die folgende Tabelle vergleicht die Leistung von YOLOv5 der von PP-YOLOE+ anhand des COCO .

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Ultralytics YOLOv5 –YOLOv5

Veröffentlicht im Jahr 2020 von Glenn Jocher und Ultralyticsveröffentlicht, YOLOv5 revolutionierte das Feld, indem es die leistungsstarke Objekterkennung für alle zugänglich machte. Nativ in PyTorchentwickelt, legte es den Schwerpunkt auf „Start-to-Finish”-Benutzerfreundlichkeit, sodass Entwickler in Rekordzeit vom Datensatz zur Bereitstellung gelangen können.

Architektur und Design

YOLOv5 ein CSPDarknet-Backbone (Cross Stage Partial Network), um den Gradientenfluss zu maximieren und gleichzeitig den Rechenaufwand zu minimieren. Es verwendet einen ankerbasierten Erkennungskopf, der vordefinierte Ankerboxen verwendet, um Objektpositionen vorherzusagen. Dieser Ansatz hat sich in der Praxis bewährt und bietet eine stabile Konvergenz über eine Vielzahl von Datensätzen hinweg, von Luftbildern bis hin zu medizinischen Scans.

Hauptvorteile

  • Produktionsreife: YOLOv5 weltweit in Millionen von Anwendungen eingesetzt und gewährleistet höchste Stabilität.
  • Vielseitigkeit: Über die Erkennung hinaus unterstützt es nativ die Instanzsegmentierung und Bildklassifizierung.
  • Exportierbarkeit: Das Modell bietet einen nahtlosen Export zu ONNX, TensorRT, CoreML und TFLite verschiedene Hardware-Ziele.

Erfahren Sie mehr über YOLOv5

PP-YOLOE+ Übersicht

PP-YOLOE+ ist eine Weiterentwicklung von PP-YOLOE, das von den PaddlePaddle bei Baidu entwickelt wurde. Es wurde im April 2022 veröffentlicht und konzentriert sich auf die Verbesserung des ankerfreien Mechanismus und die Verfeinerung der Backbone-Architektur für Hochleistungsrechnerumgebungen.

Architektur und Design

PP-YOLOE+ verwendet ein ankerfreies Paradigma, wodurch die Notwendigkeit der Hyperparameter-Optimierung für Ankerboxen entfällt. Es nutzt ein CSPRepResStage-Backbone, das Restverbindungen mit Reparametrisierungstechniken (RepVGG-Stil) kombiniert, um die Inferenz zu beschleunigen und gleichzeitig die Merkmalsextraktionsfähigkeit beizubehalten. Außerdem wird Task Alignment Learning (TAL) eingesetzt, um Klassifizierungs- und Lokalisierungsaufgaben während des Trainings besser aufeinander abzustimmen.

Überlegungen zum Anwendungsfall

PP-YOLOE+ erzielt zwar mAP hohen mAP COCO , ist jedoch eng mit dem PaddlePaddle verbunden. Dies kann für Teams, deren Infrastruktur auf Standard PyTorch TensorFlow basiert, eine Herausforderung darstellen. Seine größte Stärke liegt in Szenarien, in denen maximale Genauigkeit Vorrang vor Flexibilität bei der Bereitstellung oder einfacher Schulung hat.

Erfahren Sie mehr über PP-YOLOE+

Detaillierter technischer Vergleich

1. Trainingsmethodik und Benutzerfreundlichkeit

Einer der entscheidenden Unterschiede liegt in der Benutzererfahrung. YOLOv5 ist bekannt für seinen „Zero to Hero”-Workflow. Das Ultralytics automatisiert komplexe Aufgaben wie Datenvergrößerung (Mosaic, MixUp) und Hyperparameter-Entwicklung.

  • YOLOv5: Verwendet eine intuitive Befehlszeilenschnittstelle (CLI) oder Python . Es führt Ankerbox-Berechnungen automatisch mit AutoAnchor durch und stellt so sicher, dass sich das Modell ohne manuelles Eingreifen an benutzerdefinierte Datensätze anpasst.
  • PP-YOLOE+: Basiert auf dem Konfigurationssystem PaddleDetection. Es ist zwar leistungsstark, erfordert jedoch oft ein tieferes Verständnis der spezifischen Konfigurationsdateien und des PaddlePaddle , was für viele Entwickler eine steilere Lernkurve bedeutet.

2. Inferenzgeschwindigkeit und Bereitstellung

YOLOv5 durch CPU YOLOv5 und ist damit die beste Wahl für Edge-KI-Anwendungen auf Geräten wie Raspberry Pi oder Mobiltelefonen. Wie in der Tabelle dargestellt, erreicht das Modell YOLOv5n (Nano) unglaubliche Geschwindigkeiten, die für die Echtzeitverfolgung entscheidend sind.

PP-YOLOE+ konzentriert sich stark auf GPU unter Verwendung von TensorRT. Während es auf Server-Hardware (wie der GPU) gute Leistungen erbringt, fehlt ihm im Vergleich zur hochoptimierten Ultralytics oft die fürGPU erforderliche leichtgewichtige Optimierung.

3. Speichereffizienz

Ultralytics sind auf Speichereffizienz ausgelegt. Der Trainingsprozess YOLOv5 ist für die Ausführung auf handelsüblichen GPUs optimiert, wodurch der Zugang zu KI demokratisiert wird. Im Gegensatz dazu erfordern neuere transformatorbasierte oder komplexe Architekturdesigns oft erheblichen CUDA , was die Einstiegshürde erhöht. Die ausgewogene Architektur YOLOv5 sorgt dafür, dass die Merkmalsextraktion robust bleibt, ohne dass unnötig viele Parameter erforderlich sind.

Anwendungen in der realen Welt

  • YOLOv5 ist aufgrund seiner Fähigkeit, auf Edge-Geräten an abgelegenen Standorten oder in Geschäften ohne dedizierte Server zu laufen, die erste Wahl für Agrartechnologie (z. B. Erkennung von Pflanzenkrankheiten) und Einzelhandelsanalysen.
  • PP-YOLOE+ eignet sich häufig für industrielle Inspektionen in kontrollierten Umgebungen, in denen leistungsstarke GPU zur Verfügung stehen, um die etwas aufwendigeren Berechnungen für geringfügige Genauigkeitsgewinne durchzuführen.

Workflow-Tipp: Der Ultralytics

Wenn Sie Ultralytics verwenden, erhalten Sie Zugriff auf die Ultralytics . Diese einheitliche Schnittstelle ermöglicht es Ihnen, Datensätze zu verwalten, in der Cloud zu trainieren und mit einem einzigen Klick in jedem beliebigen Format (ONNX, TFLite usw.) bereitzustellen, wodurch sich der MLOps-Aufwand im Vergleich zur Verwaltung von Roh-Framework-Skripten erheblich reduziert.

Die Zukunft: Upgrade auf YOLO26

YOLOv5 zwar ein legendäres Modell, doch der Bereich hat sich weiterentwickelt. Entwicklern, die nach der absolut besten Leistung suchen, empfehlen wir YOLO26.

YOLO26 steht mit seinem End-to-End-Design NMS für einen Paradigmenwechsel. Durch den Verzicht auf Non-Maximum Suppression (NMS) reduziert YOLO26 die Inferenzlatenz und die Komplexität der Bereitstellung. Weitere Merkmale sind:

  • MuSGD Optimizer: Eine Mischung aus SGD Muon für Trainingsstabilität auf LLM-Niveau.
  • Bis zu 43 % schnellere CPU : Speziell für Edge-Computing optimiert.
  • ProgLoss + STAL: Erweiterte Verlustfunktionen, die die Erkennung kleiner Objekte verbessern, ein kritischer Bereich für Drohnen- und IoT-Anwendungen.

Erfahren Sie mehr über YOLO26

Einfaches Upgrade

Die Migration von YOLOv5 neueren Ultralytics ist dank der einheitlichen Python mühelos.

from ultralytics import YOLO

# Load the latest YOLO26 model (auto-downloads pretrained weights)
model = YOLO("yolo26n.pt")

# Run inference on an image
# The API remains consistent, allowing easy upgrades
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

Fazit

Beide Architekturen haben ihre Vorzüge. PP-YOLOE+ bietet eine starke theoretische Leistung beim COCO für GPU Workloads. Allerdings YOLOv5 bleibt der Champion in Sachen Benutzerfreundlichkeit, Flexibilität bei der Bereitstellung und Edge-Leistung.

Für die meisten Entwickler und Forscher garantiert die Nutzung des Ultralytics langfristige Wartbarkeit und Zugang zu den neuesten Durchbrüchen. Ganz gleich, ob Sie beim zuverlässigen YOLOv5 bleiben YOLOv5 auf das hochmoderne YOLO26upgraden, profitieren Sie von einer gemeinschaftsorientierten, hochoptimierten Plattform, die für den Erfolg in der Praxis entwickelt wurde.

Um weitere Optionen zu erkunden, sollten Sie Folgendes in Betracht ziehen YOLO11 oder spezialisierte Modelle wie RT-DETR für transformatorbasierte Genauigkeit.


Kommentare