Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 im Vergleich zu PP-YOLOE+#

Die Wahl der richtigen neuronalen Netzwerkarchitektur ist für jedes moderne Computer-Vision-Projekt essenziell. Wenn Entwickler und Forscher Modelle für die Echtzeit-Objekterkennung evaluieren, läuft die Entscheidung oft auf eine Abwägung zwischen Genauigkeit, Inferenzgeschwindigkeit und Bereitstellungsfreundlichkeit hinaus. Dieser technische Vergleich untersucht YOLOv5 und PP-YOLOE+, erforscht deren Architekturen, Leistungskennzahlen und Trainingsmethoden, um dir bei der Auswahl der optimalen Lösung für deine Anwendung zu helfen.

Link to this sectionDie Architekturen verstehen#

Beide Modelle haben die Landschaft der Vision AI maßgeblich beeinflusst, gehen jedoch die Herausforderungen der Objekterkennung durch unterschiedliche strukturelle Methoden und Framework-Abhängigkeiten an.

Link to this sectionUltralytics YOLOv5: Der Industriestandard#

Das Mitte 2020 veröffentlichte Ultralytics YOLOv5 hat die Zugänglichkeit modernster Vision-Modelle revolutioniert. Als erste native PyTorch-Implementierung in der YOLO-Familie hat es die Eintrittshürde für Python-Entwickler und ML-Ingenieure weltweit drastisch gesenkt.

YOLOv5 Details:

YOLOv5 verwendet ein modifiziertes CSPDarknet-Backbone, das effizient reichhaltige Merkmalsrepräsentationen erfasst und dabei eine geringe Parameteranzahl beibehält. Es führte automatisch lernende Anker-Boxen ein, die vor Trainingsbeginn automatisch die optimalen Anker-Dimensionen für benutzerdefinierte Datensätze berechnen. Zudem verbessert die Integration von Mosaic-Datenerweiterung die Fähigkeit des Modells, kleinere Objekte zu erkennen und über komplexe räumliche Kontexte hinweg zu generalisieren.

Eine der größten Stärken von YOLOv5 ist seine unglaubliche Vielseitigkeit. Im Gegensatz zu Standard-Objekterkennungen unterstützt die YOLOv5-Familie nahtlos Bildklassifizierung, Instanz-Segmentierung und Bounding-Box-Erkennung innerhalb einer einheitlichen API. Seine hochoptimierte Architektur führt im Vergleich zu schwerfälligen Transformer-basierten Netzwerken auch zu einem wesentlich geringeren Speicherbedarf während des Trainings und der Inferenz.

Erfahre mehr über YOLOv5

Link to this sectionPP-YOLOE+: Der Herausforderer aus dem PaddlePaddle-Ökosystem#

Das etwa zwei Jahre später eingeführte PP-YOLOE+ baut auf dem Fundament früherer PP-YOLO-Iterationen auf. Es wurde entwickelt, um die Fähigkeiten des Deep-Learning-Frameworks von Baidu zu demonstrieren, und führt mehrere architektonische Verfeinerungen zur Steigerung der mittleren durchschnittlichen Präzision (mAP) ein.

PP-YOLOE+ Details:

PP-YOLOE+ basiert auf einem ankerfreien Paradigma und verwendet ein CSPRepResNet-Backbone. Es integriert eine leistungsstarke Task Alignment Learning-Technik sowie einen Efficient Task-aligned Head zur Verbesserung der Präzision. Während PP-YOLOE+ beeindruckende Genauigkeitswerte erreicht, liegt seine Hauptschwäche in der strikten Abhängigkeit vom PaddlePaddle-Framework. Dies führt für Forschungsteams und Unternehmen, die bereits stark in PyTorch- oder TensorFlow-Umgebungen investiert sind, oft zu einer steilen Lernkurve und Reibungsverlusten im Ökosystem.

Erfahre mehr über PP-YOLOE+

Link to this sectionLeistung und Benchmarks#

Bei der Evaluierung dieser Modelle für die Produktion ist das Verständnis der Zielkonflikte zwischen Präzision, Inferenzgeschwindigkeit und Parameter-Footprint entscheidend. Die folgende Tabelle gibt einen Überblick über die wichtigsten Leistungskennzahlen über verschiedene Größenvarianten hinweg.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049,0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Während PP-YOLOE+ hohe Genauigkeitsgrenzen erreicht, zeigt YOLOv5 konsistent eine überlegene Parametereffizienz und schnellere Inferenz auf Hardware mit begrenzten Ressourcen. Für Edge-Bereitstellungen, bei denen der Speicher knapp ist, bietet YOLOv5n eine unübertroffene Geschwindigkeit und einen extrem geringen Platzbedarf.

Speichereffizienz

Ultralytics-Modelle sind speziell auf Trainingseffizienz ausgelegt. Im Vergleich zu schweren Vision-Transformern wie RT-DETR verwendet YOLOv5 deutlich weniger CUDA-Speicher, was es dir ermöglicht, mit größeren Batch-Größen oder auf handelsüblicher Hardware zu trainieren.

Link to this sectionDer Ultralytics-Vorteil: Ökosystem und Benutzerfreundlichkeit#

Der wahre Wert einer Machine-Learning-Architektur geht über reine Zahlen hinaus; er umfasst die gesamte Entwicklererfahrung. Die Ultralytics Platform und die dazugehörigen Open-Source-Tools bieten ein hochgradig verfeinertes, gut gewartetes Ökosystem, das Entwicklungszyklen drastisch beschleunigt.

  • Benutzerfreundlichkeit: Ultralytics abstrahiert komplexen Boilerplate-Code. Du kannst Modelle über eine intuitive Python API oder CLI trainieren, validieren und testen.
  • Bereitstellungsflexibilität: Das Exportieren von Modellen ist unglaublich einfach. Mit einem einzigen Befehl kannst du deine trainierten YOLOv5-Gewichte in Formate wie ONNX, TensorRT oder OpenVINO konvertieren und so eine breite Kompatibilität über Edge- und Cloud-Umgebungen hinweg sicherstellen.
  • Aktive Community: Die lebendige Community garantiert häufige Updates, eine umfangreiche Dokumentation und robuste Lösungen für gängige Herausforderungen in der Computer Vision.

Im Gegensatz dazu stützt sich PP-YOLOE+ stark auf komplexe Konfigurationsdateien, die spezifisch für PaddleDetection sind, was die schnelle Prototypenentwicklung verlangsamen und die Integration in moderne MLOps-Pipelines erschweren kann.

Link to this sectionPraktische Implementierungen und Codebeispiele#

Der Einstieg in Ultralytics ist bemerkenswert einfach. Hier ist ein vollständiges, ausführbares Beispiel, wie man ein vortrainiertes YOLOv5-Modell lädt, es auf einem benutzerdefinierten Datensatz trainiert und die Ergebnisse exportiert:

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset for 50 epochs
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on a sample image
predict_results = model("https://ultralytics.com/images/bus.jpg")

# Export the optimized model to ONNX format
path = model.export(format="onnx")

Link to this sectionAnwendungsfälle und Empfehlungen#

Die Wahl zwischen YOLOv5 und PP-YOLOE+ hängt von deinen spezifischen Projektanforderungen, Bereitstellungsbeschränkungen und Präferenzen für das Ökosystem ab.

Link to this sectionWann du YOLOv5 wählen solltest#

YOLOv5 ist eine starke Wahl für:

  • Bewährte Produktionssysteme: Bestehende Bereitstellungen, bei denen die langjährige Stabilität, die umfangreiche Dokumentation und die massive Community-Unterstützung von YOLOv5 geschätzt werden.
  • Ressourcenbegrenztes Training: Umgebungen mit begrenzten GPU-Ressourcen, in denen die effiziente Trainings-Pipeline und der geringere Speicherbedarf von YOLOv5 von Vorteil sind.
  • Umfangreiche Unterstützung von Exportformaten: Projekte, die eine Bereitstellung über viele Formate hinweg erfordern, einschließlich ONNX, TensorRT, CoreML und TFLite.

Link to this sectionWann man PP-YOLOE+ wählen sollte#

PP-YOLOE+ wird empfohlen für:

  • PaddlePaddle-Ökosystem-Integration: Organisationen mit bestehender Infrastruktur, die auf dem Baidu PaddlePaddle-Framework und zugehörigen Tools basiert.
  • Paddle Lite Edge-Deployment: Deployment auf Hardware mit hochoptimierten Inferenz-Kernels, speziell für die Paddle Lite- oder Paddle-Inferenz-Engine.
  • Hochpräzise Serverseitige Erkennung: Szenarien, die maximale Erkennungsgenauigkeit auf leistungsstarken GPU-Servern priorisieren, wobei Framework-Abhängigkeiten kein Problem darstellen.

Link to this sectionWann du Ultralytics wählen solltest (YOLO26)#

Für die meisten neuen Projekte bietet Ultralytics YOLO26 die beste Kombination aus Leistung und Entwicklererfahrung:

  • NMS-freies Edge-Deployment: Anwendungen, die eine konsistente Inferenz mit niedriger Latenz ohne die Komplexität der Non-Maximum Suppression-Nachverarbeitung erfordern.
  • Umgebungen nur mit CPU: Geräte ohne dedizierte GPU-Beschleunigung, bei denen die bis zu 43 % schnellere CPU-Inferenz von YOLO26 einen entscheidenden Vorteil bietet.
  • Erkennung kleiner Objekte: Anspruchsvolle Szenarien wie Luftaufnahmen von Drohnen oder die Analyse von IoT-Sensoren, bei denen ProgLoss und STAL die Genauigkeit bei winzigen Objekten deutlich steigern.

Link to this sectionAlternative moderne Modelle, die in Betracht gezogen werden sollten#

Während YOLOv5 ein robuster und bewährter Standard ist, entwickelt sich das Feld der Computer Vision schnell weiter. Für Teams, die neue Projekte starten, empfehlen wir dringend, unsere neueren Architekturen zu erkunden.

Link to this sectionUltralytics YOLO26#

Das im Januar 2026 veröffentlichte YOLO26 repräsentiert den absoluten Höhepunkt unserer Forschung. Es liefert massive Verbesserungen sowohl in der Genauigkeit als auch in der Geschwindigkeit. Zu den wichtigsten Innovationen gehören:

  • End-to-End NMS-freies Design: Basierend auf Konzepten von YOLOv10 eliminiert YOLO26 nativ die Non-Maximum Suppression (NMS)-Nachbearbeitung, reduziert die Latenz und vereinfacht die Bereitstellungslogik.
  • DFL-Entfernung: Durch das Entfernen des Distribution Focal Loss erreicht YOLO26 eine bis zu 43 % schnellere CPU-Inferenz, was es unglaublich leistungsstark für Edge-Geräte mit geringem Stromverbrauch macht.
  • MuSGD Optimizer: Inspiriert von fortschrittlichen LLM-Trainingstechniken stellt dieser Hybrid aus SGD und Muon außergewöhnlich stabile Trainingsläufe und eine schnellere Konvergenz sicher.
  • ProgLoss + STAL: Diese fortschrittlichen Loss-Funktionen liefern bemerkenswerte Verbesserungen bei der Erkennung kleiner Objekte, was entscheidend für Drohnenbilder und intelligente Landwirtschaft ist.

Zusätzlich könntest du YOLO11 in Betracht ziehen, das eine exzellente Leistung bietet und als äußerst zuverlässige Brücke zwischen Altsystemen und den bahnbrechenden Fähigkeiten von YOLO26 dient.

Link to this sectionAnwendungsfälle aus der Praxis#

Die Wahl zwischen YOLOv5 und PP-YOLOE+ hängt letztendlich von deiner Bereitstellungsumgebung und den Projektbeschränkungen ab.

Ideale YOLOv5-Anwendungen: Der minimale Ressourcenbedarf und die unglaubliche Benutzerfreundlichkeit von YOLOv5 machen es zur ersten Wahl für Edge AI. Es glänzt in Anwendungen, die hohe Bildraten auf begrenzter Hardware erfordern, wie z. B. Echtzeit-Robotik, Integration in mobile Anwendungen und Verkehrskontrollsysteme mit mehreren Kameras. Die Fähigkeit, gleichzeitig Pose Estimation und Oriented Bounding Box (OBB)-Aufgaben innerhalb desselben Frameworks zu handhaben, macht es äußerst anpassungsfähig.

Ideale PP-YOLOE+-Anwendungen: PP-YOLOE+ eignet sich am besten für Szenarien, in denen eine absolut maximale Genauigkeit bei statischen Bildern gegenüber Echtzeit-Verarbeitungsbeschränkungen priorisiert wird. Es findet Nischenanwendungen in industriellen Inspektions-Pipelines, insbesondere in asiatischen Fertigungssektoren, die über etablierte technische Stacks verfügen, die stark in das Ökosystem von Baidu und PaddlePaddle investiert sind.

Zusammenfassend lässt sich sagen, dass PP-YOLOE+ zwar starke Präzisions-Benchmarks liefert, die YOLO-Modelle von Ultralytics jedoch eine unübertroffene Kombination aus Leistungsbalance, nahtloser Bereitstellung und entwicklerfreundlichem Design bieten, die erfolgreiche Computer-Vision-Projekte vom Konzept bis zur Produktion vorantreibt.

Mitwirkende

Kommentare