Zum Inhalt springen

PP-YOLOE+ vs. YOLO26: Objektdetektion auf dem neuesten Stand der Technik

In der sich schnell entwickelnden Landschaft der Computervision ist die Auswahl der richtigen Objektdetektionsarchitektur entscheidend für das Gleichgewicht zwischen Genauigkeit, Geschwindigkeit und einfacher Bereitstellung. Dieser Vergleich untersucht PP-YOLOE+, eine verbesserte Version von PP-YOLOE von PaddlePaddle, und YOLO26, die neueste bahnbrechende, für den Einsatz am Rand optimierte Lösung von Ultralytics. Beide Modelle stellen bedeutende Meilensteine in der Echtzeitdetektion dar, sind jedoch auf unterschiedliche Ökosysteme und Bereitstellungsanforderungen zugeschnitten.

Visueller Leistungsvergleich

Die folgende Grafik veranschaulicht die Leistungsunterschiede zwischen PP-YOLOE+ und YOLO26 und hebt die Fortschritte hinsichtlich Latenz und Genauigkeit hervor, die durch die neuere Architektur erzielt wurden.

Modellübersicht

PP-YOLOE+

PP-YOLOE+ ist eine verbesserte Version von PP-YOLOE, die vom PaddlePaddle bei Baidu entwickelt wurde. Es baut auf dem ankerfreien Paradigma auf und führt eine einheitliche Cloud-Edge-Architektur ein, die auf verschiedenen Hardwareplattformen gut funktioniert. Der Schwerpunkt liegt auf der Optimierung des Kompromisses zwischen Präzision und Inferenzgeschwindigkeit, insbesondere innerhalb des PaddlePaddle .

Erfahren Sie mehr über PP-YOLOE+

YOLO26

YOLO26 ist die neueste Version der YOLO von Ultralytics, die entwickelt wurde, um die Effizienz für Edge-Computing neu zu definieren. Es wurde im Januar 2026 veröffentlicht und führt eine native End-to-End-Architektur NMS ein, wodurch die Nachbearbeitung mit Non-Maximum Suppression entfällt. Mit wichtigen Optimierungen wie der Entfernung von Distribution Focal Loss (DFL) und der Einführung des MuSGD-Optimierers wurde YOLO26 speziell für die Hochgeschwindigkeits-Inferenz auf CPUs und Geräten mit geringem Stromverbrauch entwickelt.

Erfahren Sie mehr über YOLO26

Technische Architektur und Innovation

Die architektonischen Unterschiede zwischen diesen beiden Modellen bestimmen ihre Eignung für bestimmte Aufgaben.

PP-YOLOE+-Architektur

PP-YOLOE+ verwendet ein CSPRepResNet-Backbone und ein Feature-Pyramid-Netzwerk (FPN) mit einem Pfadaggregationsnetzwerk (PAN) für die Fusion von Merkmalen auf mehreren Ebenen. Zu den wichtigsten Innovationen gehören:

  • Ankerfreies Design: Eliminiert die Hyperparameter-Optimierung der Ankerbox und vereinfacht so die Trainingspipeline.
  • Task Alignment Learning (TAL): Passt Klassifizierungs- und Lokalisierungsaufgaben explizit aneinander an und verbessert so die Qualität der Auswahl positiver Beispiele.
  • ET-Head: Ein effizienter, aufgabenorientierter Kopf, der den Rechenaufwand reduziert und gleichzeitig die Genauigkeit beibehält.

PP-YOLOE+ basiert jedoch auf NMS herkömmlichen NMS , die je nach Anzahl der in einer Szene erkannten Objekte zu Latenzschwankungen führen kann.

YOLO26 Innovation

YOLO26 steht für einen Paradigmenwechsel hin zur End-to-End-Erkennung.

  • NMS Design: Durch die Generierung von genau einer Vorhersage pro Objekt entfällt bei YOLO26 der NMS vollständig. Dies ist entscheidend für den Einsatz auf Edge-Geräten, bei denen die Nachverarbeitungslogik einen Engpass darstellen kann.
  • MuSGD Optimizer: Inspiriert vom Training großer Sprachmodelle (LLM) stabilisiert diese Mischung aus SGD Muon (von Moonshot AI) das Training und beschleunigt die Konvergenz.
  • ProgLoss + STAL: Die Integration von Progressive Loss und Soft Task Alignment Loss steigert die Leistung bei der Erkennung kleiner Objekte, einer häufigen Herausforderung in der Luftbildfotografie und Robotik, erheblich.
  • DFL-Entfernung: Durch das Entfernen von Distribution Focal Loss wird das Modelldiagramm vereinfacht, wodurch Exporte in Formate wie ONNX und TFLite sauberer und kompatibler mit verschiedenen Hardware-Beschleunigern.

Trainingsstabilität mit MuSGD

Der MuSGD-Optimierer in YOLO26 bringt die Stabilität des LLM-Trainings in die Computer Vision. Durch die adaptive Steuerung von Momentum und Gradienten reduziert er den Bedarf an umfangreicher Hyperparameter-Optimierung, sodass Anwender im Vergleich zu SGD AdamW in weniger Epochen eine optimale Genauigkeit erreichen können.

Leistungsmetriken

Die folgende Tabelle vergleicht die Leistung von PP-YOLOE+ und YOLO26 anhand des COCO .

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Wichtige Erkenntnisse:

  1. Effizienz: YOLO26-Modelle benötigen durchweg weniger FLOPs und Parameter für eine höhere Genauigkeit. So erreicht YOLO26x beispielsweise beeindruckende 57,5 mAP mit nur 55,7 Millionen Parametern, während PP-YOLOE+x 98,42 Millionen Parameter benötigt, um 54,7 mAP zu erreichen.
  2. Inferenzgeschwindigkeit: YOLO26 zeigt eine überragende Geschwindigkeit auf GPUs (T4 TensorRT), wobei das Nano-Modell nur 1,7 ms benötigt. Bemerkenswert ist auch die CPU , die CPU bis zu 43 % schnellere CPU als frühere Generationen bietet und somit ideal für Geräte ohne dedizierte Beschleuniger ist.
  3. Genauigkeit: Über alle Skalen hinweg, von Nano/Tiny bis Extra Large, übertrifft YOLO26 PP-YOLOE+ in mAP COCO .

Ökosystem und Benutzerfreundlichkeit

Bei der Auswahl eines Modells ist das umgebende Ökosystem genauso wichtig wie die reinen Kennzahlen.

Ultralytics Ökosystem-Vorteil

Ultralytics , darunter YOLO26, profitieren von einer einheitlichen, benutzerorientierten Plattform.

  • Optimierte API: Eine einheitliche Python ermöglicht Ihnen den nahtlosen Wechsel zwischen Erkennung, Segmentierung, Posenschätzung, Klassifizierung und OBB.
  • Ultralytics : Die Ultralytics bietet eine No-Code-Lösung für die Verwaltung von Datensätzen, die Kennzeichnung und das Training mit einem Klick in der Cloud.
  • Dokumentation: Umfassende und regelmäßig aktualisierte Dokumente führen Benutzer durch jeden Schritt, von der Installation bis zur Bereitstellung auf Edge-Geräten wie Raspberry Pi.
  • Speichereffizienz: YOLO26 ist so konzipiert, dass es während des Trainings speichereffizient ist und im Vergleich zu speicherintensiven Alternativen größere Batch-Größen auf handelsüblichen GPUs ermöglicht.

PaddlePaddle-Ökosystem

PP-YOLOE+ ist tief in das Baidu PaddlePaddle integriert. Es ist zwar leistungsstark, erfordert jedoch häufig eine spezielle Toolchain (PaddleDetection), deren Erlernen für Benutzer, die an PyTorch gewöhnt sind, mitunter eine steilere Lernkurve mit sich bringt. Es eignet sich hervorragend für Umgebungen, in denen PaddlePaddle (wie Baidu Kunlun-Chips) Priorität hat.

Anwendungsfälle und Anwendungen

Echtzeit-Edge-Analysen

Für Anwendungen, die auf Edge-Geräten wie Smart-Kameras oder Drohnen laufen, ist YOLO26 der klare Gewinner. Sein durchgängiges NMS Design gewährleistet eine vorhersehbare Latenz, was für Sicherheitssysteme von entscheidender Bedeutung ist. Durch die reduzierte FLOP-Anzahl kann es effizient auf batteriebetriebener Hardware ausgeführt werden.

Industrielle Automatisierung

In Fertigungsumgebungen, die eine hohe Präzision erfordern, wie beispielsweise bei der Qualitätsprüfung, sind beide Modelle geeignet. Die ProgLoss- Funktion von YOLO26 verbessert jedoch die Erkennung kleiner Fehler und bietet somit einen Vorteil bei der Erkennung winziger Mängel in Produktionslinien.

Komplexe Sehaufgaben

Während PP-YOLOE+ sich in erster Linie auf die Erkennung konzentriert, unterstützt YOLO26 standardmäßig ein breiteres Spektrum an Aufgaben.

Vielseitigkeit bei mehreren Aufgaben

Im Gegensatz zu PP-YOLOE+, das für verschiedene Aufgaben unterschiedliche Modellarchitekturen erfordert, Ultralytics Sie bei Ultralytics einfach den Aufgaben-Head ändern. Beispielsweise können Sie zu yolo26n-pose.pt ermöglicht sofort die Erkennung von Schlüsselpunkten mit derselben vertrauten API.

Codebeispiel: Erste Schritte mit YOLO26

Das Trainieren und Bereitstellen von YOLO26 ist dank der Ultralytics Python unglaublich einfach. Der folgende Codeausschnitt zeigt, wie ein vortrainiertes Modell geladen und eine Inferenz für ein Bild durchgeführt wird.

from ultralytics import YOLO

# Load the nano version of YOLO26 (NMS-free, highly efficient)
model = YOLO("yolo26n.pt")

# Perform inference on a remote image
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize the results
for result in results:
    result.show()  # Display predictions on screen
    result.save("output.jpg")  # Save annotated image to disk

Fazit

Sowohl PP-YOLOE+ als auch YOLO26 sind beeindruckende Beiträge zur Bildverarbeitung. PP-YOLOE+ bleibt eine solide Wahl für Teams, die bereits in die PaddlePaddle investiert haben.

Für die überwiegende Mehrheit der Entwickler und Forscher bietet Ultralytics jedoch ein überlegenes Paket. Seine End-to-End-Architektur vereinfacht die Bereitstellungspipelines, während seine hochmoderne Genauigkeit und rekordverdächtige Geschwindigkeit es zum vielseitigsten Modell für 2026 machen. In Verbindung mit der robusten Unterstützung des Ultralytics und Funktionen wie der Ultralytics reduziert YOLO26 die Zeit vom Konzept bis zur Produktion erheblich.

Für Nutzer, die sich für andere moderne Architekturen interessieren, behandelt die Dokumentation auch hervorragende Alternativen wie YOLO11 und das Transformer-basierte RT-DETR.


Kommentare