Zum Inhalt springen

YOLO11 PP-YOLOE+: Ein technischer Vergleich von Echtzeit-Detektoren

Die Auswahl der optimalen neuronalen Netzwerkarchitektur ist entscheidend, wenn Computer-Vision-Anwendungen in der Produktion eingesetzt werden. In diesem technischen Vergleich untersuchen wir zwei bekannte Modelle im Bereich der Echtzeit-Objekterkennung: Ultralytics YOLO11 und Baidus PP-YOLOE+. Beide Architekturen bieten eine robuste Leistung, gehen jedoch ganz unterschiedlich mit den Herausforderungen hinsichtlich Genauigkeit, Inferenzgeschwindigkeit und Entwickler-Ökosystem um.

Nachstehend finden Sie ein interaktives Diagramm, das die Leistungsgrenzen dieser Modelle veranschaulicht, damit Sie das für Ihre Hardwareanforderungen am besten geeignete Modell ermitteln können.

Modellursprünge und technische Abstammung

Das Verständnis der Ursprünge und Designphilosophien dieser Modelle liefert wertvolle Informationen über ihre jeweiligen Stärken und idealen Anwendungsfälle.

YOLO11

YOLO11 wurde von Ultralytics entwickelt und YOLO11 eine hochentwickelte Weiterentwicklung der YOLO YOLO11 , bei der ein Gleichgewicht zwischen hoher Inferenzgeschwindigkeit, extremer Parametereffizienz und unübertroffener Benutzerfreundlichkeit im Vordergrund steht. Es ist weithin bekannt für seine einheitlichen Multitasking-Fähigkeiten und seine entwicklerfreundliche Python .

Erfahren Sie mehr über YOLO11

PP-YOLOE+ Details

PP-YOLOE+ ist eine Weiterentwicklung von PP-YOLOv2, die auf dem PaddlePaddle basiert. Es führt architektonische Änderungen wie das CSPRepResNet-Backbone und Task Alignment Learning (TAL) ein, um die Grenzen der Genauigkeit insbesondere auf High-End-GPUs zu erweitern.

Erfahren Sie mehr über PP-YOLOE+

Architektonische Unterschiede

Die grundlegenden architektonischen Entwürfe von YOLO11 PP-YOLOE+ spiegeln ihre unterschiedlichen Prioritäten im Bereich der Computervision wider.

YOLO11 basiert auf einem hochoptimierten Backbone und einem ankerfreien Erkennungskopf. Es nutzt C3k2-Blöcke und Spatial Pyramid Pooling - Fast (SPPF), um Multi-Scale-Merkmale mit minimalem Rechenaufwand zu erfassen. Dieses Design ist äußerst vorteilhaft für die Reduzierung der Inferenzlatenz auf ressourcenbeschränkten Geräten wie Edge-NPUs und mobilen CPUs. Darüber hinaus YOLO11 nativ für das Multi-Task-Lernen ausgelegt und unterstützt sofort nach der Installation Instanzsegmentierung, Posenschätzung und OBB-Erkennung (Oriented Bounding Box).

PP-YOLOE+ führt das CSPRepResNet-Backbone und einen effizienten, aufgabenorientierten Kopf (ET-Head) ein. Es nutzt in hohem Maße Rep-Parametrisierungstechniken, um die Darstellungskapazität während des Trainings zu erhöhen, während diese Parameter für die Inferenz in Standardkonvolutionen integriert werden. Dies führt zwar zu einer beeindruckenden mittleren Präzision (mAP), jedoch sind die resultierenden Modelle in Bezug auf Parameter und Speicherbedarf tendenziell schwerer, sodass sie sich besser für den Einsatz auf robusten Server-GPUs als auf leichten Edge-Geräten eignen.

Vielseitigkeit bei mehreren Aufgaben

Wenn Ihr Projekt über Standard-Bounding-Boxes hinausgeht,YOLO11 Ultralytics YOLO11 native Unterstützung für Segmentierung, Posenschätzung und Klassifizierung innerhalb derselben API, wodurch der Entwicklungsaufwand im Vergleich zur Integration mehrerer unterschiedlicher Repositorys drastisch reduziert wird.

Performance und Benchmarks

Bei der Bewertung der Leistung betrachten wir die Genauigkeit (mAP), die Inferenzgeschwindigkeit auf verschiedenen Hardwarekomponenten und die Modelleffizienz (Parameter und FLOPs). Die folgende Tabelle zeigt die Vergleichskennzahlen, wobei die effizientesten oder leistungsstärksten Werte fett gedruckt sind.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Analyse

YOLO11 einen klaren Vorteil in Leistungsbilanz und Parametereffizienz. Zum Beispiel: YOLO11m erreicht einen höheren mAP 51,5) als PP-YOLOE+m (49,8) bei geringerer Anzahl von Parametern (20,1 Mio. gegenüber 23,43 Mio.) und deutlich schnelleren Inferenzgeschwindigkeiten auf TensorRT 4,7 ms gegenüber 5,56 ms). Die Leichtigkeit der YOLO11 führt naturgemäß zu geringeren Speicheranforderungen sowohl während Modelltraining und Bereitstellung.

Schulungsumfeld und Benutzerfreundlichkeit

Der wahre Wert eines Modells liegt oft darin, wie einfach Entwickler es anhand benutzerdefinierter Computer-Vision-Datensätze trainieren und in der Produktion einsetzen können.

Der Ultralytics Vorteil

Ultralytics eine optimierte Entwicklererfahrung. Das Training YOLO11 über eine einfache Python oder CLI verwaltet, wodurch komplexer Boilerplate-Code abstrahiert wird. Die Ultralytics verbessert dies noch weiter, indem sie No-Code-Training, automatisierte Datensatzverwaltung und Exporte mit einem einzigen Klick in Formate wie ONNX, CoreML und TensorRT.

Darüber hinaus sind YOLO während des Trainings äußerst speichereffizient, wodurch die für transformatorbasierte Architekturen oder schwergewichtige rep-parametrisierte Modelle typischen massiven VRAM-Overheads vermieden werden und das Training auf handelsüblicher Hardware möglich ist.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

PP-YOLOE+ Ökosystem

PP-YOLOE+ arbeitet innerhalb des PaddleDetection-Ökosystems. Dieses Framework ist zwar leistungsstark und tief in die industriellen Lösungen von Baidu integriert, erfordert jedoch von Entwicklern die Verwendung des spezifischen PaddlePaddle . Dies kann für Teams, die bereits auf PyTorch standardisiert sind, eine steilere Lernkurve bedeuten. Darüber hinaus kann der Export von PP-YOLOE+-Modellen in standardisierte universelle Formate für Edge-Geräte im Vergleich zu den nativen Export-Pipelines in Ultralytics zusätzliche Konvertierungsschritte erfordern.

Ideale Anwendungsfälle

Die Wahl zwischen diesen Modellen hängt von Ihrer spezifischen Einsatzumgebung ab.

  • Entscheiden Sie sich für YOLO11 für agile Entwicklung, Edge-Computing und mobile Anwendungen. Dank seiner hohen Inferenzgeschwindigkeit, seines geringen Speicherbedarfs und seiner umfangreichen Exportfunktionen eignet es sich ideal für Aufgaben wie die Echtzeit-Bestandsverwaltung im Einzelhandel auf Standard-CPUs, die Analyse von Drohnen-Luftbildaufnahmen und komplexe Multitasking-Pipelines.
  • Wählen Sie PP-YOLOE+, wenn Ihre gesamte Produktionspipeline bereits stark in das PaddlePaddle investiert ist oder wenn Sie auf hochwertigen, dedizierten Inferenzservern bereitstellen, bei denen Speicherbeschränkungen und Hardwarekompatibilität (außerhalb der optimierten Hardware von Paddle) keine vorrangigen Probleme darstellen.

Die nächste Generation: Vorstellung von YOLO26

YOLO11 zwar YOLO11 unglaublich leistungsstark, doch die KI-Branche entwickelt sich rasant weiter. Für absolute Spitzenleistung in der Objekterkennung Ultralytics das neue YOLO26eingeführt. YOLO26 wurde im Januar 2026 veröffentlicht und baut auf den Erfolgen seiner Vorgänger auf, um eine beispiellose Effizienz und Genauigkeit zu bieten.

Wichtige Innovationen von YOLO26:

  • End-to-End-Design NMS: YOLO26 macht die Nachbearbeitung mit Non-Maximum Suppression (NMS) überflüssig. Dies beschleunigt die Inferenz erheblich und vereinfacht die Bereitstellungslogik – ein architektonischer Sprung, der erstmals in YOLOv10eingeführt wurde.
  • Bis zu 43 % schnellere CPU : Speziell für Edge-Geräte ohne GPUs optimiert, um Echtzeitleistung auf Hardware mit geringer Leistung zu gewährleisten.
  • MuSGD-Optimierer: Inspiriert von der Stabilität des LLM-Trainings sorgt diese Mischung aus SGD Muon für eine schnellere Konvergenz und ein stabileres Training.
  • ProgLoss + STAL: Verbesserte Verlustfunktionen verbessern die Erkennung kleiner Objekte erheblich, was für Drohnenanwendungen und Sicherheitsüberwachung von entscheidender Bedeutung ist.
  • DFL-Entfernung: Die Entfernung von Distribution Focal Loss vereinfacht den Modellexport und verbessert die Kompatibilität mit einer Vielzahl von Edge-Geräten erheblich.

Für neue Projekte, bei denen Geschwindigkeit, nahtloser Export und maximale Genauigkeit im Vordergrund stehen, empfehlen wir dringend, die Funktionen von YOLO26 über die Ultralytics zu nutzen.

Wenn Sie andere Architekturen evaluieren, könnte Sie auch ein Vergleich von YOLO11 RT-DETR oder zu untersuchen, wie sich das ältere YOLOv8 in modernen Benchmarks abschneidet.


Kommentare