Modellvergleich: PP-YOLOE+ vs. YOLO11 für die Objekterkennung
Bei der Auswahl eines Computer-Vision-Modells für die Objekterkennung ist es wichtig, die Stärken und Schwächen der verschiedenen Architekturen zu kennen. Auf dieser Seite finden Sie einen detaillierten technischen Vergleich zwischen PP-YOLOE+ und Ultralytics YOLO11, zwei Modellen auf dem neuesten Stand der Technik, um eine fundierte Entscheidung treffen zu können.
Ultralytics YOLO11: Effizienz und Vielseitigkeit auf dem neuesten Stand der Technik
Ultralytics YOLO11, verfasst von Glenn Jocher und Jing Qiu von Ultralytics und am 27.09.2024 veröffentlicht, ist die neueste Version der hochgelobten YOLO . Sie wurde für die Objekterkennung in Echtzeit entwickelt und zeichnet sich durch ein ausgewogenes Verhältnis von Geschwindigkeit und Genauigkeit bei verschiedenen Anwendungen aus. YOLO11 baut auf den früheren YOLO auf und führt architektonische Verbesserungen ein, um die Leistung und Vielseitigkeit bei Aufgaben wie Bildklassifizierung, Instanzsegmentierung und Posenschätzung zu verbessern.
Architektur und Hauptmerkmale
YOLO11 behält das einstufige, ankerfreie Erkennungsparadigma bei, wobei die Geschwindigkeit der Schlussfolgerungen im Vordergrund steht. Zu den wichtigsten architektonischen Merkmalen gehören:
- Effizientes Backbone: Ein schlankes Backbone für die schnelle Merkmalsextraktion.
- Skalierbarkeit: Erhältlich in verschiedenen Größen (n, s, m, l, x) für unterschiedliche Rechenanforderungen und Einsatzumgebungen, von Edge-Geräten wie NVIDIA Jetson bis zu Cloud-Servern.
- Vielseitigkeit: Unterstützt verschiedene Computer-Vision-Aufgaben, die über die Objekterkennung hinausgehen, und bietet eine flexible Lösung innerhalb des Ultralytics .
Leistungsmetriken
YOLO11 zeichnet sich durch ein ausgewogenes Verhältnis von Geschwindigkeit und Genauigkeit aus und ist daher für Echtzeitanwendungen geeignet.
- mAP: Erzielt die beste durchschnittliche Genauigkeit (mAP) bei Datensätzen wie COCO. Einzelheiten zu mAP und anderen Bewertungsmetriken finden Sie im YOLO Performance Metrics Guide.
- Inferenzgeschwindigkeit: Optimiert für eine schnelle Inferenz, die für Echtzeitverarbeitungsanforderungen, wie sie bei der Bildverarbeitung in Streaming-Anwendungen auftreten, entscheidend ist.
- Modellgröße: Behält eine kompakte Modellgröße bei, was den Einsatz auf Geräten mit eingeschränkten Ressourcen erleichtert.
Stärken und Schwächen
Stärken:
- Vielseitig und genau: Hervorragend geeignet für verschiedene Bildverarbeitungsaufgaben, mit hoher Genauigkeit und Geschwindigkeit.
- Benutzerfreundliches Ökosystem: Nahtlose Integration in das Ultralytics , mit umfassenden Python und CLI .
- Skalierbarer Einsatz: Mehrere Modellgrößen gewährleisten die Anpassungsfähigkeit an unterschiedliche Hardware.
Schwachstellen:
- Berechnungsaufwand: Größere Modelle können rechenintensiv sein und erfordern leistungsstarke Hardware für eine optimale Echtzeitleistung.
- Komplexität für neue Benutzer: Die Feinabstimmung und das Verständnis für die Feinheiten der Architektur sind zwar benutzerfreundlich, können aber für neue Benutzer im Bereich der Computer Vision eine Lernkurve darstellen.
Ideale Anwendungsfälle
YOLO11 eignet sich hervorragend für Anwendungen, die eine Objekterkennung in Echtzeit mit hoher Genauigkeit erfordern:
- Videoanalyse in Echtzeit: Anwendungen wie Warteschlangenmanagement und Sicherheitssysteme profitieren von seiner Geschwindigkeit und Präzision.
- Edge AI-Einsatz: Effiziente On-Device-Verarbeitung auf Plattformen wie Raspberry Pi.
- Autonome Systeme: Ideal für selbstfahrende Autos und Roboter, die eine schnelle und genaue Wahrnehmung erfordern, wie in der Vision AI in selbstfahrenden Anwendungen hervorgehoben wird.
PP-YOLOE+: Genauigkeitsorientiert und effizient
PP-YOLOE+ (Practical YOLO with Evolved Enhancement), entwickelt von den PaddlePaddle bei Baidu und veröffentlicht am 02.04.2022, ist für eine hochpräzise Objekterkennung mit angemessener Effizienz konzipiert. Es handelt sich um eine verbesserte Version der PP-YOLOE-Serie, die sich auf industrielle Anwendungen konzentriert, bei denen Präzision an erster Stelle steht. PP-YOLOE+ stellt die Genauigkeit in den Vordergrund, ohne die Geschwindigkeit der Inferenz signifikant zu beeinträchtigen, und ist Teil des PaddleDetection-Modells zoo.
Architektur und Hauptmerkmale
PP-YOLOE+ verfolgt außerdem einen verankerungsfreien Ansatz, bei dem Genauigkeit und Effizienz im Vordergrund stehen. Die wichtigsten Merkmale sind:
- Hochpräziser Fokus: Die Architektur wurde verfeinert, um bei der Objekterkennung eine hohe Genauigkeit zu erzielen.
- Effizientes Design: Ausgewogene Genauigkeit und effiziente Ableitungsgeschwindigkeit, geeignet für anspruchsvolle Anwendungen.
- PaddlePaddle : Nutzt das PaddlePaddle Deep Learning Framework und profitiert von dessen Optimierungen und Ökosystem.
Leistungsmetriken
PP-YOLOE+ zeichnet sich durch hohe Genauigkeit bei gleichzeitig wettbewerbsfähiger Geschwindigkeit aus:
- Hohe mAP: Erzielt eine hohe mittlere Genauigkeit (Mean Average Precision, mAP) und zeigt eine hohe Genauigkeit bei Benchmark-Datensätzen wie COCO, wie in der PP-YOLOE+-Dokumentation beschrieben.
- Effiziente Inferenz: Bietet ein gutes Gleichgewicht zwischen Genauigkeit und Inferenzgeschwindigkeit und eignet sich für industrielle Anwendungen, die eine Echtzeitanalyse erfordern.
- Modellgröße: Bietet verschiedene Modellgrößen, um unterschiedliche Rechenressourcen zu berücksichtigen.
Erfahren Sie mehr über PP-YOLOE+
Stärken und Schwächen
Stärken:
- Außergewöhnliche Genauigkeit: Der Schwerpunkt liegt auf einer hohen Erkennungsgenauigkeit, die für präzisionskritische Anwendungen wie die Qualitätsprüfung in der Fertigung entscheidend ist.
- Industrieller Fokus: Gut geeignet für industrielle Umgebungen, die eine zuverlässige und genaue Objekterkennung erfordern.
- PaddlePaddle : Nutzen Sie das Ökosystem und die Optimierungen des PaddlePaddle .
Schwachstellen:
- Ökosystem-Lock-in: In erster Linie innerhalb des PaddlePaddle , was für Benutzer, die tief in andere Frameworks wie PyTorch das von Ultralytics YOLO verwendet wird.
- Weniger vielseitig im Ultralytics : Es ist zwar leistungsfähig, aber nicht so nativ in den aufgabenübergreifenden Rahmen von Ultralytics integriert wie YOLO11.
Ideale Anwendungsfälle
PP-YOLOE+ ist ideal für Anwendungen geeignet, bei denen es auf Genauigkeit ankommt:
- Industrielle Qualitätskontrolle: Anwendungen, die eine präzise Fehlererkennung und Qualitätssicherung in Fertigungsprozessen erfordern, wie z. B. die Verbesserung der Fertigung mit Hilfe von Computer Vision.
- Präzisionslandwirtschaft: Aufgaben wie Ernteüberwachung und Ertragsschätzung, bei denen eine genaue Erkennung die Entscheidungsfindung beeinflusst, wie die KI als Innovationsmotor in der Landwirtschaft zeigt.
- Bildgebung im Gesundheitswesen: Medizinische Bildanalyse, bei der die Erkennungsgenauigkeit für die Diagnose entscheidend ist, z. B. bei der Tumorerkennung in der medizinischen Bildgebung.
Modell-Vergleichstabelle
Modell | Größe (Pixel) |
mAPval 50-95 |
Geschwindigkeit CPU ONNX (ms) |
Geschwindigkeit T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Schlussfolgerung
Sowohl PP-YOLOE+ als auch YOLO11 sind robuste Modelle zur Objekterkennung, die jeweils einzigartige Vorteile aufweisen. YOLO11 bietet eine vielseitige, leistungsstarke Lösung innerhalb des Ultralytics , die sich ideal für Anwendungen eignet, die ein ausgewogenes Verhältnis zwischen Geschwindigkeit und Genauigkeit bei verschiedenen Bildverarbeitungsaufgaben erfordern. PP-YOLOE+ zeichnet sich durch Genauigkeit und Effizienz aus, was besonders für Benutzer innerhalb des PaddlePaddle und für diejenigen von Vorteil ist, die Wert auf Präzision in industriellen Umgebungen legen.
Benutzer, die sich für andere Modelle innerhalb des Ultralytics interessieren, können dies ebenfalls in Betracht ziehen:
- YOLOv8 - Ein äußerst vielseitiges und benutzerfreundliches Modell der YOLO .
- YOLOv9 - Bekannt für Fortschritte bei der Genauigkeit und Effizienz.
- YOLO - Modelle, die mit Hilfe von Neural Architecture Search für optimierte Leistung entwickelt wurden.
- RT-DETR - Real-Time DEtection Transformer, der einen anderen Architekturansatz bietet.
- YOLOv7, YOLOv6, und YOLOv5 - Frühere Versionen der YOLO , jede mit ihren eigenen Leistungsmerkmalen und Stärken.