Modellvergleich: YOLO11 vs. PP-YOLOE+ zur Objekterkennung
Die Wahl des richtigen Objekterkennungsmodells ist für Computer-Vision-Projekte entscheidend. Ultralytics YOLO11 und PP-YOLOE+ sind beides hochmoderne Modelle mit jeweils einzigartigen Stärken, die auf unterschiedliche Anwendungsbedürfnisse abgestimmt sind. Auf dieser Seite finden Sie einen detaillierten technischen Vergleich, der Ihnen hilft, eine fundierte Entscheidung zwischen diesen leistungsstarken Modellen zu treffen.
Ultralytics YOLO11
Ultralytics YOLO11 ist die neueste Version der von Ultralytics entwickelten YOLO . YOLO11 ist für seine Echtzeit-Objekterkennungsfähigkeiten bekannt und baut auf den Vorgängerversionen auf, wobei sowohl die Geschwindigkeit als auch die Genauigkeit verbessert wurden. Das einstufige Erkennungsparadigma wird beibehalten, wobei die effiziente Inferenz im Vordergrund steht, ohne die Präzision zu beeinträchtigen.
Architektur und Hauptmerkmale
YOLO11 verfügt über eine schlanke Architektur, die für schnelle Schlussfolgerungen optimiert ist. Es beinhaltet Fortschritte in der Netzwerktopologie und den Trainingstechniken, um ein Gleichgewicht zwischen Parameteranzahl und Leistung zu erreichen. Zu den wichtigsten Architekturmerkmalen gehören:
- Effizientes Backbone: Nutzt ein hocheffizientes Backbone-Netzwerk für eine schnelle Merkmalsextraktion.
- Ankerfreie Erkennung: Funktioniert ohne Ankerboxen, was den Erkennungsprozess vereinfacht und die Anpassungsfähigkeit über verschiedene Objektmaßstäbe hinweg verbessert, ähnlich wie bei YOLOv8.
- Skalierbare Modellgrößen: Bietet eine Reihe von Modellgrößen (n, s, m, l, x) für unterschiedliche Rechenressourcen, von Edge-Geräten bis hin zu Hochleistungsservern, und gewährleistet so Vielseitigkeit bei der Bereitstellung.
Leistungsmetriken
YOLO11 zeichnet sich durch ein ausgewogenes Verhältnis von Geschwindigkeit und Genauigkeit aus und ist daher für Echtzeitanwendungen geeignet. Es demonstriert eine hochmoderne durchschnittliche Genauigkeit (Mean Average Precision, mAP) bei Datensätzen wie COCO und behält gleichzeitig eine beeindruckende Inferenzgeschwindigkeit bei. Die verschiedenen Modellgrößen bieten unterschiedliche Kompromisse zwischen Geschwindigkeit und Genauigkeit, wie in der folgenden Vergleichstabelle dargestellt.
Anwendungsfälle und Stärken
YOLO11 eignet sich ideal für Anwendungen, die eine Mischung aus Geschwindigkeit und hoher Genauigkeit erfordern:
- Videoanalyse in Echtzeit: Anwendungen wie Sicherheitssysteme, Verkehrsüberwachung und Warteschlangenmanagement profitieren von der Geschwindigkeit und Präzision des YOLO11.
- Edge-Einsatz: Dank seiner Effizienz und kompakten Größe eignet sich YOLO11 hervorragend für den Einsatz auf Edge-Geräten wie Raspberry Pi und NVIDIA Jetson.
- Vielseitige Anwendungen: Von KI in der Fertigung zur Qualitätskontrolle bis hin zu Computer Vision zur Diebstahlprävention im Einzelhandel - die Anpassungsfähigkeit von YOLO11 macht es zu einer starken Wahl in verschiedenen Bereichen.
Autorschaft und Datum:
- Die Autoren: Glenn Jocher und Jing Qiu
- Organisation: Ultralytics
- Datum: 2024-09-27
- GitHub-Link: Ultralytics YOLOv8 GitHub-Repository
- Link zur Dokumentation: Ultralytics YOLO11
PP-YOLOE+
PP-YOLOE+ (Practical PaddlePaddle You Only Look One-level Efficient Plus) wurde von Baidu als Teil des PaddleDetection-Modells zoo entwickelt. Es konzentriert sich darauf, eine hohe Genauigkeit bei der Objekterkennung zu erreichen und gleichzeitig eine angemessene Effizienz beizubehalten. PP-YOLOE+ ist eine verbesserte Version von PP-YOLOE, die architektonische Verfeinerungen zur Leistungssteigerung enthält.
Architektur und Hauptmerkmale
PP-YOLOE+ ist ein verankerungsfreies, einstufiges Objekterkennungsmodell. Es vereinfacht den Erkennungsprozess durch direkte Vorhersage der Objektzentren und Bounding-Box-Parameter. Die wichtigsten Merkmale sind:
- Ankerfreies Design: Vereinfacht die Modellarchitektur und das Training und vermeidet die Komplexität von Ankerboxen.
- Effiziente Architektur: Verwendet ein ResNet-Backbone und konzentriert sich auf Optimierungstechniken zur Verringerung des Rechenaufwands bei gleichzeitiger Beibehaltung einer wettbewerbsfähigen Genauigkeit.
- PaddlePaddle : Optimiert für die nahtlose Integration und Bereitstellung innerhalb des PaddlePaddle , unter Nutzung der Vorteile des Ökosystems.
Leistungsmetriken
PP-YOLOE+ Modelle bieten eine Reihe von Konfigurationen (t, s, m, l, x), um Genauigkeit und Geschwindigkeit auszugleichen. Während detaillierte CPU ONNX in den zur Verfügung gestellten Daten nicht ohne weiteres verfügbar sind, zeigen PP-YOLOE+-Modelle konkurrenzfähige mAP- und effiziente TensorRT , die für Anwendungen geeignet sind, bei denen Genauigkeit und effizienter Einsatz entscheidend sind.
Erfahren Sie mehr über PP-YOLOE+
Anwendungsfälle und Stärken
PP-YOLOE+ eignet sich hervorragend für Anwendungen, bei denen es auf hohe Genauigkeit und Effizienz ankommt, insbesondere im Rahmen des PaddlePaddle :
- Industrielle Inspektion: Ideal für Hochgeschwindigkeits-Qualitätsprüfungen in der Fertigung, die von seiner Genauigkeit und Effizienz profitieren.
- Edge Computing: Effizienter Einsatz auf mobilen und eingebetteten Geräten aufgrund seiner optimierten Architektur.
- Robotik: Ermöglicht die Echtzeit-Wahrnehmung von Robotern, die in dynamischen Umgebungen arbeiten, und nutzt dabei ihre Geschwindigkeit und Genauigkeit.
- Verarbeitung mit hohem Durchsatz: Geeignet für Szenarien, die eine schnelle Objekterkennung in großen Mengen von Bildern oder Videoströmen erfordern.
Autorschaft und Datum:
- Autoren: PaddlePaddle Autoren
- Organisation: Baidu
- Datum: 2022-04-02
- ArXiv-Link: PP-YOLOE ArXiv Paper
- GitHub-Link: PaddleDetection GitHub Repository
- Link zur Dokumentation: PP-YOLOE+ Dokumentation
Modell-Vergleichstabelle
Modell | Größe (Pixel) |
mAPval 50-95 |
Geschwindigkeit CPU ONNX (ms) |
Geschwindigkeit T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Schlussfolgerung
Sowohl YOLO11 als auch PP-YOLOE+ sind robuste Modelle zur Objekterkennung. YOLO11 bietet ein vielseitiges und benutzerfreundliches Erlebnis innerhalb des Ultralytics , das Geschwindigkeit und Genauigkeit bei verschiedenen Aufgaben effektiv ausgleicht. PP-YOLOE+ zeichnet sich durch Genauigkeit und Effizienz aus, insbesondere für Benutzer, die in das PaddlePaddle integriert sind oder bei industriellen Anwendungen ein ankerfreies Design bevorzugen.
Für Benutzer, die an anderen Modellen interessiert sind, bietet Ultralytics eine Reihe von hochmodernen Modellen an, darunter: