YOLO11 vs EfficientDet: Ein detaillierter technischer Vergleich
Diese Seite bietet einen detaillierten technischen Vergleich zwischen Ultralytics YOLO11 und EfficientDet, zwei bekannten Objekterkennungsmodellen. Wir analysieren ihre Architekturen, Performance-Benchmarks und Eignung für verschiedene Anwendungen, um Sie bei der Auswahl des optimalen Modells für Ihre Computer-Vision-Anforderungen zu unterstützen. Während beide Modelle auf eine effiziente und genaue Objekterkennung abzielen, stammen sie aus unterschiedlichen Forschungsrichtungen (Ultralytics und Google) und verfolgen unterschiedliche architektonische Philosophien.
Ultralytics YOLO11
Ultralytics YOLO11 stellt die neueste Weiterentwicklung in der YOLO-Serie (You Only Look Once) dar, die von Ultralytics entwickelt wurde und für ihre außergewöhnlichen Echtzeit-Objekterkennungsfunktionen bekannt ist. Es baut auf dem Erfolg von Vorgängern wie YOLOv8 auf und konzentriert sich auf die Verbesserung von Genauigkeit und Recheneffizienz.
Technische Details:
- Autoren: Glenn Jocher, Jing Qiu
- Organisation: Ultralytics
- Datum: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Doku: https://docs.ultralytics.com/models/yolo11/
Architektur und Hauptmerkmale
YOLO11 verwendet eine einstufige, ankerfreie Architektur, die auf Geschwindigkeit und Genauigkeit optimiert ist. Zu den wichtigsten Merkmalen gehören verfeinerte Merkmalsextraktionsschichten und eine optimierte Netzwerkstruktur, die die Anzahl der Parameter und die Rechenlast reduziert. Dieses Design gewährleistet eine ausgezeichnete Leistung auf verschiedener Hardware, von Edge-Geräten (NVIDIA Jetson, Raspberry Pi) bis hin zu Cloud-Servern.
Ein großer Vorteil von YOLO11 ist seine Vielseitigkeit und Integration in das Ultralytics-Ökosystem. Es unterstützt mehrere Aufgaben über die Objekterkennung hinaus, einschließlich Instanzsegmentierung, Bildklassifizierung, Pose-Schätzung und orientierte Begrenzungsrahmen (OBB). Das Ultralytics-Framework bietet eine einfache Python API und CLI, umfangreiche Dokumentation, leicht verfügbare vortrainierte Gewichte und effiziente Trainingsprozesse mit geringeren Speicheranforderungen im Vergleich zu vielen anderen Architekturen. Das Ökosystem profitiert von aktiver Entwicklung, starkem Community-Support und nahtloser Integration mit Tools wie Ultralytics HUB für optimierte MLOps.
Stärken
- Hohe Geschwindigkeit und Effizienz: Ausgezeichnete Inferenzgeschwindigkeit, ideal für Echtzeitanwendungen.
- Hohe Genauigkeit: Erreicht über alle Modellgrößen hinweg modernste mAP-Werte.
- Vielseitigkeit: Unterstützt Erkennungs-, Segmentierungs-, Klassifizierungs-, Pose- und OBB-Aufgaben innerhalb eines einzigen Frameworks.
- Benutzerfreundlichkeit: Einfache API, umfassende Dokumentation und ein benutzerfreundliches Ökosystem.
- Gut gepflegtes Ökosystem: Aktiv entwickelt, starke Community, häufige Updates und Tools wie Ultralytics HUB.
- Trainingseffizienz: Schnellere Trainingszeiten und geringerer Speicherverbrauch im Vergleich zu vielen Alternativen.
- Flexibilität bei der Bereitstellung: Optimiert für verschiedene Hardware von Edge bis zur Cloud.
Schwächen
- Kleinere Modelle priorisieren Geschwindigkeit, was im Vergleich zu den größten Varianten einen Kompromiss bei der maximal erreichbaren Genauigkeit bedeuten kann.
- Als One-Stage Detektor kann es bei extrem kleinen Objekten in bestimmten komplexen Szenen zu Herausforderungen kommen.
Ideale Anwendungsfälle
YOLO11 zeichnet sich in Anwendungen aus, die Echtzeitleistung und hohe Genauigkeit erfordern:
- Autonome Systeme: Robotik und selbstfahrende Autos.
- Sicherheit: Überwachungssysteme und Diebstahlprävention.
- Industrielle Automatisierung: Qualitätskontrolle und Effizienz beim Recycling.
- Einzelhandel: Bestandsverwaltung und Kundenanalytik.
EfficientDet von Google
EfficientDet ist eine Familie von Objekterkennungsmodellen, die vom Google Brain Team entwickelt wurde. Sie wurde entwickelt, um eine hohe Effizienz zu erzielen, indem der Kompromiss zwischen Genauigkeit und Rechenressourcen (Parameter und FLOPs) optimiert wird.
Technische Details:
- Autoren: Mingxing Tan, Ruoming Pang, Quoc V. Le
- Organisation: Google
- Datum: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- Doku: https://github.com/google/automl/tree/master/efficientdet#readme
Architektur und Hauptmerkmale
Die Architektur von EfficientDet basiert auf drei wichtigen Innovationen:
- EfficientNet Backbone: Es verwendet das hocheffiziente EfficientNet als sein Backbone für die Merkmalsextraktion.
- BiFPN (Bi-directional Feature Pyramid Network): Ein neuartiges Feature-Netzwerk, das eine einfache und schnelle multiskalige Feature-Fusion ermöglicht und herkömmliche FPNs durch Hinzufügen gewichteter Verbindungen verbessert.
- Compound Scaling: Eine Methode, die die Tiefe, Breite und Auflösung für das Backbone, das Feature-Netzwerk und die Box- / Klassenvorhersagenetzwerke einheitlich skaliert. Dies ermöglicht die Skalierung des Modells von kleinen (D0) bis zu großen (D7) Varianten, um verschiedenen Ressourcenbeschränkungen gerecht zu werden.
Stärken
- Hohe Parametereffizienz: Bietet eine hohe Genauigkeit bei einer relativ geringen Anzahl von Parametern und FLOPs.
- Skalierbarkeit: Die Compound-Scaling-Methode bietet einen klaren Weg, das Modell für verschiedene Leistungsziele zu skalieren.
- Starke Benchmark-Leistung: Erzielte zum Zeitpunkt seiner Veröffentlichung modernste Ergebnisse auf dem COCO-Datensatz.
Schwächen
- Langsamere Inferenzgeschwindigkeit: Trotz seiner FLOP-Effizienz weist EfficientDet oft eine höhere Inferenzlatenz auf als YOLO-Modelle, insbesondere auf GPUs, was es für viele Echtzeitanwendungen weniger geeignet macht.
- Eingeschränkte Vielseitigkeit: Hauptsächlich für die Objekterkennung entwickelt und es fehlt die native Unterstützung für andere Aufgaben wie Instanzsegmentierung, Pose-Schätzung oder OBB, die in das Ultralytics YOLO-Framework integriert sind.
- Weniger integriertes Ökosystem: Das ursprüngliche Repository ist in erster Linie ein Forschungsartefakt. Es mangelt an umfassender Dokumentation, einer einfachen API und integrierten Tools wie Ultralytics HUB, die den End-to-End-Workflow vom Training bis zur Bereitstellung vereinfachen.
- Framework-Abhängigkeit: Die offizielle Implementierung erfolgt in TensorFlow, was eine Einschränkung für Entwickler und Forscher darstellen kann, die hauptsächlich im PyTorch-Ökosystem arbeiten.
Ideale Anwendungsfälle
EfficientDet eignet sich gut für Szenarien, in denen die Modellgröße und die theoretischen Rechenkosten die wichtigsten Einschränkungen darstellen:
- Edge-KI: Einsatz auf mobilen oder eingebetteten Geräten, bei denen Speicher und Rechenleistung stark begrenzt sind.
- Akademische Forschung: Untersuchung von Modellskalierungsgesetzen und Architektureffizienz.
- Cloud-Anwendungen: Szenarien, in denen die Minimierung der Rechenkosten pro Inferenz wichtiger ist als die Erzielung der geringstmöglichen Latenz.
Erfahren Sie mehr über EfficientDet
Performance und Benchmarks: YOLO11 vs. EfficientDet
Beim Vergleich der Leistung ist es entscheidend, mehr als nur mAP zu betrachten. Während beide Modellfamilien eine Reihe von Genauigkeitsstufen bieten, ist YOLO11 auf eine überlegene Geschwindigkeit in der realen Welt ausgelegt. Die folgende Tabelle zeigt, dass YOLO11-Modelle bei einer ähnlichen mAP deutlich schneller sind, insbesondere wenn sie mit TensorRT auf einer GPU beschleunigt werden.
Zum Beispiel erreicht YOLO11m die gleiche mAP von 51,5 wie EfficientDet-d5, ist aber über 14x schneller auf einer T4-GPU (4,7 ms vs. 67,86 ms) und verwendet 40 % weniger Parameter. Dies unterstreicht das außergewöhnliche Gleichgewicht von YOLO11 zwischen Genauigkeit, Geschwindigkeit und Modellgröße, was es zu einer weitaus praktischeren Wahl für Anwendungen macht, die Echtzeitverarbeitung erfordern.
Modell | Größe (Pixel) |
mAPval 50-95 |
Geschwindigkeit CPU ONNX (ms) |
Geschwindigkeit T4 TensorRT10 (ms) |
Parameter (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Fazit: Welches Modell sollten Sie wählen?
Während EfficientDet ein bedeutender Schritt nach vorn in Bezug auf die Modelleffizienz war, stellt Ultralytics YOLO11 eine modernere, praktischere und leistungsfähigere Lösung für die überwiegende Mehrheit der Computer-Vision-Anwendungen dar.
-
Wählen Sie EfficientDet, wenn Ihre primäre Einschränkung die Minimierung des theoretischen FLOPs- oder Parameterzählwerts ist und Sie sich mit der Arbeit innerhalb des forschungsorientierten Frameworks wohlfühlen.
-
Wählen Sie Ultralytics YOLO11 für fast alle anderen Szenarien. Sein überlegener Kompromiss zwischen Geschwindigkeit und Genauigkeit, seine unglaubliche Vielseitigkeit bei verschiedenen Bildverarbeitungsaufgaben und seine Benutzerfreundlichkeit machen es zur endgültigen Wahl für Entwickler und Forscher. Das gut gepflegte Ökosystem, einschließlich umfassender Dokumentation, aktiver Community-Unterstützung und Tools wie Ultralytics HUB, gewährleistet eine reibungslose Entwicklungs- und Deployment-Erfahrung, von ersten Experimenten bis zur Produktion in großem Maßstab.
Andere Modellvergleiche
Für weitere Erkundungen sollten Sie diese Vergleiche mit YOLO11 und anderen relevanten Modellen in Betracht ziehen:
- YOLO11 vs YOLOv10
- YOLO11 vs. YOLOv9
- YOLO11 vs. YOLOv8
- YOLO11 vs YOLOv7
- YOLO11 vs RT-DETR
- YOLOX vs EfficientDet
- YOLOv8 vs. EfficientDet