Zum Inhalt springen

EfficientDet vs. YOLO11: Bewertung der Entwicklung der Objekterkennung

Die Auswahl der optimalen Architektur für Computer-Vision-Anwendungen erfordert oft einen Kompromiss zwischen Recheneffizienz und Erkennungsgenauigkeit. Dieser umfassende Vergleich untersucht die technischen Unterschiede zwischen EfficientDet, der skalierbaren Erkennungsarchitektur Google aus dem Jahr 2019, und YOLO11, einer 2024 veröffentlichten Version von Ultralytics , die die Echtzeitleistung neu definiert hat.

Während EfficientDet bahnbrechende Konzepte für die Modellskalierung einführte, YOLO11 einen bedeutenden Fortschritt in Bezug auf Benutzerfreundlichkeit, Inferenzgeschwindigkeit und Vielseitigkeit bei der Multitasking-Fähigkeit YOLO11 . Entwicklern, die 2026 neue Projekte starten, empfehlen wir außerdem, sich mit dem neuesten YOLO26 zu befassen, das auf den hier vorgestellten Innovationen aufbaut und native End-to-End-Verarbeitung bietet.

Leistungs-Benchmark-Analyse

Die Landschaft der Objekterkennung hat sich dramatisch verändert: Von der Optimierung für theoretische FLOPs hin zur Optimierung für Latenzzeiten in der realen Welt. Die folgende Tabelle verdeutlicht den starken Kontrast bei den Inferenzgeschwindigkeiten. Während EfficientDet-d0 für CPU etwa 10 ms benötigt, führen moderne Architekturen wie YOLO11n ähnliche Aufgaben deutlich schneller aus, oft unter 2 ms auf vergleichbarer Hardware, und behalten dabei eine wettbewerbsfähige mittlere Genauigkeit (mAP) bei.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLO11n64039.51.52.62.66.5
YOLO11s64047.02.59.49.421.5
YOLO11m64051.54.720.120.168.0
YOLO11l64053.46.225.325.386.9
YOLO11x64054.711.356.956.9194.9

EfficientDet: Der Pionier der Compound-Skalierung

EfficientDet, entwickelt vom Google Team, entstand als systematischer Ansatz zur Modellskalierung. Es wurde auf Basis des EfficientNet-Backbones entwickelt und führte das Weighted Bi-directional Feature Pyramid Network (BiFPN) ein, das eine einfache und schnelle Fusion von Merkmalen auf mehreren Ebenen ermöglicht.

Die zentrale Innovation war das Compound Scaling, eine Methode, mit der die Auflösung, Tiefe und Breite des Netzwerk-Backbones, des Feature-Netzwerks und der Box-/Klassenvorhersagenetzwerke einheitlich skaliert werden. Dadurch konnte die EfficientDet-Familie (D0 bis D7) auf eine Vielzahl von Ressourcenbeschränkungen ausgerichtet werden, von Mobilgeräten bis hin zu leistungsstarken GPU .

Trotz seines akademischen Erfolgs und seiner hohen Effizienz in Bezug auf FLOPs hat EfficientDet aufgrund der Speicherzugriffskosten seiner komplexen BiFPN-Verbindungen und tiefenweise trennbaren Faltungen, die nicht immer durch Beschleuniger wie TensorRT.

Effiziente Metadaten:

Erfahren Sie mehr über EfficientDet

Ultralytics YOLO11: Neudefinition des Standes der Technik in Echtzeit

Veröffentlicht im September 2024, YOLO11 wurde für die praktische, schnelle Objekterkennung und sofortige Bereitstellung entwickelt. Im Gegensatz zu EfficientDet, das sich stark auf die Parametereffizienz konzentriert, YOLO11 die Hardwareauslastung und stellt sicher, dass das Modell sowohl auf Edge-CPUs als auch auf Unternehmens-GPUs außergewöhnlich schnell läuft.

YOLO11 architektonische Verbesserungen wie den C3k2-Block und ein verbessertes SPPF-Modul (Spatial Pyramid Pooling – Fast) YOLO11 . Diese Änderungen verbessern die Fähigkeit des Modells, Merkmale in verschiedenen Maßstäben zu extrahieren, ohne die bei älteren Merkmalspyramiden-Designs auftretenden Latenzverluste. Darüber hinaus YOLO11 ein einheitliches Framework für mehrere Bildverarbeitungsaufgaben, darunter Instanzsegmentierung, Posenschätzung und Oriented Bounding Box (OBB) -Erkennung – Funktionen, die mit EfficientDet komplexe benutzerdefinierte Implementierungen erfordern.

Vorteile des Ökosystems

Ultralytics sind vollständig in die Ultralytics integriert und ermöglichen eine nahtlose Verwaltung von Datensätzen, automatische Annotation und Modelltraining mit einem Klick in der Cloud.

YOLO11 :

Erfahren Sie mehr über YOLO11

Wesentliche technische Unterschiede

Architektur und Feature Fusion

EfficientDet basiert auf BiFPN, einer komplexen gewichteten Merkmalsfusionsschicht, die Merkmalkarten wiederholt von oben nach unten und von unten nach oben verbindet. Obwohl dies theoretisch effizient ist, können die unregelmäßigen Speicherzugriffsmuster die Inferenz auf GPUs verlangsamen.

Im Gegensatz dazu YOLO11 eine optimierte, von PANet (Path Aggregation Network) inspirierte Architektur mit C3k2-Blöcken. Dieses Design begünstigt dichte, regelmäßige Speicherzugriffsmuster, die gut mit CUDA und modernen NPU-Architekturen harmonieren, was zu den in der Benchmark-Tabelle beobachteten massiven Geschwindigkeitssteigerungen führt (z. B. ist YOLO11x wesentlich schneller als EfficientDet-d7 und bietet gleichzeitig eine höhere Genauigkeit).

Trainingseffizienz und Benutzerfreundlichkeit

Das Training eines EfficientDet-Modells erfordert in der Regel die Verwendung der TensorFlow Detection API oder der AutoML-Bibliothek, die eine steile Lernkurve und komplexe Konfigurationsdateien mit sich bringen können.

Ultralytics die Entwicklererfahrung. Das Training YOLO11 über eine einfache Python oder eine Befehlszeilenschnittstelle (CLI) zugänglich. Die Bibliothek übernimmt automatisch die Hyperparameter-Optimierung, die Datenvergrößerung und die Formatierung der Datensätze.

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Vielseitigkeit und Einsatzmöglichkeiten

EfficientDet ist in erster Linie eine Architektur zur Objekterkennung. Die Anpassung für Aufgaben wie Segmentierung oder Posenschätzung erfordert erhebliche architektonische Änderungen.

YOLO11 von Haus aus multimodal. Die gleiche Backbone- und Trainings-Pipeline unterstützt:

  • Erkennung: Standard-Begrenzungsrahmen.
  • Segmentierung: Masken auf Pixelebene für präzise Objektgrenzen.
  • Klassifizierung: Ganzbild-Kategorisierung.
  • Pose: Erkennung von Schlüsselpunkten für die Skelettverfolgung.
  • OBB: Gedrehte Boxen für Luftbildaufnahmen und Texterkennung.

Diese Vielseitigkeit macht YOLO11 „Schweizer Taschenmesser“ für KI-Ingenieure, da ein einziges Repository vielfältige Anwendungen von der medizinischen Bildgebung bis hin zur autonomen Robotik ermöglicht.

Warum Ultralytics-Modelle wählen?

Beim Vergleich dieser beiden Architekturen für moderne Produktionssysteme bieten Ultralytics deutliche Vorteile:

  1. Geringerer Speicherbedarf: YOLO sind für das Training auf handelsüblicher Hardware optimiert. Im Gegensatz zu transformatorbasierten Modellen oder älteren, ressourcenintensiven Architekturen, die CUDA enormen CUDA haben, ermöglichen effiziente YOLO einen breiten Zugang zu High-End-KI-Training.
  2. Optimierte Bereitstellung: Exportieren nach ONNX, TensorRT, CoreML oder TFLite einen einzigen Befehl in der Ultralytics .
  3. Aktiver Support: Die Ultralytics ist lebendig und aktiv. Durch regelmäßige Updates gewährleistet das Framework die Kompatibilität mit den neuesten Versionen von PyTorch CUDA.

Fazit: Die moderne Wahl

Während EfficientDet nach wie vor ein wichtiger Meilenstein in der Geschichte der Computer-Vision-Forschung ist und die Leistungsfähigkeit der zusammengesetzten Skalierung demonstriert, YOLO11 und das neuere YOLO26 sind heute die überlegenen Optionen für den praktischen Einsatz. Sie bieten ein besseres Gleichgewicht zwischen Geschwindigkeit und Genauigkeit, eine deutlich einfachere Benutzererfahrung und die Flexibilität, mehrere Computer-Vision-Aufgaben innerhalb eines einzigen Frameworks zu bewältigen.

Entwicklern, die auf dem neuesten Stand bleiben möchten, empfehlen wir, sich mit YOLO26 zu befassen, das ein durchgängiges NMS Design für noch geringere Latenz und einfachere Bereitstellungspipelines bietet.

Um weitere leistungsstarke Optionen zu erkunden, lesen Sie unsere Vergleiche zu YOLOv10 oder RT-DETR.


Kommentare