Zum Inhalt springen

YOLO11 EfficientDet: Ein technischer Vergleich von Bildverarbeitungsarchitekturen

In der sich schnell entwickelnden Landschaft der Computervision ist die Auswahl des richtigen Objekterkennungsmodells entscheidend für den Erfolg eines Projekts. Dieser Vergleich untersucht die technischen Unterschiede zwischen Ultralytics YOLO11, einem hochmodernen Echtzeit-Detektor, der Ende 2024 auf den Markt kam, und Google , einer sehr einflussreichen Architektur aus dem Jahr 2019, die die zusammengesetzte Skalierung in diesem Bereich eingeführt hat.

Während EfficientDet bei seiner Veröffentlichung Maßstäbe für die Parametereffizienz gesetzt hat, YOLO11 jahrelange Innovation, die sich auf die Maximierung der Inferenzgeschwindigkeit, Genauigkeit und Benutzerfreundlichkeit für moderne Edge-KI- und Cloud-Anwendungen konzentriert.

Neueres Modell verfügbar

YOLO11 zwar ein leistungsstarkes Modell, doch Ultralytics (veröffentlicht im Januar 2026) ist nun die empfohlene, hochmoderne Wahl für neue Projekte. YOLO26 bietet ein durchgängiges NMS Design, schnellere Inferenz und verbesserte Genauigkeit.

Erfahren Sie mehr über YOLO26

Leistungsmetriken und Analyse

Die folgende Tabelle enthält einen direkten Vergleich der Leistungskennzahlen für den COCO . Zu den wichtigsten Kennzahlen zählen die mittlere durchschnittliche Genauigkeit (mAP) für die Genauigkeit, die Inferenzgeschwindigkeit (Latenz) auf unterschiedlicher Hardware, die Modellgröße (Parameter) und die Rechenkomplexität (FLOPs).

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Wichtige Erkenntnisse

  • Inferenzlatenz: Ultralytics YOLO11 übertrifft EfficientDetYOLO11 in Bezug auf die Latenz. So erreicht YOLO11x beispielsweise eine höhere Genauigkeit (54,7 mAP) als EfficientDet-d7 (53,7 mAP) und läuft dabei auf einer GPU mehr als zehnmal schneller GPU 11,3 ms gegenüber 128,07 ms).
  • Architektureffizienz: Während EfficientDet für FLOPs (Floating Point Operations) optimiert ist, YOLO11 für die Hardwareauslastung optimiert. Dies unterstreicht einen entscheidenden Unterschied bei den Leistungskennzahlen der KI: Niedrigere FLOPs bedeuten aufgrund von Speicherzugriffskosten und Parallelitätsbeschränkungen nicht immer eine schnellere Inferenz in der Praxis.
  • Modellskalierbarkeit: YOLO11 eine praktischere Skalierungskurve. Das „Nano”-Modell (YOLO11n) liefert mAP unglaublichen Geschwindigkeiten einen nutzbaren mAP 39,5, während das kleinste EfficientDet-d0 mit 34,6 mAP hinterherhinkt.

Ultralytics YOLO11: Architektur und Funktionen

Ultralytics YOLO11 auf dem Erbe der YOLO You Only Look Once)YOLO11 und verfeinert die Architektur für das moderne Zeitalter der Computervision. Es führt bedeutende Änderungen am Backbone und Neck ein, um die Merkmalsextraktion und Verarbeitungsgeschwindigkeit zu verbessern.

Zu den bemerkenswerten architektonischen Verbesserungen zählen der C3k2-Block, eine weiterentwickelte Version des in früheren Versionen verwendeten Cross Stage Partial (CSP)-Engpasses, und das C2PSA-Modul (Cross Stage Partial Spatial Attention). Diese Komponenten ermöglichen es dem Modell, komplexe Muster und Zusammenhänge in Bildern mit weniger Parametern zu erfassen.

Erfahren Sie mehr über YOLO11

Stärken von YOLO11

  1. Einheitliches Ökosystem: YOLO11 nicht nur ein Erkennungsmodell, sondern unterstützt auch Instanzsegmentierung, Posenschätzung, OBB und Klassifizierung.
  2. Bereitstellungsbereitschaft: Mit dem integrierten Exportmodus können Benutzer Modelle TFLite einem einzigen Befehl in ONNX, TensorRT, CoreML und TFLite konvertieren, wodurch eine nahtlose Bereitstellung auf Mobil- und Edge-Geräten gewährleistet ist.
  3. Trainingseffizienz: YOLO11 deutlich schneller als ältere Architekturen wie EfficientDet, indem es moderne Augmentations-Pipelines und optimierte Verlustfunktionen nutzt.

Google : Architektur und Vermächtnis

EfficientDet, entwickelt vom Google Team, führte das Konzept der Compound Scaling in die Objekterkennung ein. Anstatt manuell größere Modelle zu entwerfen, schlugen die Autoren eine Methode vor, um die Auflösung, Tiefe und Breite des Netzwerks gleichzeitig zu skalieren.

Der Kern von EfficientDet ist das BiFPN (Bi-directional Feature Pyramid Network), das eine einfache Fusion von Merkmalen auf mehreren Ebenen ermöglicht. Es verwendet ein EfficientNet-Backbone, das ebenfalls mit Hilfe von Neural Architecture Search (NAS) entwickelt wurde.

  • Autoren: Mingxing Tan, Ruoming Pang, und Quoc V. Le
  • Organisation: Google
  • Datum: 2019-11-20
  • Arxiv:1911.09070
  • GitHub:google/automl

Stärken und Einschränkungen

  • Parametereffizienz: EfficientDet ist historisch dafür bekannt, mit sehr wenigen Parametern eine hohe Genauigkeit zu erzielen.
  • Theoretische Effizienz: Obwohl es niedrige FLOPs aufweist, können die komplexen Verbindungen in der BiFPN-Schicht speicherintensiv sein und auf GPUs langsamer ausgeführt werden als die einfachen Faltungswege von YOLO.
  • Begrenzte Vielseitigkeit: Das ursprüngliche Repository konzentriert sich in erster Linie auf die Erkennung und verfügt nicht über die native Multitasking-Flexibilität (Segmentierung, Pose, OBB), die im Ultralytics zu finden ist.

Vergleichende Analyse: Warum Ultralytics wählen?

Beim Vergleich dieser beiden Modelle für Produktionsumgebungen in den Jahren 2025 und 2026 werden die Vorteile des Ultralytics deutlich.

Benutzerfreundlichkeit und Entwicklererfahrung

Ultralytics eine optimierte Benutzererfahrung. Die Implementierung YOLO11 nur wenige Zeilen Python , während die Verwendung von EfficientDet oft die Navigation durch komplexe Legacy-Codebasen oder TensorFlow erfordert.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

Gut gepflegtes Ökosystem

Das Ultralytics wird durch häufige Updates aktiv gepflegt. Auf GitHub gemeldete Probleme werden schnell behoben, und die Community-Unterstützung ist umfangreich. Im Gegensatz dazu werden ältere Forschungsrepositorien wie das ursprüngliche EfficientDet oft nur selten aktualisiert, was ihre Pflege in langfristigen kommerziellen Projekten erschwert.

Leistungsausgleich und Speicher

YOLO11 eine hervorragende Balance zwischen Geschwindigkeit und Genauigkeit. Die architektonischen Entscheidungen in YOLO11 GPU , was zu schnelleren Wall-Clock-Inferenzzeiten führt, selbst wenn die theoretische FLOP-Anzahl höher ist als bei EfficientDet. Darüber hinaus sind Ultralytics für einen geringeren Speicherverbrauch während des Trainings optimiert, sodass Benutzer effektive Modelle auf handelsüblichen GPUs trainieren können, im Gegensatz zu vielen Transformer-basierten Alternativen, die massiven VRAM erfordern.

Vielseitigkeit über verschiedene Aufgaben hinweg

Während EfficientDet in erster Linie ein Objektdetektor ist, YOLO11 als Grundlage für eine Vielzahl von Aufgaben. Diese Vielseitigkeit reduziert die Notwendigkeit, verschiedene Frameworks für unterschiedliche Probleme zu erlernen.

Ein Rahmen, mehrere Aufgaben

  • Erkennung: Objekte und deren Standorte identifizieren.
  • Segmentierung: Verständnis von Objekten auf Pixelebene.
  • Posen-Schätzung: Erkennen Sie Schlüsselpunkte am menschlichen Körper.
  • Orientierte Begrenzungsrahmen (OBB): Erkennen Sie gedrehte Objekte wie Schiffe in Luftbildern.
  • Klassifizierung: Klassifizieren Sie ganze Bilder effizient.

Fazit

Beide Architekturen stellen bedeutende Meilensteine in der Geschichte der Computervision dar. EfficientDet demonstrierte die Leistungsfähigkeit der neuronalen Architektursuche und der zusammengesetzten Skalierung. Für praktische Anwendungen ist heute jedoch Ultralytics YOLO11 die bessere Wahl. Es bietet schnellere Inferenzgeschwindigkeiten, höhere Genauigkeit und ein entwicklerfreundliches Ökosystem, das die Markteinführungszeit drastisch verkürzt.

Entwicklern, die nach der absolut neuesten Leistung suchen, empfehlen wir YOLO26, das auf den Erfolgen von YOLO11 aufbaut YOLO11 noch effizienter YOLO11 und YOLO11 ein NMS Design YOLO11 . Diejenigen, die sich für transformatorbasierte Ansätze interessieren, könnten auch RT-DETR in Betracht ziehen. RT-DETR für globales Kontextbewusstsein in Betracht ziehen.

Entdecken Sie das volle Potenzial der visuellen KI, indem Sie die Ultralytics besuchen, um Ihre Modelle in der Cloud zu trainieren, bereitzustellen und zu verwalten.


Kommentare