Meet YOLO26: next-gen vision AI.

Link to this sectionEfficientDet vs YOLO11: Ein umfassender technischer Vergleich#

Die Auswahl der optimalen neuronalen Netzwerkarchitektur ist die Grundlage jeder erfolgreichen Computer Vision-Anwendung. Dieser umfassende Leitfaden bietet einen tiefgreifenden technischen Vergleich zwischen EfficientDet von Google und Ultralytics YOLO11 und analysiert deren architektonische Unterschiede, Leistungsmetriken und ideale Einsatzszenarien.

Egal, ob du auf Millisekunden-Latenz bei Edge AI-Geräten abzielst oder skalierbare Genauigkeit für cloudbasierte Inferenz benötigst, das Verständnis der Nuancen dieser Modelle ist entscheidend.

Link to this sectionModellprofile und technische Details#

Das Verständnis der Abstammung und der zugrunde liegenden Designphilosophie jeder Architektur hilft dabei, deren Leistung bei realen Objekterkennungs-Aufgaben einzuordnen.

Link to this sectionEfficientDet#

Entwickelt von Forschern bei Google Brain, führte EfficientDet einen prinzipiellen Ansatz zur Skalierung von Objekterkennungsnetzwerken zusammen mit dem neuartigen BiFPN (Bidirectional Feature Pyramid Network) ein.

Erfahre mehr über EfficientDet

Link to this sectionYOLO11#

YOLO11 stellt eine bedeutende Entwicklung im Ultralytics-Ökosystem dar und verschiebt die Grenzen von Echtzeitleistung, Parametereffizienz und Multitasking-Lernen.

Erfahre mehr über YOLO11

Link to this sectionArchitektonischer Vergleich#

Die architektonischen Unterschiede zwischen diesen beiden Modellen verdeutlichen die Divergenz der Designstrategien über die Jahre hinweg.

EfficientDet nutzt das EfficientNet-Backbone und führt BiFPN ein, das eine Top-Down- und Bottom-Up-Merkmalsfusion über mehrere Skalen hinweg ermöglicht. Es verwendet eine zusammengesetzte Skalierungsmethode, die Auflösung, Tiefe und Breite für alle Backbone-, Merkmalsnetzwerk- und Box-/Klassen-Vorhersagenetzwerke gleichzeitig skaliert. Obwohl es sehr effektiv zur Maximierung der mean Average Precision (mAP) ist, kann das komplexe Routing in BiFPN manchmal die Speicherbandbreite während der Inferenz verlangsamen.

YOLO11 hingegen verwendet ein optimiertes C3k2-Modul und einen fortschrittlichen ankerfreien Detektionskopf. Dieser optimierte Ansatz minimiert den Overhead bei der Merkmalsextraktion. Ultralytics hat YOLO11 so entwickelt, dass die GPU-Hardwareauslastung maximiert wird, was zu deutlich geringeren Speicheranforderungen während des Trainings und der Inferenz im Vergleich zu älteren Architekturen oder schweren Transformer-Modellen führt.

Multitasking-Vielseitigkeit

Während EfficientDet strikt ein Objektdetektor ist, zeichnet sich YOLO11 durch extreme Vielseitigkeit aus. Eine einzige YOLO11-Architektur unterstützt nativ Instanzsegmentierung, Bildklassifizierung, Pose-Schätzung und Oriented Bounding Boxes (OBB).

Link to this sectionPerformance-Benchmarks#

Die folgende Tabelle stellt die Leistung beider Modellfamilien über verschiedene Skalen auf dem COCO-Datensatz gegenüber.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513,57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520,755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02,59.421,5
YOLO11m64051.5183.24.720,168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356,9194.9

Link to this sectionAusgewogene Analyse: Stärken und Schwächen#

GPU-Beschleunigung: YOLO11 dominiert in GPU-Umgebungen. So liefert YOLO11m eine mAP von 51,5 % bei blitzschnellen 4,7 ms auf einer T4-GPU unter Verwendung von TensorRT. Um eine vergleichbare Genauigkeit zu erreichen, benötigt EfficientDet-d5 67,86 ms – das ist über 14-mal langsamer. Dies unterstreicht das überlegene Leistungsverhältnis der Ultralytics-Modelle für Echtzeitanwendungen.

CPU-Umgebungen: EfficientDet weist bei seinen kleineren Varianten (wie d0 und d1) unter Verwendung von ONNX hochoptimierte CPU-Inferenzgeschwindigkeiten auf. Allerdings skaliert die Genauigkeit schlecht, ohne bei größeren Varianten wie d7 massive Einbußen bei der GPU-Latenz in Kauf zu nehmen.

Link to this sectionTrainingsmethodik und Ökosystem#

Die Entwicklererfahrung ist oft genauso wichtig wie die theoretischen Fähigkeiten des Modells. Hier glänzt das Ultralytics-Ökosystem.

EfficientDet verlässt sich stark auf das veraltete TensorFlow-Ökosystem und komplexe AutoML-Bibliotheken. Das Einrichten einer benutzerdefinierten Trainingspipeline beinhaltet steile Lernkurven, kompliziertes Abhängigkeitsmanagement und die manuelle Konfiguration von Ankern und Verlustfunktionen.

Im Gegensatz dazu bietet Ultralytics eine unvergleichliche Benutzerfreundlichkeit. Unterstützt durch ein gut gepflegtes PyTorch-Ökosystem erfordert das Trainieren eines YOLO-Modells nur wenige Zeilen Code. Das Framework verwaltet automatisch Hyperparameter-Tuning, fortschrittliche Datenaugmentierungen und eine optimale Planung der Lernrate direkt ab Werk.

Link to this sectionCode-Beispiel: Erste Schritte mit Ultralytics#

Dieser robuste, produktionsreife Code-Schnipsel demonstriert, wie einfach Training und Inferenz innerhalb der Python API sind.

from ultralytics import YOLO

# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model on your custom dataset with automated hyperparameter tuning
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Perform fast inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()

Link to this sectionIdeale Anwendungsfälle#

Wann EfficientDet verwendet werden sollte: EfficientDet bleibt eine praktikable Wahl für Forschungsumgebungen, die stark in TensorFlow-Pipelines verankert sind, oder für spezifische CPU-gebundene Einschränkungen, bei denen frühe Architekturen wie d0 adäquat funktionieren.

Wann YOLO11 verwendet werden sollte: YOLO11 ist die definitive Wahl für moderne Unternehmensbereitstellungen. Seine außergewöhnliche Geschwindigkeit macht es perfekt für autonome Fahrzeuge, Sportanalysen in Echtzeit und die Erkennung von Herstellungsfehlern mit hohem Durchsatz. Darüber hinaus ermöglicht seine geringere Speichernutzung eine flexible Bereitstellung auf ressourcenbeschränkter Hardware wie dem NVIDIA Jetson.

Link to this sectionAusblick: Das YOLO26-Upgrade#

Obwohl YOLO11 außergewöhnlich leistungsfähig ist, sollten Entwickler, die neue Projekte starten, andere Ultralytics-Architekturen wie das bewährte YOLOv8 oder das neu veröffentlichte YOLO26 bewerten. YOLO26 wurde Anfang 2026 veröffentlicht, baut auf dem Fundament von YOLO11 auf und führt mehrere bahnbrechende Innovationen ein:

  • End-to-End NMS-freies Design: Basierend auf dem Erbe von YOLOv10 eliminiert YOLO26 die Non-Maximum Suppression (NMS) während der Nachverarbeitung vollständig, was die Latenz reduziert und Bereitstellungspipelines vereinfacht.
  • MuSGD Optimizer: Ein hybrider Optimierer, der standardmäßiges SGD mit Muon (inspiriert vom Training großer Sprachmodelle) kombiniert und die Trainingsstabilität drastisch verbessert.
  • Bis zu 43 % schnellere CPU-Inferenz: Spezifische Optimierungen machen YOLO26 auf Edge-Geräten ohne dedizierte GPUs unglaublich leistungsfähig.
  • ProgLoss + STAL: Fortschrittliche Verlustfunktionen, die die Erkennung kleiner Objekte bemerkenswert verbessern – entscheidend für Luftbilder und Robotik.

Entdecke die breitere Landschaft von Vision-Architekturen, einschließlich transformer-basierter Detektoren wie RT-DETR, in unserer umfassenden Ultralytics-Dokumentation.

Kommentare