Zum Inhalt springen

EfficientDet vs. YOLOv9: Vergleich von Architektur und Leistung

In der sich schnell entwickelnden Landschaft der Computervision ist die Auswahl der richtigen Objektdetektionsarchitektur eine wichtige Entscheidung, die sich auf alles auswirkt, von den Schulungskosten bis zur Bereitstellungslatenz. Diese technische Analyse bietet einen umfassenden Vergleich zwischen EfficientDet, einer bahnbrechenden Architektur von Google auf effiziente Skalierung Google , und YOLOv9, einer modernen Weiterentwicklung der YOLO , die programmierbare Gradienteninformationen für überlegenes Feature-Lernen einführt.

Zusammenfassung

EfficientDet führte zwar bahnbrechende Konzepte in den Bereichen Modellskalierung und Merkmalsfusion ein, gilt heute jedoch als veraltete Architektur. Seine Abhängigkeit von komplexen BiFPN-Schichten führt im Vergleich zu den optimierten Designs der YOLO häufig zu langsameren Inferenzgeschwindigkeiten auf moderner Hardware.

YOLOv9 stellt einen bedeutenden Fortschritt dar und bietet eine höhere Genauigkeit bei deutlich überlegenen Inferenzgeschwindigkeiten. Darüber hinaus YOLOv9 als Teil des Ultralytics von einer einheitlichen API, einer vereinfachten Bereitstellung und einer robusten Community-Unterstützung, was es zur empfohlenen Wahl für Produktionsumgebungen macht.

EfficientDet: Skalierbare und effiziente Objekterkennung

EfficientDet wurde entwickelt, um das Problem der effizienten Skalierung von Objektdetektoren zu lösen. Frühere Modelle skalierten oft einfach durch Vergrößerung des Backbones, wodurch das Gleichgewicht zwischen Auflösung, Tiefe und Breite außer Acht gelassen wurde.

Wesentliche Architekturmerkmale

  • Zusammengesetzte Skalierung: EfficientDet schlägt eine zusammengesetzte Skalierungsmethode vor, die die Auflösung, Tiefe und Breite für alle Backbone-, Merkmalsnetzwerk- und Box-/Klassenvorhersagenetzwerke einheitlich skaliert.
  • BiFPN (Bidirectional Feature Pyramid Network): Eine wichtige Innovation, die eine einfache Fusion von Merkmalen auf mehreren Ebenen ermöglicht. Im Gegensatz zu herkömmlichen FPNs fügt BiFPN Bottom-up-Pfade hinzu und entfernt Knoten mit nur einem Eingang, wobei lernbare Gewichte integriert werden, um die Bedeutung verschiedener Eingangsmerkmale zu verstehen.
  • EfficientNet-Backbone: Es nutzt EfficientNet als Backbone, das für Parametereffizienz optimiert ist.

Autoren: Mingxing Tan, Ruoming Pang und Quoc V. Le
Organisation:Google
Datum: 20.11.2019
Links:Arxiv | GitHub

Erfahren Sie mehr über EfficientDet

YOLOv9: Programmierbare Gradienteninformation

YOLOv9 befasst sich mit einem grundlegenden Problem beim Deep Learning: Informationsengpässen. Wenn Daten die Schichten eines tiefen neuronalen Netzwerks durchlaufen, gehen zwangsläufig Informationen verloren. YOLOv9 dieses Problem durch Programmable Gradient Information (PGI) und eine neue Architektur namens GELAN.

Wesentliche Architekturmerkmale

  • GELAN (Generalized Efficient Layer Aggregation Network): Diese Architektur kombiniert die besten Aspekte von CSPNet und ELAN. Sie optimiert Gradientenabstiegspfade und stellt sicher, dass das Modell leichtgewichtige, aber informationsreiche Merkmale lernt.
  • PGI (Programmable Gradient Information): PGI bietet einen zusätzlichen Überwachungszweig, der den Lernprozess steuert und sicherstellt, dass der Hauptzweig wichtige Informationen behält, die für eine genaue Erkennung erforderlich sind. Dies ist besonders nützlich für die Erkennung schwieriger Ziele in komplexen Umgebungen.
  • Einfachheit: Trotz dieser internen Komplexitäten bleibt die Inferenzstruktur schlank und vermeidet die hohen Rechenkosten, die mit dem in EfficientDet verwendeten BiFPN verbunden sind.

Autoren: Chien-Yao Wang und Hong-Yuan Mark Liao
Organisation: Institut für Informationswissenschaft, Academia Sinica, Taiwan
Datum: 21.02.2024
Links:Arxiv | GitHub

Erfahren Sie mehr über YOLOv9

Technischer Leistungsvergleich

Beim Vergleich dieser Modelle wird der Kompromiss zwischen Parametereffizienz und tatsächlicher Laufzeitlatenz deutlich. EfficientDet ist zwar parametereffizient, aber seine komplexe Graphstruktur (BiFPN) ist weniger GPU als die in YOLOv9 verwendeten Standardkonvolutionen.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Leistungsanalyse

YOLOv9 übertrifft EfficientDet YOLOv9 in Bezug auf das Verhältnis von Geschwindigkeit zu Genauigkeit. Beispielsweise erreicht YOLOv9c einen vergleichbaren mAP 53,0 %) wie EfficientDet-d6 (52,6 %), läuft jedoch auf einer GPU mehr als 12-mal schneller GPU 7,16 ms gegenüber 89,29 ms). Dies macht YOLOv9 besseren Wahl für Echtzeitanwendungen.

Ausbildung und Erfahrung im Ökosystem

Ein wesentliches Unterscheidungsmerkmal zwischen diesen Architekturen ist die Benutzerfreundlichkeit und die Unterstützung des Ökosystems durch Ultralytics.

Effiziente Herausforderungen

Das Training mit EfficientDet umfasst in der Regel die Navigation durch die TensorFlow Detection API oder ältere Repositorys. Diese können aufgrund von Abhängigkeitskonflikten schwierig einzurichten sein und bieten oft keine Unterstützung für moderne Funktionen wie automatisches Training mit gemischter Genauigkeit oder einfache Cloud-Logging-Integration.

Der Ultralytics Vorteil

Die Verwendung von YOLOv9 des Ultralytics bietet eine nahtlose Erfahrung. Das Ökosystem übernimmt automatisch die Datenvergrößerung, die Hyperparameter-Entwicklung und den Export.

  • Benutzerfreundlichkeit: Sie können mit wenigen Zeilen Code mit dem Training beginnen.
  • Speichereffizienz: Ultralytics sind so optimiert, dass sie während des Trainings weniger VRAM verbrauchen, wodurch im Vergleich zu komplexen Netzwerken mit mehreren Verzweigungen größere Batch-Größen auf Consumer-GPUs möglich sind.
  • Vielseitigkeit: Über die Erkennung hinaus unterstützt die Ultralytics die Instanzsegmentierung und Posenschätzung, Funktionen, die in Standard-EfficientDet-Implementierungen nicht nativ verfügbar sind.
from ultralytics import YOLO

# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Anwendungen in der realen Welt

Die Wahl des Modells hat einen erheblichen Einfluss auf die Durchführbarkeit verschiedener Anwendungen.

Ideale Anwendungsfälle für EfficientDet

  • Akademische Forschung: Nützlich für die Untersuchung von Merkmalsfusionstechniken und zusammengesetzten Skalierungstheorien.
  • Szenarien mit geringer Leistung/geringer Geschwindigkeit: In ganz bestimmten Randfällen, in denen ältere Hardware fest für EfficientNet-Backbones programmiert ist (z. B. bestimmte ältere Coral-TPUs), können EfficientDet-Lite-Varianten weiterhin relevant sein.

Ideale Anwendungsfälle für YOLOv9

  • Autonome Navigation: Die hohe Inferenzgeschwindigkeit ist entscheidend für selbstfahrende Autos, die Eingaben in Millisekunden verarbeiten müssen, um die Sicherheit zu gewährleisten.
  • Einzelhandelsanalyse: Für Anwendungen wie die Bestandsverwaltung YOLOv9 die erforderliche Genauigkeit, um zwischen ähnlichen Produkten zu unterscheiden, ohne die Kassensysteme zu blockieren.
  • Gesundheitswesen: Bei der medizinischen Bildanalyse hilft die PGI-Architektur dabei, feine Details zu erhalten, die für die Erkennung kleiner Anomalien in Röntgenbildern oder MRT-Scans erforderlich sind.

Die Zukunft: Upgrade auf YOLO26

YOLOv9 zwar ein leistungsstarkes Tool, doch Ultralytics dafür Ultralytics , die Grenzen der visuellen KI zu erweitern. Für Entwickler, die auf der Suche nach absoluter Spitzenleistung sind, bietet YOLO26 gegenüber EfficientDet und YOLOv9 erhebliche Verbesserungen.

YOLO26 führt ein NMS Design ein, wodurch die Notwendigkeit einer Nachbearbeitung mit Non-Maximum Suppression vollständig entfällt. Dies führt zu einfacheren Bereitstellungspipelines und einer schnelleren Inferenz. Darüber hinaus bietet YOLO26 mit dem neuen MuSGD-Optimierer– einer Mischung aus SGD Muon – ein stabileres Training und eine schnellere Konvergenz.

Für den Einsatz am Netzwerkrand ist YOLO26 für CPU bis zu 43 % schnellere CPU optimiert und umfasst DFL Removal für eine bessere Kompatibilität mit Geräten mit geringem Stromverbrauch. Ganz gleich, ob Sie im Bereich Robotik oder Hochdurchsatz-Videoanalyse tätig sind, YOLO26 setzt neue Maßstäbe.

Entdecken Sie die Leistungsfähigkeit von YOLO26

Für Nutzer, die sich für andere hochmoderne Architekturen interessieren, empfehlen wir außerdem, sich mit YOLO11 und RT-DETR in der Ultralytics zu erkunden.


Kommentare