Zum Inhalt springen

EfficientDet vs. YOLOv5: Balance zwischen Skalierbarkeit und Echtzeitleistung

Bei der Auswahl der richtigen Objektdetektionsarchitektur müssen die Kompromisse zwischen Genauigkeit, Inferenzgeschwindigkeit und Komplexität der Bereitstellung abgewogen werden. Dieser Leitfaden enthält einen detaillierten technischen Vergleich zwischen EfficientDet, einer skalierbaren Architektur von Google , und YOLOv5, dem weit verbreiteten Echtzeit-Detektor von Ultralytics.

Während EfficientDet bahnbrechende Konzepte im Bereich der Compound-Skalierung einführte, YOLOv5 das Feld, indem es leistungsstarke Computer Vision durch eine optimierte API und ein robustes Ökosystem zugänglich machte.

Modellübersicht

Google EfficientDet

EfficientDet baut auf dem EfficientNet-Backbone auf und wendet eine zusammengesetzte Skalierungsmethode an, die Auflösung, Tiefe und Breite einheitlich skaliert. Es führte das bidirektionale Feature-Pyramiden-Netzwerk (BiFPN) ein, um eine einfache und schnelle Fusion von Merkmalen auf mehreren Ebenen zu ermöglichen.

Ultralytics YOLOv5

YOLOv5 konzentriert sich auf die Praxistauglichkeit und Geschwindigkeit. Es verwendet ein CSPDarknet-Backbone und wurde für eine einfache Schulung und Bereitstellung auf unterschiedlicher Hardware entwickelt. Aufgrund seiner ausgewogenen Leistung und Effizienz ist es nach wie vor eines der beliebtesten Modelle.

Erfahren Sie mehr über YOLOv5

Technischer Architekturvergleich

Die architektonischen Philosophien dieser beiden Modelle unterscheiden sich erheblich voneinander, was sich auf ihre Eignung für verschiedene Aufgaben auswirkt.

EfficientDet: Compound Scaling und BiFPN

Die Kerninnovation von EfficientDet ist das BiFPN (Weighted Bi-directional Feature Pyramid Network). Im Gegensatz zu Standard-FPNs, die Merkmale unterschiedslos summieren, führt BiFPN lernbare Gewichte ein, um die Bedeutung verschiedener Eingabemerkmale zu verstehen. Dadurch kann das Netzwerk während der Fusion informativere Merkmale priorisieren.

Darüber hinaus verwendet EfficientDet Compound Scaling, wodurch gleichzeitig die Auflösung, Tiefe und Breite des Backbones, des Feature-Netzwerks und des Vorhersagenetzwerks erhöht werden. Dadurch können Benutzer je nach ihren Ressourcenbeschränkungen aus einer Reihe von Modellen (D0 bis D7) wählen. Diese Komplexität kann jedoch zu einer höheren Latenz auf Edge-Geräten führen, die keine spezielle Unterstützung für diese Vorgänge bieten.

YOLOv5: CSPDarknet und PANet

YOLOv5 ein CSPDarknet -Backbone, das Cross Stage Partial-Netzwerke integriert. Dieses Design reduziert die Anzahl der Parameter und FLOPS und behält gleichzeitig die Genauigkeit bei, indem es die Merkmalskarte auf der Basisebene aufteilt.

Für die Merkmalsaggregation YOLOv5 ein Path Aggregation Network (PANet). Diese Struktur verbessert den Informationsfluss von den unteren Schichten nach oben und optimiert so die Lokalisierung von Objekten – entscheidend für genaue Begrenzungsrahmen. Der Kopf ist ankerbasiert und prognostiziert Offsets aus vordefinierten Ankerrahmen. Diese Architektur ist hochgradig für GPU optimiert, was zu schnelleren Inferenzzeiten im Vergleich zu den komplexen Skalierungsoperationen von EfficientDet führt.

Der Vorteil des Ultralytics-Ökosystems

Die Entscheidung für YOLOv5 Zugang zum Ultralytics und gewährleistet eine nahtlose Integration mit Tools für Datenannotation, Experimentverfolgung und Cloud-Training über die Ultralytics . Diese Unterstützungsstruktur fehlt häufig in forschungsorientierten Repositorien wie EfficientDet.

Leistungsmetriken

Bei der Bewertung der Leistung ist es entscheidend, sowohl die Genauigkeit (mAP) als auch die Geschwindigkeit (Latenz) zu betrachten. EfficientDet skaliert zwar mit seinen größeren Varianten (D7) auf eine höhere Genauigkeit, verursacht jedoch im Vergleich zu YOLOv5 vergleichbarer Größe oft erhebliche Geschwindigkeitseinbußen.

Die folgende Tabelle zeigt die Leistungsunterschiede. Beachten Sie, dass YOLOv5 deutlich schnellere CPU YOLOv5 , wodurch es für den Einsatz ohne spezielle Beschleuniger weitaus praktischer ist.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Analyse

  1. Geschwindigkeit vs. Genauigkeit: EfficientDet-d0 ist hinsichtlich der FLOPs sehr effizient, aber in der Praxis laufen YOLOv5n und YOLOv5s aufgrund hardwarefreundlicherer Operationen (Vermeidung von tiefenseparierbaren Faltungen, die auf einigen älteren CUDA langsam sein können) auf Standard-GPUs oft schneller.
  2. Speichereffizienz: YOLOv5 benötigt während des Trainings YOLOv5 weniger VRAM, was größere Batch-Größen auf handelsüblicher Hardware ermöglicht. Die komplexen Verbindungen von EfficientDet können den Speicherbedarf erhöhen.
  3. Optimierung: EfficientDet stützt sich stark auf AutoML-Suchen nach Architekturen, die sich nur schwer ändern lassen. YOLOv5 eine einfachere Anpassung der Tiefen- und Breitenmultiplikatoren direkt in der YAML-Konfiguration.

Training und Usability

Trainingseffizienz

Ultralytics YOLOv5 bekannt für seine „Train-out-of-the-Box”-Fähigkeit. Das Repository umfasst Mosaic-Datenvergrößerung, automatische Ankerberechnung und Hyperparameter-Evolution. Das bedeutet, dass Benutzer ohne umfangreiche Anpassungen hervorragende Ergebnisse mit benutzerdefinierten Datensätzen erzielen können. EfficientDet-Implementierungen erfordern oft eine aufwändigere manuelle Einrichtung von TensorFlow und eine sorgfältige Planung der Lernrate.

Vielseitigkeit beim Einsatz

Während EfficientDet in erster Linie ein Objekterkennungsmodell ist, unterstützen YOLOv5 seine Nachfolger in der Ultralytics ein breiteres Spektrum an Aufgaben. Sie können nahtlos zur Instanzsegmentierung oder Bildklassifizierung wechseln, indem Sie dieselbe API-Struktur verwenden.

Darüber hinaus YOLOv5 die Bereitstellung YOLOv5 durch den Exportmodus vereinfacht, der die Konvertierung zu ONNX, TensorRT, CoreML und TFLite mit einem Klick unterstützt.

from ultralytics import YOLO

# Load a pretrained YOLOv5 model
model = YOLO("yolov5s.pt")

# Train the model on a custom dataset
model.train(data="coco128.yaml", epochs=100)

# Export to ONNX format for deployment
model.export(format="onnx")

Zukunftssicherheit: Argumente für YOLO26

YOLOv5 zwar YOLOv5 eine gute Wahl, doch der Bereich hat sich weiterentwickelt. Für Entwickler, die auf der Suche nach dem absolut Neuesten sind, baut YOLO26 auf dem Erbe von YOLOv5 auf YOLOv5 erhebliche architektonische Verbesserungen.

YOLO26 führt ein End-to-End-Design NMS ein, wodurch die Nachbearbeitung mit Non-Maximum Suppression entfällt. Dies reduziert die Latenz und vereinfacht die Bereitstellungspipeline, was einen großen Vorteil gegenüber EfficientDet und YOLOv5 darstellt. Darüber hinaus nutzt YOLO26 den MuSGD-Optimierer, der vom LLM-Training inspiriert ist und selbst bei schwierigen Datensätzen eine schnellere Konvergenz und ein stabiles Training gewährleistet.

Wenn Ihr Projekt Edge-KI umfasst, ist YOLO26 speziell für CPU optimiert und bietet Geschwindigkeiten, die bis zu 43 % schneller sind als bei früheren Generationen.

Erfahren Sie mehr über YOLO26

Ideale Anwendungsfälle

Wann EfficientDet wählen?

  • Forschungsbeschränkungen: Wenn das primäre Ziel darin besteht, Skalierungsgesetze für Verbindungen zu untersuchen oder bestimmte akademische Benchmarks zu reproduzieren.
  • Low-FLOP-Regimes: In theoretischen Szenarien, in denen die FLOP-Zahl die einzige relevante Kennzahl ist und die Kosten für den Speicherzugriff oder die tatsächliche Latenz der Hardware außer Acht gelassen werden.

Wann sollte man sich für Ultralytics YOLOv5 oder YOLO26) entscheiden?

  • Echtzeitanwendungen: Autonomes Fahren, Videoanalyse und Robotik, wo geringe Latenzzeiten unverzichtbar sind.
  • Edge-Bereitstellung: Läuft auf Raspberry Pi, NVIDIA oder Mobilgeräten, bei denen Speichereffizienz undTensorRT entscheidend sind.
  • Schnelle Entwicklung: Projekte, die schnelle Iterationszyklen, einfache Datenverwaltung und zuverlässige vortrainierte Gewichte erfordern.
  • Vielfältige Aufgaben: Wenn Ihr Projekt möglicherweise um Posenschätzung oder orientierte Objekterkennung (OBB) erweitert wird, unterstützt das Ultralytics diese Funktionen nativ.

Zusammenfassung

Sowohl EfficientDet als auch YOLOv5 einen bedeutenden Beitrag zur Computer Vision geleistet. EfficientDet demonstrierte die Leistungsfähigkeit systematischer Skalierung, während YOLOv5 die Hochleistungserkennung YOLOv5 . Für die meisten praktischen Anwendungen bietet das Ultralytics – vertreten durch YOLOv5 das hochmoderne YOLO26– eine hervorragende Balance zwischen Geschwindigkeit, Genauigkeit und Benutzerfreundlichkeit, unterstützt durch eine kontinuierlich aktualisierte Codebasis und eine florierende Community.

Weitere Informationen zum Modellvergleich finden Sie unter YOLO im Vergleich zu anderen Modellen wie YOLOv8 EfficientDet oder dem Transformer-basierten RT-DETR.


Kommentare