Zum Inhalt springen

YOLOv5 . EfficientDet: Bewertung von Architekturen zur Echtzeit-Objekterkennung

Wenn Sie ein neues Computer-Vision-Projekt in Angriff nehmen, ist die Wahl der richtigen neuronalen Netzwerkarchitektur eine der wichtigsten Entscheidungen, die Sie treffen müssen. Dieser Leitfaden bietet einen detaillierten technischen Vergleich zwischen Ultralytics YOLOv5 und Google EfficientDet. Durch die Analyse ihrer Architekturen, Leistungskennzahlen und Trainingsökosysteme möchten wir Entwicklern und Forschern dabei helfen, das beste Objekterkennungsmodell für ihre spezifischen Einsatzumgebungen zu finden.

Während EfficientDet neue Konzepte für die zusammengesetzte Skalierung und Merkmalsfusion einführte, YOLOv5 die Branche revolutioniert, indem es den Zugang zu leistungsstarker KI durch seine unglaublich intuitive PyTorch , einer optimierten Benutzererfahrung und einer beispiellosen Balance zwischen Geschwindigkeit und Genauigkeit.

Ultralytics YOLOv5: Der Industriestandard für Barrierefreiheit

YOLOv5 wurde im Sommer 2020 veröffentlicht und YOLOv5 einen entscheidenden Wandel in der YOLO . Durch den Übergang vom C-basierten Darknet-Framework zum nativen PyTorch wurde es zur bevorzugten Architektur für Entwickler, die Modelle schnell erstellen, trainieren und bereitstellen wollten.

Architektonische Innovationen

YOLOv5 für seine hochoptimierte Architektur geschätzt, die einen nahtlosen Machine-Learning-Lebenszyklus priorisiert. Es nutzt ein modifiziertes CSPDarknet53-Backbone in Verbindung mit einem Path Aggregation Network (PANet)-Neck, wodurch die Merkmalsausbreitung über mehrere räumliche Skalen hinweg drastisch verbessert wird.

Zu den wichtigsten Fortschritten gehören:

  • Mosaik-Datenanreicherung: Diese Trainingstechnik kombiniert vier verschiedene Trainingsbilder zu einem einzigen Mosaik. Dadurch wird das Modell gezwungen, zu lernen, wie Objekte in komplexen räumlichen Kontexten identifiziert werden können, und seine Fähigkeit, detect Ziele zu detect , wird erheblich verbessert.
  • Automatisch lernende Ankerboxen: Vor Beginn des Trainings YOLOv5 Ihre benutzerdefinierten Trainingsdaten und berechnet automatisch die optimalen Abmessungen der Ankerboxen mithilfe von k-Means-Clustering.
  • Speichereffizienz: Im Vergleich zu schwerfälligen transformatorbasierten Modellen YOLOv5 sowohl beim Training als auch bei der Inferenz deutlich weniger Speicherplatz, sodass es reibungslos auf handelsüblicher Hardware ausgeführt werden kann.

Erfahren Sie mehr über YOLOv5

EfficientDet: Skalierbare Objekterkennung

EfficientDet wurde 2019 von Google eingeführt und hatte zum Ziel, eine Familie skalierbarer Objektdetektoren bereitzustellen. Es baut auf dem EfficientNet-Bildklassifizierungs-Backbone auf und führt einen neuartigen Mechanismus zur Merkmalsfusion ein.

Architektonische Innovationen

Das Kernversprechen von EfficientDet liegt in seinem systematischen Ansatz zur Skalierung und Funktionsaggregation:

  • BiFPN (Bi-directional Feature Pyramid Network): Im Gegensatz zu herkömmlichen FPNs, die Informationen nur von oben nach unten weitergeben, ermöglicht BiFPN eine schnelle und einfache Fusion von Merkmalen auf mehreren Ebenen, indem es lernfähige Gewichte einführt, um die Bedeutung verschiedener Eingabemerkmale zu erlernen.
  • Compound Scaling: EfficientDet skaliert die Auflösung, Tiefe und Breite für alle Backbone-, Feature-Netzwerk- und Box-/Klassenvorhersagenetzwerke gemeinsam, was zu Modellen führt, die vom leichtgewichtigen D0 bis zum massiven D7 reichen.

Erfahren Sie mehr über EfficientDet

Unterschiede im Rahmenwerk

Während EfficientDet stark auf dem TensorFlow Ökosystem und AutoML-Bibliotheken, während YOLOv5 nativ in PyTorch YOLOv5 und damit einen für viele Entwickler intuitiveren, pythonischeren und besser debugbaren Workflow bietet.

Leistung und Metriken im Vergleich

Beim Vergleich dieser Modelle ist es entscheidend, ihre Leistung anhand von Standard-Benchmarks wie dem COCO zu bewerten. Die folgende Tabelle zeigt die Kompromisse zwischen Größe, Rechenaufwand (FLOPs) und Inferenzgeschwindigkeit auf.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Ausgewogene Analyse

YOLOv5 zeichnet sich durch seine Flexibilität bei der Bereitstellung und seine Kompatibilität mit Hardwarebeschleunigung aus. Beachten Sie die rasanten TensorRT auf der GPU. Dadurch eignet sich YOLOv5 für Videoanalysen mit hohem Durchsatz und Echtzeit-Inferenz-Pipelines. Darüber hinaus ermöglicht das Ultralytics den Export in Formate wie ONNX, CoreMLund TensorRT ein einzeiliger Befehl.

EfficientDet bietet eine hervorragende Parametereffizienz. Bei einer gegebenen Parameteranzahl erzielt es oft eine hohe mittlere durchschnittliche Genauigkeit (mAP). Diese theoretische Effizienz führt jedoch aufgrund des komplexen Routings der BiFPN-Schicht, das eher durch die Speicherbandbreite als durch die Rechenleistung begrenzt sein kann, nicht immer zu schnelleren Wall-Clock-Inferenzzeiten auf Edge-GPUs.

Ökosystem und Benutzerfreundlichkeit

Der entscheidende Vorteil der Wahl eines Ultralytics liegt im umgebenden Ökosystem. YOLOv5 Teil eines intensiv gepflegten, aktiv entwickelten Repositorys mit massiver Unterstützung durch die Community.

Mit der Einführung der Ultralytics können Benutzer nahtlos von der Datenerfassung zur Bereitstellung übergehen. Diese Plattform unterstützt sofort einsatzbereite Funktionen wie automatische Annotation, Cloud-Training und Modellüberwachung. Im Gegensatz dazu erfordert das Training von EfficientDet oft die Navigation durch die Komplexität älterer TensorFlow , was für das Rapid Prototyping eine steile Lernkurve bedeuten kann.

Darüber hinaus geht die Vielseitigkeit YOLOv5 über Bounding Boxes hinaus. Durch kontinuierliche Updates unterstützt das Ultralytics nativ die Instanzsegmentierung und Bildklassifizierung und bietet eine einheitliche API für mehrere Computer-Vision-Aufgaben.

Ideale Anwendungsfälle

  • Wählen Sie YOLOv5 , YOLOv5 Sie schnelles Prototyping, eine reibungslose Trainingserfahrung und eine hochoptimierte Edge-Bereitstellung benötigen. Es eignet sich ideal für Drohnen, Einzelhandelsanalysen und mobile Anwendungen, bei denen eine geringe Latenz entscheidend ist.
  • Wählen Sie EfficientDet, wenn: Sie ausschließlich in einer Google TensorFlow -Umgebung arbeiten und maximale Genauigkeit pro Parameter ohne strenge Echtzeit-Latenzauflagen benötigen.

Die nächste Generation: YOLO26 willkommen heißen

Während YOLOv5 ein zuverlässiges Arbeitstier YOLOv5 , hat sich die Landschaft der Computer Vision weiterentwickelt. Für Entwickler, die im Jahr 2026 auf der Suche nach dem absoluten Stand der Technik sind, stellt YOLO26 den neuen Höhepunkt der Ultralytics dar.

Aufbauend auf dem Erbe seiner Vorgänger (wie YOLOv8 und YOLO11) führt YOLO26 bahnbrechende Neuerungen ein:

  • End-to-End-Design NMS: YOLO26 macht eine Nachbearbeitung mit Non-Maximum Suppression überflüssig. Dies reduziert die Latenzschwankungen erheblich und vereinfacht die Bereitstellungsarchitektur.
  • Bis zu 43 % schnellere CPU : Durch die umfassende Optimierung für Edge-KI bietet es beispiellose Geschwindigkeiten für Edge-Geräte mit geringem Stromverbrauch und Standard-CPUs ohne dedizierte GPUs.
  • MuSGD-Optimierer: Inspiriert von den Trainingstechniken großer Sprachmodelle (LLM) gewährleistet diese Mischung aus SGD Muon ein äußerst stabiles Training und eine schnelle Konvergenz.
  • Erweiterte Verlustfunktionen: Die Integration von ProgLoss und STAL verbessert die Erkennung kleiner Ziele erheblich, was für Drohnenbilder und Robotik in großer Höhe von entscheidender Bedeutung ist.
  • DFL-Entfernung: Durch die Entfernung von Distribution Focal Loss wird der Modellexportprozess optimiert, wodurch die Kompatibilität zwischen verschiedenen Hardware-Beschleunigern weiter verbessert wird.

Benutzer, die daran interessiert sind, andere aktuelle Architekturen innerhalb des Ultralytics zu erkunden, können auch Modelle wie YOLOv10 oder RT-DETR.

Die Migration ist einfach

DiePython ist auf Abwärts- und Aufwärtskompatibilität ausgelegt. Das Upgrade von YOLOv5 YOLO26 ist buchstäblich so einfach wie das Ändern der Modellgewichtungszeichenfolge in Ihrem Code!

Codebeispiel: Training und Inferenz

Um die unvergleichliche Benutzerfreundlichkeit des Ultralytics zu demonstrieren, zeigen wir Ihnen hier, wie Sie mit einem modernen YOLO trainieren und Inferenz durchführen können. Dieser Code ist zu 100 % lauffähig und übernimmt automatisch das Herunterladen von Datensätzen, Trainingsschleifen und die Validierung.

from ultralytics import YOLO

# Load a modern model (Swap 'yolov5s.pt' for 'yolo26n.pt' to test the newest architecture!)
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 example dataset for 20 epochs
results = model.train(data="coco8.yaml", epochs=20, imgsz=640)

# Run inference on an image from the web
inference_results = model("https://ultralytics.com/images/bus.jpg")

# Display the image with bounding boxes
inference_results[0].show()

Durch die Priorisierung der Benutzererfahrung, die Aufrechterhaltung eines robusten Ökosystems und die kontinuierliche Erweiterung der Grenzen des Möglichen mit Updates wie YOLO26 Ultralytics , dass Entwickler stets über die besten Tools verfügen, um reale Herausforderungen im Bereich der visuellen Intelligenz zu lösen.


Kommentare