Zum Inhalt springen

YOLOv5 vs YOLOv9: Ein detaillierter Vergleich

Diese Seite bietet einen technischen Vergleich zwischen zwei bedeutenden Objekterkennungsmodellen: Ultralytics YOLOv5 und YOLOv9. Beide Modelle sind Teil der einflussreichen YOLO-Serie (You Only Look Once), die für das Ausbalancieren von Geschwindigkeit und Genauigkeit bei der Echtzeit-Objekterkennung bekannt ist. Dieser Vergleich untersucht ihre architektonischen Unterschiede, Leistungskennzahlen und idealen Anwendungsfälle, um Ihnen bei der Auswahl des am besten geeigneten Modells für Ihre Computer-Vision-Projekte zu helfen.

Ultralytics YOLOv5: Der etablierte Industriestandard

Autor: Glenn Jocher
Organisation: Ultralytics
Datum: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Dokumentation: https://docs.ultralytics.com/models/yolov5/

Ultralytics YOLOv5 erfreute sich nach seiner Veröffentlichung aufgrund seiner bemerkenswerten Balance aus Geschwindigkeit, Genauigkeit und Benutzerfreundlichkeit schnell großer Beliebtheit. YOLOv5 wurde vollständig in PyTorch entwickelt und verfügt über eine Architektur, die CSPDarknet53 als Backbone und PANet für die Feature-Aggregation verwendet, zusammen mit einem effizienten ankerbasierten Erkennungskopf. Es bietet verschiedene Modellgrößen (n, s, m, l, x), sodass Benutzer je nach ihren Rechenressourcen und Leistungsanforderungen wählen können.

Stärken

  • Außergewöhnliche Geschwindigkeit und Effizienz: YOLOv5 ist hochgradig für schnelle Inferenz optimiert und somit ideal für Echtzeitanwendungen auf verschiedenen Hardwareplattformen, einschließlich Edge-Geräten.
  • Benutzerfreundlichkeit: Ultralytics YOLOv5 ist bekannt für seine optimierte Benutzererfahrung, einfache Python- und CLI-Schnittstellen und umfangreiche Dokumentation.
  • Gut gepflegtes Ökosystem: Profitiert vom integrierten Ultralytics-Ökosystem mit aktiver Entwicklung, einer großen und unterstützenden Community, häufigen Aktualisierungen und umfassenden Ressourcen wie Ultralytics HUB für Training ohne Code.
  • Leistungsbalance: Erzielt einen starken Kompromiss zwischen Inferenzgeschwindigkeit und Erkennungsgenauigkeit, der für verschiedene reale Einsatzszenarien geeignet ist.
  • Vielseitigkeit: Unterstützt mehrere Aufgaben, einschließlich Objekterkennung, Instanzsegmentierung und Bildklassifizierung.
  • Trainingseffizienz: Bietet effiziente Trainingsprozesse, leicht verfügbare vortrainierte Gewichte und im Allgemeinen geringere Speicheranforderungen im Vergleich zu vielen anderen Architekturen, insbesondere auf Transformer-basierenden Modellen.

Schwächen

  • Genauigkeit: Obwohl es für seine Zeit sehr genau war, können neuere Modelle wie YOLOv9 höhere mAP-Werte bei Benchmarks wie COCO erzielen.
  • Anchor-basiert: Basiert auf vordefinierten Anchor-Boxen, die im Vergleich zu ankerfreien Ansätzen möglicherweise eine stärkere Feinabstimmung für bestimmte Datensätze erfordern.

Anwendungsfälle

Erfahren Sie mehr über YOLOv5

YOLOv9: Verbesserung der Genauigkeit mit neuartigen Techniken

Autoren: Chien-Yao Wang, Hong-Yuan Mark Liao
Organisation: Institute of Information Science, Academia Sinica, Taiwan
Datum: 2024-02-21
Arxiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9
Dokumentation: https://docs.ultralytics.com/models/yolov9/

YOLOv9 führt bedeutende architektonische Innovationen ein, nämlich Programmable Gradient Information (PGI) und das Generalized Efficient Layer Aggregation Network (GELAN). PGI zielt darauf ab, Informationsverluste zu mindern, wenn Daten durch tiefe Netzwerke fließen, indem es vollständige Eingangsinformationen für die Berechnung der Verlustfunktion bereitstellt. GELAN ist eine neuartige Architektur, die für eine überlegene Parameternutzung und Recheneffizienz entwickelt wurde. Diese Fortschritte ermöglichen es YOLOv9, eine höhere Genauigkeit bei gleichzeitiger Wahrung der Effizienz zu erzielen.

Stärken

  • Erhöhte Genauigkeit: Erzielt neue State-of-the-Art-Ergebnisse auf dem COCO-Datensatz für Echtzeit-Objektdetektoren und übertrifft YOLOv5 und andere Modelle in mAP.
  • Verbesserte Effizienz: GELAN und PGI tragen zu Modellen bei, die weniger Parameter und Rechenressourcen (FLOPs) für eine vergleichbare oder bessere Leistung als frühere Modelle benötigen.
  • Information Preservation: PGI adressiert effektiv das Problem des Information Bottleneck, was entscheidend für das akkurate Trainieren tieferer und komplexerer Netzwerke ist.

Schwächen

  • Trainingsressourcen: Das Training von YOLOv9-Modellen kann ressourcenintensiver und zeitaufwändiger sein als Ultralytics YOLOv5, wie in der YOLOv9-Dokumentation erwähnt.
  • Neuere Architektur: Da es sich um ein neueres Modell einer anderen Forschungsgruppe handelt, sind sein Ökosystem, die Unterstützung durch die Community und die Integrationen von Drittanbietern weniger ausgereift als das etablierte Ultralytics YOLOv5.
  • Aufgabenvielfalt: Primär auf die Objekterkennung ausgerichtet, es fehlt die integrierte Unterstützung für Segmentierung, Klassifizierung und Pose-Schätzung, die in Ultralytics-Modellen wie YOLOv5 und YOLOv8 zu finden ist.

Anwendungsfälle

  • Anwendungen, die höchste Genauigkeit bei der Objekterkennung erfordern.
  • Szenarien, in denen die Berechnungseffizienz neben hoher Leistung entscheidend ist.
  • Fortschrittliche Videoanalytik und hochpräzise industrielle Inspektion.
  • KI im Verkehrsmanagement und Smart-City-Anwendungen, die erstklassige Erkennung erfordern.

Erfahren Sie mehr über YOLOv9

Performance und Benchmarks: YOLOv5 vs. YOLOv9

Beim Vergleich der Leistung erzielen YOLOv9-Modelle im Allgemeinen höhere mAP-Werte als ihre YOLOv5-Pendants, was die Wirksamkeit ihrer architektonischen Innovationen demonstriert. Ultralytics YOLOv5 behält jedoch aufgrund seiner außergewöhnlichen Inferenzgeschwindigkeit und hochoptimierten Implementierung eine starke Position und ist damit eine formidable Wahl für Echtzeitanwendungen, bei denen Bilder pro Sekunde (FPS) eine kritische Metrik sind.

Modell Größe
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0

Architektonischer Deep Dive

YOLOv5-Architektur

Die Architektur von Ultralytics YOLOv5 ist eine verfeinerte Implementierung der YOLO-Familienprinzipien. Sie besteht aus drei Hauptteilen:

  • Backbone: Ein CSPDarknet53-Netzwerk, eine modifizierte Version von Darknet-53, das Cross Stage Partial (CSP)-Module enthält, um die Berechnungen zu reduzieren und gleichzeitig die Genauigkeit beizubehalten.
  • Neck: Ein Path Aggregation Network (PANet) wird verwendet, um Merkmale von verschiedenen Backbone-Ebenen zu aggregieren, wodurch die Erkennung von Objekten in verschiedenen Maßstäben verbessert wird.
  • Head: Der Erkennungs-Head ist ankerbasiert und sagt Begrenzungsrahmen anhand vordefinierter Ankerboxformen voraus, was zu seiner hohen Geschwindigkeit beiträgt.

YOLOv9 Architektur

YOLOv9 führt neuartige Konzepte ein, um die Grenzen von Genauigkeit und Effizienz zu verschieben:

  • Programmable Gradient Information (PGI): Dieser Mechanismus wurde entwickelt, um das Problem des Informationsengpasses in tiefen Netzwerken zu bekämpfen. Er stellt sicher, dass vollständige Eingangsinformationen für die Berechnung der Verlustfunktion verfügbar sind, was zu zuverlässigeren Gradientenaktualisierungen und einer besseren Modellkonvergenz führt.
  • Generalized Efficient Layer Aggregation Network (GELAN): Dies ist eine neue Netzwerkarchitektur, die auf den Prinzipien von CSPNet und ELAN aufbaut. GELAN wurde entwickelt, um die Parameternutzung und die Recheneffizienz zu optimieren, wodurch das Modell mit weniger Ressourcen eine höhere Genauigkeit erzielen kann.

Training und Ökosystem

Die Trainingserfahrung und die Unterstützung durch das Ökosystem sind die Bereiche, in denen Ultralytics YOLOv5 wirklich glänzt.

  • Benutzerfreundlichkeit: YOLOv5 bietet eine unglaublich benutzerfreundliche Erfahrung mit einfachen Befehlszeilen- und Python-APIs, umfangreichen Tutorials und umfassender Dokumentation.
  • Gut gepflegtes Ökosystem: Als offizielles Ultralytics-Modell ist YOLOv5 Teil eines robusten Ökosystems, das aktive Entwicklung, eine große Community auf GitHub und Discord, häufige Updates und nahtlose Integration mit MLOps-Tools wie Ultralytics HUB umfasst.
  • Trainingseffizienz: YOLOv5 ist hocheffizient zu trainieren, mit leicht verfügbaren, vortrainierten Gewichten und geringerem Speicherbedarf im Vergleich zu komplexeren Architekturen. Dies macht es für Benutzer mit einer größeren Bandbreite an Hardware zugänglich.

Obwohl YOLOv9 ein leistungsstarkes Modell ist, kann sein Trainingsprozess anspruchsvoller sein, und sein Ökosystem ist nicht so ausgereift oder integriert wie das der Ultralytics-Modelle. Für Entwickler, die einen reibungslosen, gut unterstützten Weg vom Training bis zur Bereitstellung suchen, bietet YOLOv5 einen klaren Vorteil.

Fazit: Welches Modell sollten Sie wählen?

Sowohl YOLOv5 als auch YOLOv9 sind ausgezeichnete Modelle, die jedoch unterschiedlichen Prioritäten dienen.

  • Ultralytics YOLOv5 ist die ideale Wahl für Entwickler, die Wert auf Geschwindigkeit, Benutzerfreundlichkeit und ein ausgereiftes, gut unterstütztes Ökosystem legen. Seine außergewöhnliche Leistungsbalance macht es perfekt für Echtzeitanwendungen, schnelles Prototyping und die Bereitstellung auf ressourcenbeschränkten Edge-KI-Geräten. Seine Vielseitigkeit bei mehreren Bildverarbeitungsaufgaben erhöht seinen Wert als Allzweck-KI-Framework für die Bildverarbeitung.

  • YOLOv9 eignet sich am besten für Anwendungen, bei denen das Erreichen der höchstmöglichen Objekterkennungsgenauigkeit das Hauptziel ist und die Rechenressourcen für das Training weniger eine Rolle spielen. Seine innovative Architektur liefert modernste Ergebnisse bei anspruchsvollen Benchmarks.

Für die meisten Benutzer, insbesondere für diejenigen, die ein zuverlässiges, schnelles und einfach zu bedienendes Modell mit starkem Community- und kommerziellem Support suchen, bleibt Ultralytics YOLOv5 eine Top-Empfehlung. Für diejenigen, die an den neuesten Fortschritten von Ultralytics interessiert sind, bieten Modelle wie YOLOv8 und das neueste YOLO11 eine noch höhere Leistung und Vielseitigkeit, während sie die benutzerfreundliche Erfahrung beibehalten, die das Ultralytics-Ökosystem auszeichnet.



📅 Vor 1 Jahr erstellt ✏️ Vor 1 Monat aktualisiert

Kommentare