Zum Inhalt springen

YOLOv9 vs. YOLOv5: Ein technischer Vergleich

In der sich schnell entwickelnden Landschaft der Computer Vision ist die Auswahl des richtigen Objekterkennungsmodells entscheidend für den Projekterfolg. Diese Analyse bietet einen detaillierten technischen Vergleich zwischen YOLOv9einer auf die Forschung ausgerichteten Architektur, die die Grenzen der Genauigkeit auslotet, und Ultralytics YOLOv5dem Industriestandardmodell, das für seine Zuverlässigkeit, Geschwindigkeit und Vielseitigkeit bekannt ist. Wir untersuchen die architektonischen Unterschiede, Leistungsbenchmarks und idealen Anwendungsfälle, damit Sie eine fundierte Entscheidung treffen können.

YOLOv9: Architektonische Innovation für maximale Genauigkeit

Anfang 2024 veröffentlicht, adressiert YOLOv9 die theoretischen Grenzen der Objekterkennung, indem es grundlegende Probleme im Informationsfluss des Deep Learning angeht. Es ist für Szenarien konzipiert, in denen Präzision von größter Bedeutung ist.

Autoren: Chien-Yao Wang, Hong-Yuan Mark Liao
Organisation:Institute of Information Science, Academia Sinica, Taiwan
Datum: 2024-02-21
Arxiv:arXiv:2402.13616
GitHub:WongKinYiu/yolov9
Docs:YOLOv9 Documentation

Kernarchitektur

YOLOv9 führt zwei bahnbrechende Konzepte ein: Programmable Gradient Information (PGI) und das Generalized Efficient Layer Aggregation Network (GELAN). PGI bekämpft das in tiefen neuronalen Netzen inhärente Informationsengpassproblem, indem es sicherstellt, dass vollständige Eingabeinformationen für die Verlustfunktion erhalten bleiben, was die Gradientenzuverlässigkeit verbessert. GELAN optimiert die Parametereffizienz und ermöglicht es dem Modell, eine höhere Genauigkeit mit weniger Rechenressourcen zu erzielen, verglichen mit früheren Architekturen, die Tiefen-Faltung nutzen.

Stärken und Schwächen

Die Hauptstärke von YOLOv9 ist seine hochmoderne Genauigkeit bei Benchmarks wie dem COCO-Datensatz. Es zeichnet sich durch die detect kleiner oder verdeckter Objekte aus, wo andere Modelle versagen könnten. Dieser Fokus auf die detect-Genauigkeit bringt jedoch Kompromisse mit sich. Der Trainingsprozess kann ressourcenintensiver sein, und obwohl es in das Ultralytics-Ökosystem integriert ist, sind die breitere Community-Unterstützung und Drittanbieter-Tools im Vergleich zu länger etablierten Modellen noch in der Entwicklung. Zusätzlich bleibt sein Hauptaugenmerk auf der detect, während andere Modelle eine breitere native Multi-Task-Unterstützung bieten.

Erfahren Sie mehr über YOLOv9

Ultralytics YOLOv5: Der vielseitige Industriestandard

Seit seiner Veröffentlichung im Jahr 2020 hat Ultralytics YOLOv5 den Standard für die praktische, reale KI-Bereitstellung gesetzt. Es schafft ein präzises Gleichgewicht zwischen Leistung und Benutzerfreundlichkeit und ist damit eines der meistgenutzten Modelle der Geschichte.

Autor: Glenn Jocher
Organisation:Ultralytics
Datum: 2020-06-26
GitHub:ultralytics/yolov5
Dokumente:YOLOv5 Documentation

Kernarchitektur

YOLOv5 verwendet eine verfeinerte ankerbasierte Architektur mit einem CSPDarknet53-Backbone und einem PANet-Neck für eine robuste Merkmalsaggregation. Sein Design priorisiert Inferenzgeschwindigkeit und technische Optimierung. Das Modell ist in verschiedenen Skalen (Nano bis Extra Large) erhältlich, sodass Entwickler das Modell perfekt an ihre Hardware-Beschränkungen anpassen können, von eingebetteten Edge-Geräten bis hin zu Cloud-GPUs.

Der Ultralytics Vorteil

Während YOLOv9 akademische Grenzen verschiebt, zeichnet sich YOLOv5 durch technische Praktikabilität aus.

  • Benutzerfreundlichkeit: YOLOv5 ist bekannt für seine „Installieren und Ausführen“-Erfahrung. Die optimierte Python API und die umfassende Dokumentation reduzieren die Entwicklungszeit erheblich.
  • Gut gepflegtes Ökosystem: Unterstützt von Ultralytics, profitiert YOLOv5 von aktiver Wartung, einer riesigen Community auf GitHub und nahtloser Integration mit MLOps-Tools.
  • Vielseitigkeit: Über die Objekterkennung hinaus unterstützt YOLOv5 nativ Instanzsegmentierung und Bildklassifizierung und bietet eine einheitliche Lösung für vielfältige Computer-Vision-Aufgaben.
  • Speichereffizienz: Ultralytics-Modelle sind für einen geringeren Speicherbedarf sowohl während des Trainings als auch der Inferenz optimiert, im Gegensatz zu den hohen Anforderungen transformatorbasierter Alternativen.

Erfahren Sie mehr über YOLOv5

Leistungskennzahlen: Geschwindigkeit vs. Genauigkeit

Der folgende Vergleich hebt die unterschiedlichen Rollen dieser Modelle hervor. YOLOv9 erreicht im Allgemeinen einen höheren mAP (mean Average Precision), insbesondere bei größeren Modellgrößen (c und e). Dies macht es überlegen für Aufgaben, die granulare Details erfordern.

Im Gegensatz dazu bietet YOLOv5 unschlagbare Inferenzgeschwindigkeiten, insbesondere mit seinen Nano (n) und Small (s) Varianten. Für Echtzeitanwendungen auf Edge-Hardware wie dem NVIDIA Jetson oder Raspberry Pi bleibt YOLOv5 aufgrund seiner schlanken Architektur und der ausgereiften TensorRT-Optimierung ein Top-Anwärter.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Bereitstellungstipp

Für maximale Bereitstellungsflexibilität können beide Modelle mit dem Ultralytics Exportmodus in Formate wie ONNX, TensorRT und CoreML exportiert werden. Dies gewährleistet, dass Ihre Modelle auf jeder Zielhardware effizient laufen.

Training und Usability

Die Trainingsmethoden unterscheiden sich erheblich in der Benutzerfreundlichkeit. Ultralytics YOLOv5 ist auf Trainingseffizienz ausgelegt und bietet robuste Voreinstellungen, die sofort für benutzerdefinierte Datensätze funktionieren. Es verfügt über automatische Ankerberechnung, Hyperparameter-Evolution und umfangreiche Logging-Integrationen.

YOLOv9 ist zwar leistungsstark, kann aber eine sorgfältigere Abstimmung der Hyperparameter erfordern, um Stabilität und Konvergenz zu erreichen, insbesondere bei kleineren Datensätzen. Dank seiner Integration in das ultralytics Mit dem Python-Paket können Entwickler YOLOv9 nun mit derselben einfachen Syntax wie YOLOv5 trainieren und so die Lücke in der Benutzerfreundlichkeit schließen.

Code-Beispiel

Mit der Ultralytics-Bibliothek ist das Wechseln zwischen diesen Architekturen so einfach wie das Ändern des Modellnamens. Dieses Snippet demonstriert, wie man beide Modelle lädt und Inferenz ausführt:

from ultralytics import YOLO

# Load the established industry standard YOLOv5 (nano version)
model_v5 = YOLO("yolov5nu.pt")

# Run inference on an image
results_v5 = model_v5("path/to/image.jpg")

# Load the high-accuracy YOLOv9 (compact version)
model_v9 = YOLO("yolov9c.pt")

# Run inference on the same image for comparison
results_v9 = model_v9("path/to/image.jpg")

Ideale Anwendungsfälle

Wann YOLOv9 wählen?

  • Hochpräzise Inspektion: Erkennung kleinster Defekte in Fertigungs-Montagelinien, wo jedes Pixel zählt.
  • Fortgeschrittene Forschung: Projekte, die neuartige Deep-Learning-Architekturen wie programmierbare Gradienteninformationen erforschen.
  • Komplexe Umgebungen: Szenarien mit starker Okklusion oder Unordnung, in denen die fortschrittliche Merkmalsaggregation von GELAN einen entscheidenden Vorteil bietet.

Wann YOLOv5 wählen?

  • Edge Deployment: Ausführung auf batteriebetriebenen Geräten oder Mikrocontrollern, wo Stromverbrauch und Speicherbedarf kritisch sind.
  • Schnelles Prototyping: Wenn Sie innerhalb von Stunden, nicht Tagen, von der Datenerfassung zu einer funktionierenden Demo gelangen müssen, unter Nutzung der umfassenden Tutorials und Community-Ressourcen.
  • Multi-Task-Systeme: Anwendungen, die Posenschätzung oder classify neben detect innerhalb einer einzigen Codebasis erfordern.
  • Produktionsstabilität: Unternehmensumgebungen, die eine praxiserprobte Lösung mit jahrelang bewährter Zuverlässigkeit erfordern.

Fazit

Die Wahl zwischen YOLOv9 und YOLOv5 hängt von Ihren spezifischen Einschränkungen ab. YOLOv9 ist die überlegene Wahl zur Maximierung der Genauigkeit und bietet modernste architektonische Verbesserungen. YOLOv5 bleibt der Meister der Vielseitigkeit und Benutzerfreundlichkeit und bietet ein robustes, gut unterstütztes Ökosystem, das den gesamten KI-Lebenszyklus vereinfacht.

Für Entwickler, die das Beste aus beiden Welten suchen—die Benutzerfreundlichkeit von YOLOv5 mit einer Leistung, die YOLOv9 übertrifft—empfehlen wir, YOLO11 zu erkunden. Als neueste Iteration von Ultralytics liefert YOLO11 modernste Geschwindigkeit und Genauigkeit bei allen Vision-Aufgaben und repräsentiert die Zukunft der YOLO-Familie.

Andere Modelle entdecken

  • YOLO11: Das neueste und leistungsstärkste Modell von Ultralytics für detection, segmentation und Pose.
  • YOLOv8: Ein leistungsstarker Vorgänger von YOLO11, der ein gutes Gleichgewicht an Funktionen bietet.
  • RT-DETR: Ein Transformer-basierter Detektor, der für Echtzeit-Performance optimiert ist.

Kommentare