Zum Inhalt springen

YOLOv5 vs. YOLOv9: Ein umfassender technischer Vergleich

Die Entwicklung der Echtzeit-Objekterkennung ist von raschen Fortschritten bei Genauigkeit und Effizienz geprägt. Zwei wichtige Meilensteine auf diesem Weg sind Ultralytics YOLOv5ein Modell, das den Industriestandard für Benutzerfreundlichkeit und Bereitstellung gesetzt hat, und YOLOv9eine forschungsorientierte Architektur, die die Grenzen der Deep-Learning-Theorie auslotet.

Dieser technische Vergleich analysiert ihre Architekturen, Leistungskennzahlen und idealen Anwendungsfälle, um Entwicklern und Forschern die Auswahl des richtigen Tools für ihre Computer-Vision-Projekte zu erleichtern.

Ultralytics YOLOv5: Der Branchenstandard für Vielseitigkeit

Seit seiner Veröffentlichung, YOLOv5 zu einem der beliebtesten KI-Modelle weltweit geworden. Die von Ultralytics entwickelte Software legt den Schwerpunkt auf technische Exzellenz, Benutzerfreundlichkeit und Leistung in der Praxis. Es sorgt für ein Gleichgewicht zwischen Geschwindigkeit und Genauigkeit und bietet gleichzeitig eine nahtlose Benutzererfahrung durch ein robustes Ökosystem.

Technische Details:

Architektur und Design

YOLOv5 nutzt ein CSPDarknet-Backbone in Kombination mit einem PANet-Hals für eine effiziente Merkmalsextraktion und -aggregation. Sein ankerbasierter Erkennungskopf ist hochgradig geschwindigkeitsoptimiert und eignet sich daher für eine breite Palette von Hardware. Im Gegensatz zu rein akademischen Modellen wurde YOLOv5 mit Blick auf den Einsatz entwickelt und bietet native Unterstützung für iOS, Androidund Edge-Geräte.

Zentrale Stärken

  • Gepflegtes Ökosystem: YOLOv5 profitiert von jahrelanger aktiver Entwicklung, die sich in umfangreicher Dokumentation, Community-Support und Integrationen mit Tools wie Ultralytics HUB niederschlägt.
  • Trainingseffizienz: Sie ist bekannt für schnelle Trainingszeiten und geringere Speicheranforderungen im Vergleich zu transformatorbasierten Architekturen, wodurch sie auf Standard-GPUs einsetzbar ist.
  • Vielseitigkeit: Über die Erkennung hinaus unterstützt YOLOv5 nativ die Segmentierung von Instanzen und die Klassifizierung von Bildern, so dass Entwickler mehrere Bildverarbeitungsaufgaben mit einem einzigen Framework bewältigen können.
  • Bereit für den Einsatz: Mit integrierten Exportfunktionen zu ONNX, TensorRT, CoreML und TFLite wird der Übergang von der Forschung zur Produktion rationalisiert.

Erfahren Sie mehr über YOLOv5

YOLOv9: Architektonische Innovation für maximale Genauigkeit

Veröffentlichung im Jahr 2024, YOLOv9 konzentriert sich auf die Behebung von Informationsverlusten in tiefen Netzwerken. Es führt neue Konzepte ein, um die Ausbreitung von Daten durch das Modell zu verbessern, und erzielt Spitzenergebnisse bei Benchmarks wie COCO.

Technische Details:

Architektur und Innovationen

YOLOv9 bringt zwei wesentliche architektonische Neuerungen mit sich:

  1. Programmierbare Gradienteninformation (PGI): Eine Technik, die entwickelt wurde, um das Problem des Informationsengpasses zu entschärfen, indem sichergestellt wird, dass vollständige Eingabedaten für die Berechnung der Verlustfunktion verfügbar sind.
  2. Generalized Efficient Layer Aggregation Network (GELAN): Eine leichtgewichtige Netzwerkarchitektur, die die Parametereffizienz optimiert und es dem Modell ermöglicht, mit weniger Parametern eine höhere Genauigkeit zu erreichen als einige Vorgänger.

Zentrale Stärken

  • Hohe Genauigkeit: YOLOv9 setzt beeindruckende Maßstäbe für die Genauigkeit der Objekterkennung, insbesondere in seinen größeren KonfigurationenYOLOv9).
  • Parameter-Effizienz: Die GELAN-Architektur stellt sicher, dass das Modell die Parameter effektiv nutzt und ein gutes Verhältnis zwischen Genauigkeit und Gewicht bietet.
  • Theoretischer Fortschritt: Es befasst sich mit grundlegenden Fragen des Deep Learning in Bezug auf die Erhaltung von Informationen in tiefen Schichten.

Erfahren Sie mehr über YOLOv9

Leistungsvergleich

Beim Vergleich dieser beiden Modelle liegt der Kompromiss normalerweise zwischen Geschwindigkeit und absoluter Genauigkeit. YOLOv9 erreicht höhere mAPval-Werte im COCO , was die Effektivität von PGI und GELAN belegt. Dennoch, Ultralytics YOLOv5 ist jedoch nach wie vor ein starker Konkurrent bei der Ableitungsgeschwindigkeit, insbesondere auf CPUs und Edge-Geräten, wo seine optimierte Architektur glänzt.

Leistungsbilanz

Während YOLOv9 die Genauigkeitscharts anführt, YOLOv5 ein praktischeres Gleichgewicht für Echtzeitanwendungen, da es auf Standardhardware deutlich schnellere Inferenzgeschwindigkeiten (ms) bietet und gleichzeitig robuste Erkennungsfunktionen beibehält.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Ausbildung und Ressourcen

Für Entwickler ist die Effizienz des Trainings oft ebenso wichtig wie die Geschwindigkeit der Schlussfolgerungen. Ultralytics YOLOv5 ist für seine Einfachheit beim Training bekannt. Im Vergleich zu neueren, komplexeren Architekturen, insbesondere transformatorbasierten Modellen (wie RT-DETR). Diese niedrigere Einstiegshürde ermöglicht es den Benutzern, benutzerdefinierte Modelle auf bescheidenen Hardwarekonfigurationen zu trainieren.

YOLOv9 ist zwar in Bezug auf die Parameter effizient, kann aber aufgrund der Komplexität der für PGI verwendeten Hilfszweige, die während der Inferenz entfernt werden, aber beim Training zusätzlichen Aufwand verursachen, ressourcenintensiver sein.

Code-Beispiel: Vereinheitlichte Schnittstelle

Einer der größten Vorteile des Ultralytics ist die einheitliche Python . Sie können mit einer einzigen Codezeile zwischen YOLOv5 und YOLOv9 wechseln, was es unglaublich einfach macht, beide für Ihren spezifischen Datensatz zu benchmarken.

from ultralytics import YOLO

# Load an Ultralytics YOLOv5 model (pre-trained on COCO)
model_v5 = YOLO("yolov5su.pt")

# Train the model on your custom data
results_v5 = model_v5.train(data="coco8.yaml", epochs=100, imgsz=640)

# Load a YOLOv9 model for comparison
model_v9 = YOLO("yolov9c.pt")

# Train YOLOv9 using the exact same API
results_v9 = model_v9.train(data="coco8.yaml", epochs=100, imgsz=640)

Ideale Anwendungsfälle

Die Wahl zwischen diesen Modellen hängt von Ihren Projektprioritäten ab:

Wann sollte man Ultralytics YOLOv5 wählenYOLOv5

  • Edge-Bereitstellung: Ideal geeignet für Raspberry Pi, mobile Anwendungen und eingebettete Systeme, bei denen jede Millisekunde Latenzzeit zählt.
  • Schnelles Prototyping: Die Benutzerfreundlichkeit, die umfangreichen Tutorials und die Unterstützung der Community ermöglichen unglaublich schnelle Entwicklungszyklen.
  • Multi-Task-Anforderungen: Wenn Ihr Projekt neben der Erkennung auch eine Segmentierung oder Klassifizierung erfordert, bietet YOLOv5 eine einheitliche Lösung.
  • Ressourcenbeschränkungen: Projekte mit begrenztem GPU für das Training werden von der Effizienz von YOLOv5 profitieren.

Wann sollte man YOLOv9 wählen YOLOv9

  • Maximale Genauigkeit: Entscheidend für Anwendungen wie medizinische Bildgebung oder hochpräzise industrielle Inspektionen, bei denen eine fehlende Erkennung kostspielig ist.
  • Akademische Forschung: Hervorragend geeignet für Forscher, die sich mit den neuesten Entwicklungen im Bereich des Gradienten-Informationsflusses und der Gestaltung von Netzarchitekturen befassen.
  • Leistungsstarke Hardware: Wird am besten genutzt, wenn ausreichend Rechenressourcen für Training und Inferenz zur Verfügung stehen, um das volle Potenzial auszuschöpfen.

Fazit

Beide Modelle stehen für Spitzenleistungen auf dem Gebiet der Computer Vision. Ultralytics YOLOv5 bleibt für die meisten Entwickler die pragmatische Wahl, da es eine unschlagbare Kombination aus Geschwindigkeit, Zuverlässigkeit und Unterstützung durch das Ökosystem bietet. Es ist ein kampferprobtes Arbeitspferd für den Einsatz in der Praxis. YOLOv9hingegen bietet einen Blick in die Zukunft der architektonischen Effizienz und bietet erstklassige Genauigkeit für diejenigen, die sie benötigen.

Für alle, die das Neueste in Sachen Leistung und Vielseitigkeit suchen, empfehlen wir auch den YOLO11zu entdecken, das auf den Stärken von YOLOv5 und YOLOv8 aufbaut und in allen Bereichen modernste Ergebnisse liefert.

Andere Modelle entdecken

Wenn Sie mehr erfahren möchten, sehen Sie sich diese verwandten Modelle im Ultralytics an:

  • YOLO11: Das neueste SOTA-Modell mit überragender Leistung und Vielseitigkeit.
  • YOLOv8: Ein leistungsstarkes verankerungsfreies Modell, das Erkennung, Segmentierung, Pose und OBB unterstützt.
  • RT-DETR: Ein Echtzeit-Detektor auf Transformatorbasis für hochpräzise Anwendungen.

Kommentare