Zum Inhalt springen

YOLOv5 vs. YOLOv8: Ein detaillierter Vergleich

Der Vergleich von Ultralytics YOLOv5 und Ultralytics YOLOv8 für die Objekterkennung zeigt signifikante Fortschritte und deutliche Stärken in jedem Modell. Beide von Ultralytics entwickelten Modelle sind bekannt für ihre Geschwindigkeit und Genauigkeit, bedienen aber unterschiedliche Benutzerbedürfnisse und Prioritäten im Bereich Computer Vision. Diese Seite bietet einen technischen Vergleich, der Benutzern helfen soll, fundierte Entscheidungen auf der Grundlage ihrer Projektanforderungen zu treffen, und hebt die Vorteile des Ultralytics-Ökosystems hervor.

YOLOv5: Der etablierte und vielseitige Standard

Autor: Glenn Jocher
Organisation: Ultralytics
Datum: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Docs: https://docs.ultralytics.com/models/yolov5/

Ultralytics YOLOv5 wurde nach seiner Veröffentlichung schnell zum Industriestandard und wird für seine außergewöhnliche Balance aus Geschwindigkeit, Genauigkeit und Benutzerfreundlichkeit geschätzt. YOLOv5 basiert vollständig auf PyTorch und verfügt über eine robuste Architektur mit einem CSPDarknet53-Backbone und einem PANet-Neck für eine effiziente Feature-Aggregation. Sein ankerbasierter Erkennungskopf ist hochwirksam, und das Modell ist in verschiedenen Größen (n, s, m, l, x) erhältlich, sodass Entwickler den optimalen Kompromiss für ihre spezifischen Leistungs- und Rechenanforderungen auswählen können.

Stärken

  • Außergewöhnliche Geschwindigkeit und Effizienz: YOLOv5 ist hochgradig für schnelle Inferenz optimiert und somit eine erstklassige Wahl für Echtzeitanwendungen auf verschiedener Hardware, von leistungsstarken Servern bis hin zu ressourcenbeschränkten Edge-Geräten.
  • Benutzerfreundlichkeit: Bekannt für seine optimierte Benutzererfahrung bietet YOLOv5 einfache Python- und CLI-Schnittstellen, unterstützt durch umfangreiche Dokumentation.
  • Ausgereiftes und gut gepflegtes Ökosystem: Als langjähriges Modell profitiert es von einer großen, aktiven Community, regelmäßigen Updates und einer nahtlosen Integration in das Ultralytics-Ökosystem, einschließlich Tools wie Ultralytics HUB für No-Code-Training.
  • Trainingseffizienz: YOLOv5 bietet einen effizienten Trainingsprozess mit leicht verfügbaren vortrainierten Gewichten, was schnelle Entwicklungszyklen ermöglicht. Es benötigt im Allgemeinen weniger Speicher für Training und Inferenz als komplexere Architekturen wie Transformer.

Schwächen

  • Anchor-Based Detection: Seine Abhängigkeit von vordefinierten Anchor-Boxen kann manchmal eine manuelle Abstimmung erfordern, um eine optimale Leistung auf Datensätzen mit ungewöhnlich geformten Objekten zu erzielen, im Gegensatz zu modernen ankerfreien Detektoren.
  • Genauigkeit: Obwohl sehr genau, haben neuere Modelle wie YOLOv8 seine Leistung bei Standard-Benchmarks wie dem COCO-Datensatz übertroffen.

Ideale Anwendungsfälle

Die Geschwindigkeit und Effizienz von YOLOv5 machen es perfekt für:

  • Echtzeit-Videoüberwachung und Sicherheitssysteme.
  • Bereitstellung auf Edge-Geräten wie NVIDIA Jetson und Raspberry Pi.
  • Industrielle Automatisierung und Qualitätskontrolle in der Fertigung.
  • Schnelle Prototypenerstellung für Computer-Vision-Projekte aufgrund seiner Einfachheit und der schnellen Trainingszeiten.

Erfahren Sie mehr über YOLOv5

YOLOv8: Das hochmoderne Framework der nächsten Generation

Autoren: Glenn Jocher, Ayush Chaurasia und Jing Qiu
Organisation: Ultralytics
Datum: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Dokumente: https://docs.ultralytics.com/models/yolov8/

Ultralytics YOLOv8 stellt die nächste Evolution in der YOLO-Serie dar, die als einheitliches Framework entwickelt wurde, das ein vollständiges Spektrum von Vision-KI-Aufgaben unterstützt. Über die Objekterkennung hinaus zeichnet es sich durch Instanzsegmentierung, Bildklassifizierung, Pose-Schätzung und orientierte Objekterkennung aus. YOLOv8 führt wichtige architektonische Verbesserungen ein, wie z. B. einen ankerfreien Erkennungskopf und ein neues C2f-Modul, um eine hochmoderne Leistung zu erzielen.

Stärken

  • Improved Accuracy and Speed: YOLOv8 bietet ein überlegenes Gleichgewicht zwischen Geschwindigkeit und Genauigkeit und erzielt höhere mAP-Werte als YOLOv5 über alle Modellgrößen hinweg, während die Inferenzgeschwindigkeiten wettbewerbsfähig bleiben.
  • Vielseitigkeit: Die Unterstützung mehrerer Bildverarbeitungsaufgaben innerhalb eines einzigen, zusammenhängenden Frameworks macht es zu einem unglaublich leistungsstarken und flexiblen Werkzeug für die Entwicklung komplexer KI-Systeme.
  • Moderne Architektur: Der ankerfreie Erkennungskopf vereinfacht die Ausgabeschicht und verbessert die Leistung, da keine Anpassung der Anker-Box erforderlich ist.
  • Gut gepflegtes Ökosystem: Als Vorzeigemodell profitiert YOLOv8 von aktiver Entwicklung, häufigen Updates und starkem Community-Support. Es ist vollständig in das Ultralytics-Ökosystem integriert, einschließlich der Ultralytics HUB-Plattform für optimierte MLOps.
  • Speichereffizienz: Trotz seiner fortschrittlichen Architektur ist YOLOv8 für eine geringe Speichernutzung optimiert, wodurch es auf einer Vielzahl von Hardware zugänglich ist.

Schwächen

  • Rechenbedarf: Die größten YOLOv8-Modelle (z. B. YOLOv8x) erfordern erhebliche Rechenressourcen, was bei der Bereitstellung in stark eingeschränkten Umgebungen berücksichtigt werden könnte.

Ideale Anwendungsfälle

YOLOv8 ist die empfohlene Wahl für Anwendungen, die höchste Genauigkeit und Flexibilität erfordern:

  • Fortschrittliche Robotik, die komplexes Szenenverständnis und Multi-Objekt-Interaktion erfordert.
  • Hochauflösende Bildanalyse für medizinische oder Satellitenbilder, bei denen es auf feine Details ankommt.
  • Multi-Task-Vision-Systeme, die Erkennung, Segmentierung und Pose-Schätzung gleichzeitig durchführen müssen.
  • Neue Projekte, bei denen der Start mit dem neuesten State-of-the-Art-Modell Priorität hat.

Erfahren Sie mehr über YOLOv8

Leistungs-Benchmarks: YOLOv5 vs. YOLOv8

Der Leistungsunterschied zwischen YOLOv5 und YOLOv8 wird deutlich, wenn man ihre Metriken auf dem COCO-Datensatz vergleicht. Durchweg zeigen YOLOv8-Modelle eine höhere Genauigkeit (mAP) bei einer vergleichbaren Anzahl von Parametern und Rechenkosten (FLOPs). Zum Beispiel erreicht YOLOv8n einen mAP-Wert von 37,3, der fast mit YOLOv5s (37,4 mAP) übereinstimmt, aber mit 68 % weniger Parametern und deutlich schnellerer CPU-Inferenz.

YOLOv5 bleibt jedoch ein beeindruckender Konkurrent, insbesondere in Szenarien, in denen die reine GPU-Geschwindigkeit oberste Priorität hat. Das YOLOv5n-Modell beispielsweise bietet die schnellste Inferenzzeit auf einer T4-GPU. Dies macht es zu einer ausgezeichneten Wahl für Echtzeitanwendungen, die auf optimierter Hardware laufen.

Modell Größe
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8

Wesentliche architektonische Unterschiede

Die Entwicklung von YOLOv5 zu YOLOv8 führte mehrere signifikante architektonische Änderungen ein, die zu seiner überlegenen Leistung und Flexibilität beitragen.

Backbone und Neck

YOLOv5 verwendet das C3-Modul in seinem Backbone und Neck. Im Gegensatz dazu ersetzt YOLOv8 es durch das C2f-Modul. Das C2f-Modul (Cross Stage Partial BottleNeck mit 2 Convolutionen) bietet eine effizientere Feature-Fusion und einen reichhaltigeren Gradientenfluss, was die Gesamtgenauigkeit des Modells verbessert.

Detection Head

Ein wesentlicher Unterschied liegt im Detection Head. YOLOv5 verwendet einen gekoppelten, ankerbasierten Head, was bedeutet, dass derselbe Satz von Features sowohl für die Objektklassifizierung als auch für die Begrenzungsrahmenregression verwendet wird. YOLOv8 verwendet einen entkoppelten, ankerfreien Head. Diese Trennung der Aufgaben (ein Head für die Klassifizierung, ein anderer für die Regression) ermöglicht es jedem, sich zu spezialisieren, was die Genauigkeit verbessert. Der ankerfreie Ansatz vereinfacht auch den Trainingsprozess und macht die Abstimmung von Anchor-Box-Priorisierungen überflüssig, wodurch das Modell anpassungsfähiger an verschiedene Datensätze wird.

Trainingsmethoden und Ökosystem

Sowohl YOLOv5 als auch YOLOv8 basieren auf PyTorch und nutzen die optimierten Trainingspipelines von Ultralytics, was eine konsistente und benutzerfreundliche Erfahrung bietet.

  • Benutzerfreundlichkeit: Beide Modelle lassen sich einfach mit den bereitgestellten CLI- oder Python-Schnittstellen und minimalem Setup trainieren. Eine umfassende Dokumentation (YOLOv5 Docs, YOLOv8 Docs) und einfache APIs machen das benutzerdefinierte Training unkompliziert.
  • Effizientes Training: Optimierte Trainingsskripte und leicht verfügbare vortrainierte Gewichte reduzieren die Trainingszeit und die Rechenkosten erheblich.
  • Datenerweiterung: Beide Modelle beinhalten einen robusten Satz integrierter Datenerweiterungstechniken, um die Modellgeneralisierung zu verbessern und Overfitting zu reduzieren.
  • Ultralytics-Ökosystem: Die Integration mit Tools wie Ultralytics HUB und Protokollierungsplattformen wie TensorBoard und Comet vereinfacht die Experimentverfolgung, das Modellmanagement und die Bereitstellung.

Fazit: Welches Modell sollten Sie wählen?

Sowohl YOLOv5 als auch YOLOv8 sind leistungsstarke Objekterkennungsmodelle, die von Ultralytics entwickelt wurden und eine ausgezeichnete Leistung und Benutzerfreundlichkeit bieten. Die Wahl zwischen ihnen hängt weitgehend von Ihren spezifischen Projektanforderungen ab.

  • YOLOv5 bleibt ein starker und zuverlässiger Kandidat, insbesondere für Anwendungen, bei denen die Maximierung der Inferenzgeschwindigkeit auf bestimmter Hardware entscheidend ist. Seine Reife bedeutet, dass es ein riesiges Ökosystem hat und in unzähligen realen Einsätzen auf Herz und Nieren geprüft wurde. Es ist eine ausgezeichnete Wahl für Projekte mit einem knappen Ressourcenbudget oder solche, die eine schnelle Bereitstellung auf Edge-Geräten erfordern.

  • YOLOv8 repräsentiert die Spitze der YOLO-Serie und bietet überlegene Genauigkeit, verbesserte Vielseitigkeit bei verschiedenen Bildverarbeitungsaufgaben und eine modernere Architektur. Sein ankerfreies Design und seine fortschrittlichen Funktionen machen es zur idealen Wahl für neue Projekte, die eine hochmoderne Leistung und die Flexibilität zur Bewältigung komplexer, facettenreicher KI-Herausforderungen suchen.

Ultralytics setzt seine Innovationen fort und stellt sicher, dass beide Modelle gut unterstützt und einfach zu bedienen sind und ein gutes Gleichgewicht zwischen Geschwindigkeit und Genauigkeit bieten, das für verschiedene reale Szenarien geeignet ist.

Weitere Ultralytics-Modelle entdecken

Für Nutzer, die andere State-of-the-Art-Optionen suchen, bietet Ultralytics auch Modelle wie YOLOv9, YOLOv10 und das neueste YOLO11, die jeweils einzigartige Vorteile in Bezug auf Leistung und Effizienz bieten. Weitere Vergleiche sind in der Ultralytics-Dokumentation verfügbar.



📅 Vor 1 Jahr erstellt ✏️ Vor 1 Monat aktualisiert

Kommentare