Zum Inhalt springen

Modellvergleich: YOLOv8 vs. YOLOv7 für Objekterkennung

Die Auswahl des richtigen Objekterkennungsmodells ist entscheidend, um eine optimale Leistung bei Computer-Vision-Aufgaben zu erzielen. Diese Seite bietet einen technischen Vergleich zwischen Ultralytics YOLOv8 und YOLOv7, zwei bedeutenden Modellen in diesem Bereich. Wir werden ihre architektonischen Nuancen, Leistungsbenchmarks und idealen Anwendungen analysieren, um Ihren Modellauswahlprozess zu unterstützen und die Vorteile des Ultralytics-Ökosystems hervorzuheben. Während beide Modelle den Stand der Technik vorangebracht haben, erweist sich YOLOv8 aufgrund seiner verbesserten Leistung, Vielseitigkeit und außergewöhnlichen Benutzerfreundlichkeit als die bessere Wahl für moderne Anwendungen.

YOLOv8: Modernste Effizienz und Anpassungsfähigkeit

Das im Jahr 2023 veröffentlichte Ultralytics YOLOv8 ist das neueste Flaggschiffmodell von Ultralytics. Es baut auf den Erfolgen seiner Vorgänger auf und führt ein neues Leistungsniveau, Flexibilität und Effizienz ein. Als hochmodernes Modell ist YOLOv8 darauf ausgelegt, sich in einem breiten Spektrum von Computer Vision-Aufgaben zu bewähren.

Autoren: Glenn Jocher, Ayush Chaurasia und Jing Qiu
Organisation: Ultralytics
Datum: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Dokumente: https://docs.ultralytics.com/models/yolov8/

Architektur und Design

YOLOv8 verfügt über eine verfeinerte Architektur, die sowohl leistungsstark als auch benutzerfreundlich ist. Zu den wichtigsten architektonischen Verbesserungen gehören ein neuer ankerfreier Erkennungskopf und ein effizienteres Backbone. Das ankerfreie Design reduziert die Anzahl der Box-Vorhersagen, was die Nachbearbeitungsschritte wie Non-Maximum Suppression (NMS) vereinfacht und die Inferenzgeschwindigkeit beschleunigt. Dies macht YOLOv8 anpassungsfähiger an verschiedene Objektformen und -größen ohne manuelle Ankerabstimmung.

Stärken

  • Modernste Leistung: YOLOv8 bietet ein außergewöhnliches Gleichgewicht zwischen Genauigkeit und Geschwindigkeit und übertrifft frühere Modelle in allen Größenordnungen. Seine kleineren Modelle sind schneller und genauer als vergleichbare YOLOv7-Varianten, während seine größeren Modelle neue Maßstäbe für Präzision setzen.
  • Unmatched Versatility: Im Gegensatz zu YOLOv7, das in erster Linie ein Objektdetektor ist, ist YOLOv8 ein einheitliches Framework, das mehrere Aufgaben out-of-the-box unterstützt: Objekterkennung, Instanzsegmentierung, Posenschätzung, Bildklassifizierung und orientierte Objekterkennung (OBB).
  • Benutzerfreundlichkeit: Ultralytics priorisiert eine optimierte Entwicklungserfahrung. YOLOv8 bietet eine einfache Python API und eine CLI, umfassende Dokumentation und eine nahtlose Integration mit Tools wie Ultralytics HUB für No-Code-Training und -Deployment.
  • Gut gepflegtes Ökosystem: Als offizielles Ultralytics-Modell profitiert YOLOv8 von aktiver Entwicklung, häufigen Updates und einer starken Open-Source-Community. Dies gewährleistet Zuverlässigkeit, Zugriff auf die neuesten Funktionen und umfassenden Support.
  • Training and Memory Efficiency: YOLOv8-Modelle sind für effizientes Training konzipiert und benötigen oft weniger CUDA-Speicher als andere Architekturen wie Transformatoren. Leicht verfügbare vortrainierte Gewichte auf Datensätzen wie COCO ermöglichen eine schnellere Konvergenz bei benutzerdefinierten Daten.

Schwächen

  • Als hochentwickeltes Modell benötigen die größten YOLOv8-Varianten erhebliche Rechenressourcen für das Training, obwohl sie für ihre Leistung sehr effizient bleiben.

Ideale Anwendungsfälle

Die überlegene Leistung und Vielseitigkeit von YOLOv8 machen es zur idealen Wahl für eine breite Palette von Anwendungen, von Edge-Geräten bis hin zu Cloud-Servern.

Erfahren Sie mehr über YOLOv8

YOLOv7: Ein Benchmark in der Echtzeit-Detektion

YOLOv7 wurde 2022 als bedeutender Fortschritt in der Echtzeit-Objektdetektion eingeführt und setzte zum Zeitpunkt seiner Veröffentlichung einen neuen Stand der Technik. Der Fokus lag auf der Optimierung von Trainingsprozessen, um die Genauigkeit zu verbessern, ohne die Inferenzkosten zu erhöhen.

Autoren: Chien-Yao Wang, Alexey Bochkovskiy und Hong-Yuan Mark Liao
Organisation: Institute of Information Science, Academia Sinica, Taiwan
Datum: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Dokumentation: https://docs.ultralytics.com/models/yolov7/

Architektur und Design

YOLOv7 führte mehrere architektonische Innovationen ein, darunter das Extended Efficient Layer Aggregation Network (E-ELAN) in seinem Backbone, um die Lerneffizienz zu verbessern. Sein bemerkenswertester Beitrag war das Konzept des "trainierbaren Bag-of-Freebies", bei dem es sich um Trainingsstrategien handelt, die die Modellgenauigkeit verbessern, ohne den Inferenz-Overhead zu erhöhen. Dazu gehören Techniken wie Auxiliary Heads und Coarse-to-Fine Label Assignment.

Stärken

  • Hohe Leistung bei Veröffentlichung: YOLOv7 bot eine ausgezeichnete Kombination aus Geschwindigkeit und Genauigkeit und übertraf andere zu diesem Zeitpunkt verfügbare Detektoren.
  • Effizientes Training: Das "Bag-of-Freebies"-Konzept ermöglichte es, mit optimierten Trainingsroutinen eine hohe Genauigkeit zu erzielen.
  • Etablierter Benchmark: Es ist ein angesehenes Modell, das ausgiebig auf Standarddatensätzen wie MS COCO getestet wurde.

Schwächen

  • Begrenzte Vielseitigkeit: YOLOv7 ist primär ein Objektdetektor. Die Erweiterung auf andere Aufgaben wie Segmentierung oder Pose-Schätzung erfordert separate, oft von der Community getriebene Implementierungen, anders als der integrierte Ansatz von YOLOv8.
  • Architektonische Komplexität: Die Trainingstechniken und architektonischen Komponenten können im Vergleich zum optimierten Design von YOLOv8 komplexer zu verstehen und zu modifizieren sein.
  • Von neueren Modellen übertroffen: Obwohl leistungsstark, wurde YOLOv7 in Bezug auf Geschwindigkeit und Genauigkeit von YOLOv8 übertroffen. Das Ultralytics-Ökosystem bietet zudem eine benutzerfreundlichere und umfassendere Erfahrung.

Ideale Anwendungsfälle

YOLOv7 ist weiterhin ein leistungsfähiges Modell für Anwendungen, in denen es vor der Veröffentlichung neuerer Alternativen integriert wurde.

  • Echtzeit-Sicherheitssysteme: Geeignet für Anwendungen wie Diebstahlprävention, bei denen schnelle und genaue Erkennung entscheidend ist.
  • Legacy-Projekte: Eine praktikable Option zur Wartung oder Erweiterung bestehender Systeme, die auf der YOLOv7-Architektur basieren.

Erfahren Sie mehr über YOLOv7

Performance und Benchmarks: YOLOv8 vs. YOLOv7

Der Performance-Vergleich veranschaulicht deutlich die mit YOLOv8 erzielten Fortschritte. Durchweg bieten YOLOv8-Modelle ein besseres Verhältnis zwischen Genauigkeit und Geschwindigkeit.

Modell Größe
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

Aus den Daten ergeben sich mehrere wichtige Erkenntnisse:

  • Überlegene Genauigkeit: Das größte Modell, YOLOv8x, erreicht eine 53,9 mAP und übertrifft damit das YOLOv7x-Modell mit 53,1 mAP.
  • Unmatched Speed: YOLOv8-Modelle sind deutlich schneller, insbesondere auf der CPU. Das YOLOv8n-Modell bietet eine Inferenzzeit von nur 80,4 ms auf der CPU mit ONNX, eine Metrik, die für YOLOv7 nicht verfügbar ist, aber in der Praxis nachweislich schneller ist. Auf der GPU erreicht YOLOv8n unglaubliche 1,47 ms mit TensorRT und übertrifft damit die Effizienz von YOLOv7 bei weitem.
  • Höhere Effizienz: YOLOv8-Modelle haben weniger Parameter und FLOPs für eine vergleichbare oder bessere Leistung. Zum Beispiel erreicht YOLOv8l fast die gleiche mAP wie YOLOv7x (52,9 vs. 53,1), aber mit deutlich weniger Parametern (43,7M vs. 71,3M) und FLOPs (165,2B vs. 189,9B).

Fazit: Warum Ultralytics YOLOv8 die bevorzugte Wahl ist

Während YOLOv7 ein beeindruckendes Modell war, ist YOLOv8 der klare Gewinner für neue Projekte und Entwicklungen. Seine überlegene Architektur, seine hochmoderne Leistung und seine unglaubliche Vielseitigkeit machen es zum leistungsstärksten und benutzerfreundlichsten Tool für Objekterkennung und andere Computer-Vision-Aufgaben.

Das integrierte Ultralytics-Ökosystem bietet einen erheblichen Vorteil und eine nahtlose Erfahrung vom Training bis zur Bereitstellung. Für Entwickler und Forscher, die ein robustes, gut unterstütztes und leistungsstarkes Modell suchen, ist YOLOv8 die definitive Wahl.

Andere Modelle entdecken

Für diejenigen, die an einer weiteren Erkundung interessiert sind, bietet Ultralytics eine Reihe von Modellen und Vergleichen an. Ziehen Sie in Betracht, sich Folgendes anzusehen:

  • YOLOv8 vs. YOLOv5: Vergleichen Sie YOLOv8 mit einem anderen weit verbreiteten und effizienten Modell.
  • YOLOv8 vs. RT-DETR: Sehen Sie, wie YOLOv8 im Vergleich zu transformatorbasierten Architekturen abschneidet.
  • YOLO11 vs. YOLOv8: Entdecken Sie die Fortschritte im neuesten Ultralytics-Modell, YOLO11.


📅 Vor 1 Jahr erstellt ✏️ Vor 1 Monat aktualisiert

Kommentare