Zum Inhalt springen

YOLOv8 vs. YOLOv7: Ein umfassender technischer Vergleich

Die Entwicklung von Objekterkennungsmodellen ist rasant, wobei die YOLO (You Only Look Once) bei der Echtzeitleistung führend ist. Wählen Sie zwischen YOLOv8 und YOLOv7 muss man nicht nur die reinen Kennzahlen, sondern auch die Architekturphilosophie, die Erfahrung der Entwickler und die Unterstützung durch das Ökosystem, das sie umgibt, verstehen. Während YOLOv7 bei seiner Veröffentlichung beeindruckende Maßstäbe gesetzt hat, hat Ultralytics YOLOv8 einen Paradigmenwechsel in Sachen Benutzerfreundlichkeit und Vielseitigkeit eingeleitet.

Dieser Leitfaden enthält eine detaillierte technische Analyse, die Entwicklern und Forschern bei der Auswahl des richtigen Tools für ihre Computer-Vision-Projekte hilft.

Leistungsanalyse

Bei einem Leistungsvergleich ist es wichtig, den Kompromiss zwischen der Geschwindigkeit der Schlussfolgerungen und der Erkennungsgenauigkeit zu berücksichtigen (mAP). YOLOv8 bietet im Allgemeinen ein besseres Gleichgewicht, da es eine höhere Genauigkeit für ähnliche Modellgrößen und eine schnellere Inferenzgeschwindigkeit auf moderner Hardware bietet.

Die folgende Tabelle zeigt die Leistungsunterschiede beim COCO .

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Wichtige Erkenntnisse

  • Effizienz: Die YOLOv8n (nano)-Modell erreicht bemerkenswerte Geschwindigkeiten (1,47 ms auf der GPU) und ist damit ideal für Edge-KI-Anwendungen, bei denen die Latenzzeit entscheidend ist.
  • Genauigkeit: YOLOv8x übertrifft YOLOv7x in der Genauigkeit (53,9 % vs. 53,1 % mAP) bei gleichbleibender Parameteranzahl.
  • Optimierung: YOLOv8 weisen eine bessere Parametereffizienz auf und liefern eine höhere Leistung pro FLOP, was sich in einem geringeren Energieverbrauch während der Inferenz niederschlägt.

Ultralytics YOLOv8: Der moderne Standard

Anfang 2023 von Ultralytics veröffentlicht, YOLOv8 wurde entwickelt, um den neuesten Stand der Technik (SOTA) zu erreichen, nicht nur in Bezug auf die Leistung, sondern auch in Bezug auf Flexibilität und Benutzerfreundlichkeit. Es vereinigt mehrere Computer-Vision-Aufgaben in einem einzigen, optimierten Rahmen.

Architektur und Innovation

YOLOv8 führt einen verankerungsfreien Erkennungsmechanismus ein, der den Trainingsprozess vereinfacht, indem er die Notwendigkeit manueller Ankerboxberechnungen beseitigt. Dies reduziert die Anzahl der Box-Vorhersagen und beschleunigt die Nicht-Maximum-Unterdrückung (NMS).

Die Architektur verfügt über das C2f-Modul (Cross-Stage Partial Bottleneck mit zwei Faltungen), das High-Level-Merkmale effektiver als frühere Iterationen mit kontextuellen Informationen kombiniert. Dies führt zu einem reichhaltigeren Gradientenfluss und einer verbesserten Lernkonvergenz. Darüber hinaus verwendet YOLOv8 einen entkoppelten Kopf, der Objektivitäts-, Klassifizierungs- und Regressionsaufgaben unabhängig voneinander verarbeitet, um die Genauigkeit zu erhöhen.

Stärken

Erfahren Sie mehr über YOLOv8

YOLOv7: Ein Meilenstein in Sachen Effizienz

YOLOv7 schlug bei seiner Veröffentlichung hohe Wellen, indem es architektonische Optimierungen einführte, die sich auf die "Bag-of-Freebies"-Methoden konzentrierten, um die Genauigkeit zu erhöhen, ohne die Kosten für die Inferenz zu erhöhen.

Architektur und Herangehensweise

YOLOv7 nutzt das Extended Efficient Layer Aggregation Network (E-ELAN), das die kürzesten und längsten Gradientenpfade steuert, damit das Netz effizient mehr Merkmale lernen kann. Es legt großen Wert auf die Skalierung des Modells (gleichzeitige Änderung von Tiefe und Breite) und führt Neuparametrisierungstechniken ein, um Schichten während der Inferenz zu verschmelzen, was das Modell beschleunigt, ohne die Trainingsgenauigkeit zu beeinträchtigen.

Stärken und Schwächen

YOLOv7 ist ein leistungsstarkes Modell, das ein hervorragendes Verhältnis zwischen Geschwindigkeit und Genauigkeit bietet, insbesondere auf GPU . Sein "Bag-of-Freebies"-Ansatz sorgt dafür, dass das Modell während des Einsatzes leichtgewichtig bleibt. Im Vergleich zu YOLOv8 fehlt ihm jedoch die einheitliche Multitasking-Unterstützung und es erfordert komplexere Einrichtungsvorgänge, bei denen Repositories geklont und Abhängigkeiten manuell verwaltet werden müssen. Es ist in erster Linie ein Spezialist für die Objekterkennung, wobei andere Aufgaben oft separate Zweige oder Implementierungen erfordern.

Erfahren Sie mehr über YOLOv7

Eingehender technischer Vergleich

Benutzerfreundlichkeit und Ökosystem

Einer der deutlichsten Unterschiede liegt in der Benutzerfreundlichkeit. Ultralytics YOLOv8 ist als Python verpackt. Das bedeutet, dass Entwickler es mit minimalem Code in bestehende Pipelines integrieren können. Im Gegensatz dazu arbeitet YOLOv7 normalerweise als eigenständige Codebasis, die geklont und modifiziert werden muss.

Erfahrung als Entwickler

YOLOv8 ermöglicht das Training eines Modells in nur drei Zeilen Python . Diese optimierte Benutzererfahrung verkürzt die Markteinführungszeit für KI-Lösungen erheblich.

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model

# Train the model
results = model.train(data="coco8.yaml", epochs=100)

Vielseitigkeit der Aufgaben

Moderne Computer-Vision-Projekte erfordern oft mehr als nur Bounding Boxes.

  • YOLOv8: Ein echtes Multitasking-Modell. Sie können zwischen Erkennung und Segmentierung oder Posen-Schätzung einfach durch Änderung der Modellgewichtungsdatei (z. B., yolov8n-seg.pt), oder Auto-Modus mit angegebener Auslastungsfraktion (
  • YOLOv7: Hauptsächlich auf die Erkennung ausgerichtet. Es gibt zwar Erweiterungen, aber sie sind nicht so eng integriert oder werden nicht in einem einzigen, einheitlichen Rahmen gepflegt.

Trainingseffizienz und Gedächtnis

YOLOv8 optimiert den Speicherbedarf während des Trainings. Es implementiert intelligente Strategien zur Datenerweiterung, die gegen Ende des Trainings abgeschaltet werden, um die Präzision zu verbessern. Darüber hinaus unterstützt das Ultralytics unterschiedliche Datensatzformate und übernimmt das automatische Herunterladen von Standarddatensätzen, wodurch die Trainingseffizienz erheblich gesteigert wird.

Transformer-basierte Modelle benötigen oft große Mengen an CUDA und trainieren langsam. Im Vergleich dazu sind sowohl YOLOv7 als auch YOLOv8 CNN-basiert und effizient, aber die modernen architektonischen Entscheidungen von YOLOv8(wie der C2f-Block) führen oft zu schnellerer Konvergenz und besserer Speichereffizienz auf Hardware der Verbraucherklasse.

Anwendungsfälle in der Praxis

Einzelhandel und Inventarverwaltung

Bei der Einzelhandelsanalyse ist Geschwindigkeit das A und O. YOLOv8n kann auf Edge-Geräten wie Kameras oder NVIDIA Jetson-Modulen laufen, um den Bestand in Echtzeit track . Seine hohe Inferenzgeschwindigkeit stellt sicher, dass sich bewegende Produkte ohne Verzögerung genau gezählt werden.

Autonome Systeme und Robotik

Die Robotik erfordert ein präzises räumliches Verständnis. Die Segmentierungsfunktionen von YOLOv8 ermöglichen es Robotern, die genaue Form von Hindernissen zu erkennen und nicht nur eine Bounding Box. Diese Vielseitigkeit verbessert die Navigationssicherheit. YOLOv7 ist zwar fähig, aber die Implementierung der Segmentierung erfordert mehr Aufwand und unterschiedliche Codebasen.

Landwirtschaft

In der Präzisionslandwirtschaft detect die Modelle Pflanzenkrankheiten oder überwachen das Wachstum. Das gut gepflegte Ökosystem von Ultralytics bedeutet, dass Forscher Zugang zu vortrainierten Gewichten und Community-Tutorials speziell für diese Nischendatensätze haben, was die Einstiegshürde senkt.

Fazit

YOLOv7 ist zwar nach wie vor eine respektable und leistungsstarke Architektur in der Geschichte der Computer Vision, aber Ultralytics YOLOv8 ist die beste Wahl für die moderne Entwicklung. Seine Kombination aus hochmoderner Leistung, unübertroffener Vielseitigkeit und einem Ökosystem, bei dem der Entwickler im Mittelpunkt steht, macht es zur bevorzugten Lösung sowohl für die akademische Forschung als auch für den Einsatz in Unternehmen.

Für diejenigen, die auf der Suche nach dem absolut neuesten Stand der Effizienz und architektonischen Raffinesse sind, hat Ultralytics außerdem das YOLO11veröffentlicht, das die Grenzen noch weiter hinausschiebt. Im direkten Vergleich mit der Generation v7 erweist sich YOLOv8 jedoch als robuster, zuverlässiger und benutzerfreundlicher Sieger.

Weiterführende Informationen

Erforschen Sie weitere Modellvergleiche, um Ihr Verständnis für die YOLO zu vertiefen:


Kommentare