Modellvergleich: YOLOv7 vs. YOLOv8 für die Objekterkennung
Die Auswahl des richtigen Objekterkennungsmodells ist entscheidend für eine optimale Leistung bei Computer-Vision-Aufgaben. Diese Seite bietet einen technischen Vergleich zwischen YOLOv7 und Ultralytics YOLOv8, zwei beliebten Modellen in diesem Bereich. Wir werden ihre architektonischen Feinheiten, Leistungsbenchmarks und idealen Anwendungen analysieren, um Ihnen bei der Auswahl des Modells zu helfen.
YOLOv7: Hohe Leistung und Effizienz
YOLOv7, vorgestellt am 2022-07-06 von Chien-Yao Wang, Alexey Bochkovskiy und Hong-Yuan Mark Liao vom Institute of Information Science, Academia Sinica, Taiwan, wurde für eine schnelle und genaue Objekterkennung entwickelt. Wie im arXiv-Papier beschrieben, konzentriert sich YOLOv7 auf "trainierbare Bag-of-Freebies", die die Trainingseffizienz und Erkennungsgenauigkeit verbessern, ohne die Kosten für die Inferenz zu erhöhen.
Stärken:
- Hohe Genauigkeit und Geschwindigkeit: YOLOv7 erreicht die modernste Echtzeit-Objekterkennungsleistung, wie die Benchmarks mit dem COCO-Datensatz zeigen.
- Effiziente Architektur: Verwendet Techniken wie die Neuparametrisierung des Modells und die dynamische Zuweisung von Bezeichnungen, um die Effizienz von Training und Inferenz zu verbessern.
- Flexibel: Bietet verschiedene Modellkonfigurationen (YOLOv7, YOLOv7-X, YOLOv7-W6, YOLOv7-E6, YOLOv7-D6, YOLOv7-E6E), um unterschiedlichen Rechenressourcen und Genauigkeitsanforderungen gerecht zu werden.
Schwachstellen:
- Komplexität: Die Architektur und der Trainingsprozess können im Vergleich zu einfacheren Modellen komplexer sein und erfordern möglicherweise mehr Fachwissen für die Feinabstimmung und Optimierung.
- Ressourcenintensiv: Größere YOLOv7-Modelle erfordern erhebliche Rechenressourcen für Training und Einsatz, was ihre Verwendung in ressourcenbeschränkten Umgebungen einschränkt.
Ideale Anwendungsfälle:
YOLOv7 eignet sich hervorragend für Anwendungen, die eine erstklassige Objekterkennung in Echtzeit erfordern, wie zum Beispiel:
- Moderne Videoüberwachungssysteme, die hohe Genauigkeit und Geschwindigkeit erfordern.
- Autonomes Fahren und Robotik, wo präzise und schnelle Objekterkennung entscheidend ist.
- Industrielle Inspektion zur Fehlererkennung bei hohem Durchsatz.
YOLOv8: Vielseitigkeit und Benutzerfreundlichkeit
Ultralytics YOLOv8YOLO wurde am 2023-01-10 von Glenn Jocher, Ayush Chaurasia und Jing Qiu bei Ultralytics veröffentlicht und stellt die neueste Version der YOLO dar. YOLOv8 wird zwar nicht von einem eigenen arXiv-Paper begleitet, legt aber den Schwerpunkt auf Benutzerfreundlichkeit, Flexibilität und starke Leistung bei einer Reihe von Bildverarbeitungsaufgaben, einschließlich Objekterkennung, Segmentierung und Posenschätzung.
Stärken:
- Ausgewogene Leistung: YOLOv8 bietet ein ausgewogenes Verhältnis zwischen Genauigkeit und Geschwindigkeit und ist daher für verschiedene Anwendungen geeignet.
- Benutzerfreundliches Ökosystem: Ultralytics bietet eine umfassende Dokumentation, vorab trainierte Modelle und eine nahtlose Integration mit Ultralytics HUB, was die Arbeitsabläufe von der Schulung bis zur Bereitstellung vereinfacht.
- Multi-Task-Fähigkeiten: Unterstützt Objekterkennung, Instanzsegmentierung, Posenschätzung, orientierte Objekterkennung und Klassifizierung und bietet damit eine einheitliche Lösung für verschiedene Computer Vision Anforderungen.
- Aktive Entwicklung und Community-Unterstützung: Profitieren Sie von kontinuierlichen Aktualisierungen und einer großen, aktiven Open-Source-Gemeinschaft für Ultralytics .
Schwachstellen:
- Geringfügig niedrigere Spitzenleistung: In bestimmten Benchmarks, insbesondere bei der reinen Objekterkennungsgeschwindigkeit, kann YOLOv7 in einigen Konfigurationen leicht besser abschneiden als YOLOv8 .
- Modellgröße: Obwohl effizient, können die Modellgrößen für extrem ressourcenbeschränkte Edge-Geräte im Vergleich zu hochspezialisierten Modellen wie YOLOv5 Nano.
Ideale Anwendungsfälle:
YOLOv8 ist außerordentlich vielseitig und eignet sich für ein breites Spektrum von Anwendungen, darunter:
- Echtzeitanwendungen, die ein ausgewogenes Verhältnis zwischen Geschwindigkeit und Genauigkeit erfordern, wie z. B. Sicherheitsalarmsysteme und Robotik.
- Vielseitige Vision AI-Lösungen für Branchen wie Landwirtschaft, Fertigung und Gesundheitswesen.
- Schnelles Prototyping und schnelle Bereitstellung aufgrund der Benutzerfreundlichkeit und des umfassenden Toolings innerhalb des Ultralytics .
Modell | Größe (Pixel) |
mAPval 50-95 |
Geschwindigkeit CPU ONNX (ms) |
Geschwindigkeit T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
Für Benutzer, die sich für andere Modelle interessieren, bietet Ultralytics auch eine Reihe von YOLO an, darunter das effiziente YOLOv5und die vielseitigen YOLOv6 und YOLOv9. Für Aufgaben, die eine Segmentierung von Instanzen erfordern, empfiehlt sich YOLOv8.
Zusammenfassend lässt sich sagen, dass sowohl YOLOv7 als auch YOLOv8 leistungsstarke Modelle zur Objekterkennung sind. YOLOv7 eignet sich hervorragend für Szenarien, die höchste Echtzeit-Erkennungsleistung erfordern, während YOLOv8 eine vielseitigere und benutzerfreundlichere Erfahrung für verschiedene Bildverarbeitungsaufgaben und Einsatzumgebungen bietet. Bei der Auswahl sollten Sie sich an den spezifischen Anforderungen Ihrer Anwendung orientieren und dabei das Gleichgewicht zwischen Genauigkeit, Geschwindigkeit, Benutzerfreundlichkeit und verfügbaren Ressourcen berücksichtigen.