YOLOv8 vs. YOLOv5: Ein detaillierter Vergleich
Der Vergleich von Ultralytics YOLOv8 und Ultralytics YOLOv5 für die Objekterkennung zeigt sowohl die konsequente Weiterentwicklung der YOLO-Architektur als auch die deutlichen Stärken jedes Modells. Beide von Ultralytics entwickelten Modelle sind bekannt für ihr außergewöhnliches Gleichgewicht zwischen Geschwindigkeit und Genauigkeit. Sie bedienen jedoch unterschiedliche Prioritäten im Bereich Computer Vision. Diese Seite bietet einen detaillierten technischen Vergleich, der Entwicklern und Forschern helfen soll, eine fundierte Entscheidung auf der Grundlage ihrer Projektanforderungen zu treffen, und hebt die Vorteile des Ultralytics-Ökosystems hervor.
YOLOv8: Die hochmoderne Lösung
Autoren: Glenn Jocher, Ayush Chaurasia und Jing Qiu
Organisation: Ultralytics
Datum: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Dokumente: https://docs.ultralytics.com/models/yolov8/
Ultralytics YOLOv8 ist die neueste Hauptversion der YOLO-Serie, die als einheitliches Framework entwickelt wurde, um eine vollständige Palette von Vision-KI-Aufgaben zu unterstützen. Dazu gehören Objekterkennung, Instanzsegmentierung, Bildklassifizierung, Pose-Schätzung und orientierte Begrenzungsrahmen (OBB). YOLOv8 führt bedeutende architektonische Innovationen ein, wie z. B. einen ankerfreien Detektor und einen verfeinerten C2f-Neck, die seine Leistung und Flexibilität verbessern.
Stärken
- Überlegene Genauigkeit und Leistung: YOLOv8 liefert durchgängig eine höhere Genauigkeit (mAP) als YOLOv5 über alle Modellgrößen hinweg und behält gleichzeitig wettbewerbsfähige Inferenzgeschwindigkeiten bei. Dies bietet ein ausgezeichnetes Leistungsverhältnis für anspruchsvolle Anwendungen.
- Verbesserte Vielseitigkeit: YOLOv8 wurde als umfassendes Framework entwickelt und unterstützt nativ mehrere Vision-Aufgaben. Diese Vielseitigkeit ermöglicht es Entwicklern, eine einzige, konsistente Modellarchitektur für komplexe, facettenreiche Projekte zu verwenden, was die Entwicklung und Bereitstellung rationalisiert.
- Moderne Architektur: Das ankerfreie Design von YOLOv8 reduziert die Komplexität des Trainingsprozesses und die Anzahl der abzustimmenden Hyperparameter, was oft zu einer besseren Verallgemeinerung auf verschiedenen Datensätzen führt. Das aktualisierte C2f-Modul bietet eine effizientere Feature-Fusion im Vergleich zum C3-Modul von YOLOv5.
- Optimierte Benutzererfahrung: Wie alle Ultralytics-Modelle profitiert YOLOv8 von einer einfachen Python API und CLI, einer umfangreichen Dokumentation und einem gut gepflegten Ökosystem. Dazu gehört die Integration mit Ultralytics HUB für No-Code-Training und MLOps-Management.
- Speichereffizienz: Ultralytics YOLO-Modelle sind für eine geringe Speichernutzung während des Trainings und der Inferenz optimiert, wodurch sie zugänglicher sind als viele ressourcenintensive Architekturen wie Transformer.
Schwächen
- Rechenanforderungen: Obwohl effizient, benötigen die größeren YOLOv8-Modelle (L/X) erhebliche Rechenleistung, was eine Einschränkung für den Einsatz auf stark ressourcenbeschränkten Edge-Geräten darstellen könnte.
Ideale Anwendungsfälle
YOLOv8 ist die empfohlene Wahl für neue Projekte, die modernste Leistung und Flexibilität erfordern.
- Fortschrittliche Robotik: Für komplexes Szenenverständnis und Objektinteraktion, wo hohe Genauigkeit entscheidend ist.
- Hochauflösende Bildanalyse: Ausgezeichnet in Anwendungen wie der medizinischen Bildanalyse, bei denen die Erkennung feinkörniger Details entscheidend ist.
- Multi-Task-Vision-Systeme: Ideal für Systeme, die simultan Erkennung, Segmentierung und Pose-Schätzung durchführen müssen, wie z. B. in Smart Retail Analytics.
YOLOv5: Der etablierte und vielseitige Standard
Autor: Glenn Jocher
Organisation: Ultralytics
Datum: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Dokumentation: https://docs.ultralytics.com/models/yolov5/
Ultralytics YOLOv5 wurde kurz nach seiner Veröffentlichung zu einem Industriestandard, der für seine außergewöhnliche Balance zwischen Geschwindigkeit, Genauigkeit und bemerkenswerter Benutzerfreundlichkeit gefeiert wird. Es basiert auf PyTorch und verfügt über ein CSPDarknet53-Backbone und einen PANet-Neck. Sein ankerbasierter Erkennungskopf ist hocheffizient, und das Modell skaliert über verschiedene Größen (n, s, m, l, x), um verschiedenen Rechenbudgets gerecht zu werden.
Stärken
- Außergewöhnliche Inferenzgeschwindigkeit: YOLOv5 ist hochgradig für schnelle Inferenz optimiert und somit eine erste Wahl für Echtzeitsysteme, insbesondere auf CPUs und Edge-Geräten.
- Ausgereiftes und stabiles Ökosystem: YOLOv5 ist seit mehreren Jahren auf dem Markt und verfügt über eine große Nutzerbasis, umfangreichen Community-Support und eine Fülle von Tutorials und Integrationen von Drittanbietern. Seine Stabilität macht es zu einer zuverlässigen Wahl für Produktionsumgebungen.
- Benutzerfreundlichkeit: YOLOv5 ist bekannt für seine einfache API und die unkomplizierte Trainingspipeline, was es sowohl bei Anfängern als auch bei Experten unglaublich beliebt gemacht hat. Das Ultralytics-Ökosystem sorgt für eine reibungslose Benutzererfahrung vom Training bis zur Bereitstellung.
- Trainingseffizienz: Das Modell bietet einen effizienten Trainingsprozess mit leicht verfügbaren vortrainierten Gewichten, der eine schnelle Prototypenerstellung und Entwicklung ermöglicht.
Schwächen
- Geringere Genauigkeit: Im Vergleich zu YOLOv8 haben YOLOv5 Modelle im Allgemeinen niedrigere mAP-Werte für eine bestimmte Größe. Die Leistungslücke wird bei größeren Modellen deutlicher.
- Anchor-basierte Detektion: Die Abhängigkeit von vordefinierten Anchor-Boxen kann manchmal eine manuelle Feinabstimmung erfordern, um eine optimale Leistung bei Datensätzen mit ungewöhnlich geformten oder skalierten Objekten zu erzielen.
Ideale Anwendungsfälle
YOLOv5 bleibt ein leistungsstarkes und relevantes Modell, insbesondere für Anwendungen, bei denen Geschwindigkeit und Stabilität von größter Bedeutung sind.
- Edge Computing: Seine kleineren Varianten (n/s) eignen sich perfekt für den Einsatz auf ressourcenbeschränkten Geräten wie Raspberry Pi und NVIDIA Jetson.
- Echtzeitüberwachung: Ideal für Sicherheitssysteme und Live-Videoüberwachung, bei denen eine geringe Latenzzeit entscheidend ist.
- Mobile Anwendungen: Geeignet für On-Device Objekterkennung-Aufgaben, bei denen die Rechenressourcen begrenzt sind.
Performance-Duell: YOLOv8 vs. YOLOv5
Die Performance-Benchmarks auf dem COCO-Datensatz veranschaulichen deutlich die mit YOLOv8 erzielten Fortschritte. Durchweg liefern YOLOv8-Modelle eine höhere Genauigkeit bei vergleichbaren oder verbesserten Leistungsmerkmalen.
Modell | Größe (Pixel) |
mAPval 50-95 |
Geschwindigkeit CPU ONNX (ms) |
Geschwindigkeit T4 TensorRT10 (ms) |
Parameter (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Aus der Tabelle geht hervor, dass YOLOv8-Modelle eine deutliche Steigerung der mAP bieten. So erreicht YOLOv8s 44,9 mAP und übertrifft damit YOLOv5s's 37,4 mAP bei nur einer geringfügigen Erhöhung der Parameter und der Latenz. In ähnlicher Weise erreicht YOLOv8x 53,9 mAP und übertrifft damit YOLOv5x's 50,7 mAP, während es gleichzeitig recheneffizienter ist.
Fazit: Welches Modell sollten Sie wählen?
Sowohl YOLOv5 als auch YOLOv8 sind ausgezeichnete Modelle, die jedoch unterschiedlichen Bedürfnissen dienen.
-
YOLOv5 ist eine fantastische Wahl für Anwendungen, bei denen maximale Inferenzgeschwindigkeit und eine ausgereifte, stabile Plattform höchste Priorität haben. Es ist nach wie vor ein starker Kandidat für den Einsatz auf ressourcenbeschränkten Geräten und für Projekte, die von seinem umfangreichen Ökosystem profitieren.
-
YOLOv8 repräsentiert die nächste Generation der YOLO-Technologie. Es ist die empfohlene Wahl für neue Projekte, die die höchste Genauigkeit und Vielseitigkeit bei verschiedenen Bildverarbeitungsaufgaben suchen. Seine moderne, ankerfreie Architektur und sein einheitliches Framework machen es zu einer leistungsfähigeren und flexibleren Lösung für eine breite Palette von Anwendungen, von der Forschung bis zur Produktion.
In den meisten Anwendungsfällen ist YOLOv8 aufgrund seiner überlegenen Leistung und Flexibilität die bevorzugte Option.
Andere Modelle entdecken
Ultralytics setzt seine Innovationen im Bereich Computer Vision fort. Für Benutzer, die andere hochmoderne Optionen suchen, bieten wir auch Modelle wie YOLOv9, YOLOv10 und das neueste YOLO11 an, die jeweils einzigartige Vorteile bieten. Detailliertere Analysen finden Sie auf unserer Modellvergleichsseite.