Zum Inhalt springen

YOLOv5 vs YOLOv7: Ein detaillierter Vergleich

Die Wahl des richtigen Objekterkennungsmodells ist eine kritische Entscheidung, die ein ausgewogenes Verhältnis zwischen dem Bedarf an Geschwindigkeit, Genauigkeit und einfacher Bereitstellung erfordert. Diese Seite bietet einen technischen Vergleich zwischen Ultralytics YOLOv5 und YOLOv7, zwei einflussreichen Modellen in der Computer-Vision-Landschaft. Obwohl beide bedeutende Beiträge geleistet haben, zeichnet sich Ultralytics YOLOv5 durch sein außergewöhnliches Gleichgewicht zwischen Leistung, benutzerfreundlichem Design und einem umfassenden, gut gepflegten Ökosystem aus, was es zu einer bevorzugten Wahl für eine Vielzahl von realen Anwendungen macht.

Ultralytics YOLOv5: Der etablierte Industriestandard

Ultralytics YOLOv5, das 2020 von Glenn Jocher veröffentlicht wurde, entwickelte sich aufgrund seiner bemerkenswerten Mischung aus Geschwindigkeit, Genauigkeit und Benutzerfreundlichkeit schnell zu einem der beliebtesten Objekterkennungsmodelle. YOLOv5 wurde vollständig in PyTorch entwickelt und ist hochoptimiert und bietet eine optimierte Erfahrung vom Training bis zur Bereitstellung.

Autor: Glenn Jocher
Organisation: Ultralytics
Datum: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Docs: https://docs.ultralytics.com/models/yolov5/

Architektur und Hauptmerkmale von YOLOv5

YOLOv5 verfügt über eine flexible und effiziente Architektur, die auf einem CSPDarknet53-Backbone und einem PANet-Neck für eine effektive Feature-Aggregation basiert. Es verwendet einen ankerbasierten Erkennungskopf, der in zahlreichen Releases verfeinert wurde. Eine seiner Hauptstärken ist die Vielfalt der Modellgrößen (n, s, m, l, x), die es Entwicklern ermöglicht, den optimalen Kompromiss zwischen Leistung und Rechenressourcen zu wählen. Diese Skalierbarkeit macht es für alles geeignet, von leichten Edge-Geräten bis hin zu leistungsstarken Cloud-Servern.

Stärken von YOLOv5

  • Benutzerfreundlichkeit: YOLOv5 ist bekannt für seine einfachen Python- und CLI-Schnittstellen, die umfangreiche Dokumentation sowie die unkomplizierten Trainings- und Inferenz-Pipelines.
  • Gut gepflegtes Ökosystem: Es wird durch das robuste Ultralytics-Ökosystem unterstützt, das aktive Entwicklung, eine große Community, häufige Aktualisierungen und leistungsstarke Tools wie Ultralytics HUB für Training und Deployment ohne Code umfasst.
  • Performance Balance: YOLOv5 erzielt einen ausgezeichneten Kompromiss zwischen Inferenz-Geschwindigkeit und Erkennungsgenauigkeit, was es für verschiedene reale Szenarien äußerst praktikabel macht.
  • Vielseitigkeit und Trainingseffizienz: Es unterstützt mehrere Bildverarbeitungsaufgaben, einschließlich Objekterkennung, Instanzsegmentierung und Bildklassifizierung. Der Trainingsprozess ist effizient, mit leicht verfügbaren vortrainierten Gewichten und geringerem Speicherbedarf im Vergleich zu komplexeren Architekturen.

Schwächen von YOLOv5

  • Genauigkeitsgrenzen: Obwohl sehr genau, haben neuere Modelle seine mAP-Werte auf Standard-Benchmarks wie COCO übertroffen.
  • Anchor-Based Design: Seine Abhängigkeit von vordefinierten Anchor-Boxen kann manchmal mehr Abstimmung für Datensätze mit ungewöhnlich geformten Objekten erfordern als moderne ankerfreie Ansätze.

Anwendungsfälle für YOLOv5

  • Echtzeitanwendungen: Ideal für Anwendungen, die eine schnelle Inferenz erfordern, wie z. B. Robotik, Drohnen-Vision in Computer Vision-Anwendungen im KI-Drohnenbetrieb und Echtzeit-Videoanalyse.
  • Edge-Deployment: Aufgrund seines effizienten Designs und der kleineren Modellgrößen gut geeignet für den Einsatz auf Edge-Geräten mit begrenzten Ressourcen. Entdecken Sie die NVIDIA Jetson-Deployment-Anleitungen.
  • Schnelle Prototypenerstellung: Eine ausgezeichnete Wahl für die schnelle Prototypenerstellung und Bereitstellung von Objekterkennungslösungen, dank der Benutzerfreundlichkeit und der umfassenden Unterstützung.

Erfahren Sie mehr über YOLOv5

YOLOv7: Fokus auf hohe Genauigkeit

YOLOv7, entwickelt von Chien-Yao Wang, Alexey Bochkovskiy und Hong-Yuan Mark Liao, wurde am 6. Juli 2022 veröffentlicht. Es führte mehrere architektonische Optimierungen und Trainingsstrategien ein, die als „trainierbare Bag-of-Freebies“ bekannt sind, mit dem Ziel, die Grenzen der Genauigkeit zu erweitern und gleichzeitig die Echtzeitgeschwindigkeit beizubehalten.

Autoren: Chien-Yao Wang, Alexey Bochkovskiy und Hong-Yuan Mark Liao
Organisation: Institute of Information Science, Academia Sinica, Taiwan
Datum: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Dokumentation: https://docs.ultralytics.com/models/yolov7/

Architektur und Hauptmerkmale von YOLOv7

  • E-ELAN: Verwendet Extended Efficient Layer Aggregation Network (E-ELAN) im Backbone, um die Lernfähigkeit zu verbessern.
  • Modellskalierung: Implementiert Compound-Skalierung für Modelltiefe und -breite, um für verschiedene Rechenbudgets zu optimieren.
  • Auxiliary Head Training: Verwendet Auxiliary Heads während des Trainings (während der Inferenz entfernt), um das Feature-Lernen zu verbessern.
  • Bag-of-Freebies: Nutzt fortschrittliche Trainingstechniken, um die Genauigkeit zu erhöhen, ohne die Inferenzkosten zu erhöhen.

Stärken von YOLOv7

  • Hohe Genauigkeit: Erzielt hohe mAP-Werte bei Benchmarks wie COCO, insbesondere bei größeren Modellvarianten.
  • Effiziente Trainingstechniken: Integriert neuartige Trainingsstrategien, um die Leistung zu maximieren.

Schwächen von YOLOv7

  • Komplexität: Die Architektur und der Trainingsprozess können im Vergleich zum optimierten Ansatz von Ultralytics YOLOv5 komplexer sein.
  • Ökosystem und Support: Es fehlen die umfangreiche Dokumentation, die Tutorials und das integrierte Ökosystem, die von Ultralytics für YOLOv5 bereitgestellt werden.
  • Ressourcenintensiv: Größere Modelle erfordern erhebliche Rechenressourcen, was die Bereitstellung auf Geräten mit beschränkten Ressourcen einschränken könnte.

Anwendungsfälle für YOLOv7

  • High-Performance Detektion: Geeignet für Anwendungen, bei denen das Erreichen der absolut höchsten Genauigkeit entscheidend ist und die Rechenressourcen weniger begrenzt sind, wie z. B. bei autonomen Fahrzeugen.
  • Forschung: Wird in der akademischen Forschung zur Untersuchung modernster Objekterkennungstechniken verwendet.

Erfahren Sie mehr über YOLOv7

Performance und technischer Vergleich

Ein direkter Vergleich von YOLOv5 und YOLOv7 auf dem COCO-Datensatz zeigt wesentliche Unterschiede in ihren Performance-Profilen. YOLOv7-Modelle erzielen im Allgemeinen höhere mAP-Werte, oft jedoch auf Kosten einer erhöhten Komplexität und höherem Ressourcenbedarf. Im Gegensatz dazu bietet Ultralytics YOLOv5 ein ausgewogeneres Profil, das sich durch eine hohe CPU-Inferenzgeschwindigkeit und eine wettbewerbsfähige Genauigkeit auszeichnet, was für viele reale Anwendungen entscheidend ist.

Modell Größe
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

Fazit: Welches Modell sollten Sie wählen?

Die Wahl zwischen YOLOv5 und YOLOv7 hängt stark von den Projektprioritäten ab.

YOLOv7 ist eine gute Wahl für Forscher und Entwickler, die die höchstmögliche Genauigkeit bei Standard-Benchmarks benötigen und Zugang zu erheblichen Rechenressourcen haben. Seine innovativen Trainingstechniken demonstrieren, wie man Leistungsgrenzen verschiebt.

Für die überwiegende Mehrheit der praktischen Anwendungen bleibt Ultralytics YOLOv5 jedoch die bessere Wahl. Seine wichtigsten Vorteile – Benutzerfreundlichkeit, schnelle Bereitstellung, ausgezeichnetes Gleichgewicht zwischen Geschwindigkeit und Genauigkeit und ein florierendes Ökosystem – machen es zu einem unglaublich effizienten und zuverlässigen Werkzeug. Es ermöglicht Entwicklern, schnell robuste Computer-Vision-Lösungen zu entwickeln, vom ersten Prototyp bis zur Produktionsbereitstellung.

Darüber hinaus hat sich das Ultralytics-Ökosystem kontinuierlich weiterentwickelt. Neuere Modelle wie YOLOv8 und YOLO11 bauen auf dem Fundament von YOLOv5 auf und bieten eine noch bessere Leistung und größere Vielseitigkeit bei Aufgaben wie Segmentierung, Pose-Schätzung und Tracking. Für Entwickler, die ein modernes, zukunftssicheres und benutzerfreundliches Framework suchen, bietet die Ultralytics YOLO-Familie die überzeugendste und umfassendste Lösung.

Andere Modelle entdecken

Wenn Sie Objekterkennungsmodelle erforschen, könnten Sie auch an diesen anderen Vergleichen interessiert sein:



📅 Vor 1 Jahr erstellt ✏️ Vor 1 Monat aktualisiert

Kommentare