YOLOv4: Hochgeschwindigkeits- und präzise Objekterkennung
Willkommen auf der Ultralytics Dokumentationsseite für YOLOv4, einem hochmodernen Echtzeit-Objektdetektor, der 2020 von Alexey Bochkovskiy auf https://github.com/AlexeyAB/darknet veröffentlicht wurde. YOLOv4 wurde entwickelt, um das optimale Gleichgewicht zwischen Geschwindigkeit und Genauigkeit zu bieten, was es zu einer hervorragenden Wahl für viele Anwendungen macht.
YOLOv4 Architekturdiagramm. Es zeigt das komplexe Netzwerkdesign von YOLOv4, einschließlich der Backbone-, Neck- und Head-Komponenten sowie deren miteinander verbundene Schichten für eine optimale Echtzeit-Objekterkennung.
Einführung
YOLOv4 steht für You Only Look Once Version 4. Es ist ein Echtzeit-Objekterkennungsmodell, das entwickelt wurde, um die Einschränkungen früherer YOLO-Versionen wie YOLOv3 und anderer Objekterkennungsmodelle zu beheben. Im Gegensatz zu anderen auf convolutional neural network (CNN) basierenden Objektdetektoren ist YOLOv4 nicht nur für Empfehlungssysteme anwendbar, sondern auch für die eigenständige Prozessverwaltung und die Reduzierung menschlicher Eingaben. Sein Betrieb auf herkömmlichen Grafikprozessoren (GPUs) ermöglicht den massenhaften Einsatz zu einem erschwinglichen Preis, und es ist so konzipiert, dass es in Echtzeit auf einer herkömmlichen GPU arbeitet und für das Training nur eine solche GPU benötigt.
Architektur
YOLOv4 nutzt mehrere innovative Funktionen, die zusammenarbeiten, um seine Leistung zu optimieren. Dazu gehören Weighted-Residual-Connections (WRC), Cross-Stage-Partial-Connections (CSP), Cross mini-Batch Normalization (CmBN), Self-adversarial-training (SAT), Mish-Aktivierung, Mosaic Datenaugmentation, DropBlock Regularisierung und CIoU-Verlust. Diese Funktionen werden kombiniert, um hochmoderne Ergebnisse zu erzielen.
Ein typischer Objektdetektor besteht aus mehreren Teilen, einschließlich des Eingangs, des backbone, des Necks und des Heads. Das Backbone von YOLOv4 ist auf ImageNet vortrainiert und wird verwendet, um Klassen und Bounding Boxes von Objekten vorherzusagen. Das Backbone könnte aus verschiedenen Modellen stammen, einschließlich VGG, ResNet, ResNeXt oder DenseNet. Der Neck-Teil des Detektors wird verwendet, um feature maps aus verschiedenen Stadien zu sammeln und enthält normalerweise mehrere Bottom-Up-Pfade und mehrere Top-Down-Pfade. Der Head-Teil wird verwendet, um die endgültigen Objekterkennungen und Klassifizierungen vorzunehmen.
Bag of Freebies
YOLOv4 nutzt auch Methoden, die als "Bag of Freebies" bekannt sind; dies sind Techniken, die die accuracy des Modells während des Trainings verbessern, ohne die Kosten für die Inferenz zu erhöhen. Datenaugmentation ist eine gängige Bag-of-Freebies-Technik, die in Objekterkennungs verwendet wird und die Variabilität der Eingabebilder erhöht, um die Robustheit des Modells zu verbessern. Einige Beispiele für Datenaugmentation sind photometrische Verzerrungen (Anpassung von Helligkeit, Kontrast, Farbton, Sättigung und Rauschen eines Bildes) und geometrische Verzerrungen (Hinzufügen von zufälliger Skalierung, Zuschneiden, Spiegeln und Drehen). Diese Techniken helfen dem Modell, besser auf verschiedene Arten von Bildern zu generalisieren.
Funktionen und Leistung
YOLOv4 ist auf optimale Geschwindigkeit und Genauigkeit bei der Objekterkennung ausgelegt. Die Architektur von YOLOv4 umfasst CSPDarknet53 als Backbone, PANet als Neck und YOLOv3 als detection head. Dieses Design ermöglicht es YOLOv4, eine Objekterkennung mit beeindruckender Geschwindigkeit durchzuführen, was es für Echtzeitanwendungen geeignet macht. YOLOv4 zeichnet sich auch durch seine Genauigkeit aus und erzielt bei Objekterkennungs-Benchmarks wie COCO.
Spitzenwerte. Im Vergleich zu anderen Modellen der YOLO-Familie, wie ein. und YOLOv7, behält YOLOv4 eine starke Position im Gleichgewicht zwischen Geschwindigkeit und Genauigkeit bei. Während neuere Modelle bestimmte Vorteile bieten können, sorgen die architektonischen Innovationen von YOLOv4 weiterhin dafür, dass es für viele Anwendungen relevant bleibt, die Echtzeitleistung erfordern.
Anwendungsbeispiele
YOLOv4 ist ein Darknet-basiertes Modell und wird nicht nativ unterstützt vom Ultralytics Python-Paket: Es gibt keine yolov4.pt vortrainierten Gewichte, die auf ultralytics/assets veröffentlicht wurden, und keine ultralytics/cfg/models/v4/ YAMLs. Diese Seite dient als architektonische Referenz. Benutzer, die daran interessiert sind, YOLOv4 auszuführen, sollten sich für Installations- und Gebrauchsanweisungen direkt an das GitHub-Repository von YOLOv4 wenden.
Hier ist ein kurzer Überblick über die typischen Schritte, die du unternehmen könntest, um YOLOv4 zu nutzen:
-
Besuche das GitHub-Repository von YOLOv4: https://github.com/AlexeyAB/darknet.
-
Befolge die Anweisungen in der README-Datei für die Installation. Dies beinhaltet normalerweise das Klonen des Repositories, die Installation der notwendigen Abhängigkeiten und das Einrichten der erforderlichen Umgebungsvariablen.
-
Sobald die Installation abgeschlossen ist, kannst du das Modell gemäß den im Repository bereitgestellten Gebrauchsanweisungen trainieren und verwenden. Dies umfasst normalerweise die Vorbereitung deines Datensatzes, die Konfiguration der Modellparameter, das Training des Modells und die anschließende Verwendung des trainierten Modells zur Durchführung der Objekterkennung.
Bitte beachte, dass die spezifischen Schritte je nach deinem spezifischen Anwendungsfall und dem aktuellen Stand des YOLOv4-Repositories variieren können. Daher wird dringend empfohlen, sich direkt auf die Anweisungen im GitHub-Repository von YOLOv4 zu beziehen.
Für Training und Inferenz innerhalb des Ultralytics-Frameworks, siehe YOLO11 oder YOLO26.
Fazit
YOLOv4 ist ein leistungsstarkes und effizientes Objekterkennungsmodell, das ein Gleichgewicht zwischen Geschwindigkeit und Genauigkeit findet. Die Verwendung einzigartiger Funktionen und Bag-of-Freebies-Techniken während des Trainings ermöglicht es ihm, bei Echtzeit-Objekterkennungsaufgaben hervorragende Leistungen zu erbringen. YOLOv4 kann von jedem mit einer herkömmlichen GPU trainiert und verwendet werden, was es zugänglich und praktisch für eine breite Palette von Anwendungen macht, einschließlich Überwachungssysteme, autonome Fahrzeuge, und industrieller Automatisierung.
Für diejenigen, die Objekterkennung in ihren Projekten implementieren möchten, bleibt YOLOv4 ein starker Kandidat, insbesondere wenn Echtzeitleistung Priorität hat. Während Ultralytics sich derzeit auf die Unterstützung neuerer YOLO-Versionen wie YOLO11 und YOLO26 konzentriert, haben die in YOLOv4 eingeführten architektonischen Innovationen die Entwicklung dieser späteren Modelle beeinflusst.
Zitate und Danksagungen
Wir möchten den Autoren von YOLOv4 für ihre bedeutenden Beiträge auf dem Gebiet der Echtzeit-Objekterkennung danken:
@misc{bochkovskiy2020yolov4,
title={YOLOv4: Optimal Speed and Accuracy of Object Detection},
author={Alexey Bochkovskiy and Chien-Yao Wang and Hong-Yuan Mark Liao},
year={2020},
eprint={2004.10934},
archivePrefix={arXiv},
primaryClass={cs.CV}
}Das ursprüngliche YOLOv4-Paper findest du auf arXiv. Die Autoren haben ihre Arbeit öffentlich zugänglich gemacht, und der Programmcode kann auf GitHub abgerufen werden. Wir schätzen ihre Bemühungen, das Feld voranzubringen und ihre Arbeit der breiteren Community zugänglich zu machen.
FAQ
Was ist YOLOv4 und warum sollte ich es für Objekterkennungs?
verwenden? YOLOv4, was für "You Only Look Once Version 4" steht, ist ein hochmodernes Echtzeit-Objekterkennungsmodell, das 2020 von Alexey Bochkovskiy entwickelt wurde. Es erzielt ein optimales Gleichgewicht zwischen Geschwindigkeit und accuracy, was es sehr gut für Echtzeitanwendungen geeignet macht. Die Architektur von YOLOv4 enthält verschiedene innovative Funktionen wie Weighted-Residual-Connections (WRC), Cross-Stage-Partial-Connections (CSP) und Self-adversarial-training (SAT), unter anderem, um hochmoderne Ergebnisse zu erzielen. Wenn du nach einem leistungsstarken Modell suchst, das effizient auf herkömmlichen GPUs arbeitet, ist YOLOv4 eine ausgezeichnete Wahl.
Wie verbessert die Architektur von YOLOv4 seine Leistung?
Die Architektur von YOLOv4 umfasst mehrere Schlüsselkomponenten: das backbone, den Neck und den Head. Das Backbone, das Modelle wie VGG, ResNet oder CSPDarknet53 sein kann, ist vortrainiert, um Klassen und Bounding Boxes vorherzusagen. Der Neck, der PANet nutzt, verbindet feature maps aus verschiedenen Stadien zur umfassenden Datenextraktion. Schließlich führt der Head, der Konfigurationen von YOLOv3 verwendet, die endgültigen Objekterkennungen durch. YOLOv4 setzt auch "Bag of Freebies"-Techniken wie Mosaic-Datenaugmentation und DropBlock-Regularisierung ein, was seine Geschwindigkeit und Genauigkeit weiter optimiert.
Was sind "Bag of Freebies" im Kontext von YOLOv4?
"Bag of Freebies" bezieht sich auf Methoden, die die Trainingsgenauigkeit von YOLOv4 verbessern, ohne die Kosten für die Inferenz zu erhöhen. Diese Techniken umfassen verschiedene Formen der Datenaugmentation wie photometrische Verzerrungen (Anpassung von Helligkeit, Kontrast usw.) und geometrische Verzerrungen (Skalierung, Zuschneiden, Spiegeln, Drehen). Durch die Erhöhung der Variabilität der Eingabebilder helfen diese Augmentationen YOLOv4, besser auf verschiedene Arten von Bildern zu generalisieren, wodurch seine Robustheit und Genauigkeit verbessert werden, ohne die Echtzeitleistung zu beeinträchtigen.
Warum gilt YOLOv4 als geeignet für Echtzeit-Objekterkennung auf herkömmlichen GPUs?
YOLOv4 ist darauf ausgelegt, sowohl Geschwindigkeit als auch Genauigkeit zu optimieren, was es ideal für Echtzeit-Objekterkennungsaufgaben macht, die schnelle und zuverlässige Leistung erfordern. Es arbeitet effizient auf herkömmlichen GPUs und benötigt nur eine einzige sowohl für das Training als auch für die Inferenz. Dies macht es zugänglich und praktisch für verschiedene Anwendungen, die von Empfehlungssystemen bis hin zur eigenständigen Prozessverwaltung reichen, wodurch die Notwendigkeit umfangreicher Hardware-Setups reduziert wird und es eine kostengünstige Lösung für Echtzeit-Objekterkennung darstellt.
Wie kann ich mit YOLOv4 loslegen, wenn Ultralytics es derzeit nicht unterstützt?
Um mit YOLOv4 loszulegen, solltest du das offizielle YOLOv4 GitHub repository besuchen. Befolge die Installationsanweisungen in der README-Datei, die normalerweise das Klonen des Repositories, die Installation von Abhängigkeiten und das Einrichten von Umgebungsvariablen beinhalten. Sobald es installiert ist, kannst du das Modell trainieren, indem du deinen Datensatz vorbereitest, die Modellparameter konfigurierst und den bereitgestellten Gebrauchsanweisungen folgst. Da Ultralytics YOLOv4 derzeit nicht unterstützt, wird empfohlen, sich für die aktuellsten und detailliertesten Anleitungen direkt an das GitHub von YOLOv4 zu wenden.