YOLOv9 . YOLOv5: Architektonische Weiterentwicklung und Vermächtnis in der Objekterkennung
Die Entwicklung der YOLO You Only Look Once) stellt eine faszinierende Zeitleiste des Fortschritts im Bereich der Bildverarbeitung dar. YOLOv5, Ultralytics von Ultralytics veröffentlicht wurde, setzte einen neuen Standard für Benutzerfreundlichkeit und Produktionsreife und wurde zum bevorzugten Framework für Entwickler weltweit. YOLOv9, das 2024 von Forschern der Academia Sinica veröffentlicht wurde, erweitert die Grenzen der theoretischen Architektur mit Konzepten wie Programmable Gradient Information (PGI).
Dieser Vergleich untersucht, wie YOLOv5 die praxiserprobte Zuverlässigkeit von YOLOv5 gegenüber den architektonischen Innovationen von YOLOv9 YOLOv5 , und hilft Ihnen bei der Entscheidung, welches Modell Ihren spezifischen Anforderungen im Bereich Computer Vision entspricht.
Vergleich von Leistungsmetriken
Die folgende Tabelle vergleicht die beiden Modelle in verschiedenen Größen. Beachten Sie, dass YOLOv9 zwar eine höhere theoretische Genauigkeit (mAP) YOLOv9 , YOLOv5 jedoch in Bezug auf Geschwindigkeit und Ressourceneffizienz wettbewerbsfähig YOLOv5 , insbesondere bei älteren Implementierungen.
| Modell | Größe (Pixel) | mAPval 50-95 | Geschwindigkeit CPU ONNX (ms) | Geschwindigkeit T4 TensorRT10 (ms) | Parameter (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOv5: Der Standard für Produktions-KI
Seit seiner Veröffentlichung im Jahr 2020 durch UltralyticsYOLOv5 zum Synonym für den praktischen Einsatz von KI geworden. Es handelte sich nicht nur um eine Modellarchitektur, sondern um eine vollständige Veränderung des Ökosystems. Vor YOLOv5 erforderte das Training von Objekterkennungsmodellen oft komplexe Konfigurationsdateien und instabile C-basierte Frameworks. YOLOv5 eine native PyTorch YOLOv5 , die das Training so einfach wie einen einzigen Befehl machte.
- Autor:Glenn Jocher
- Organisation:Ultralytics
- Datum: Juni 2020
- GitHub:ultralytics/yolov5
Wichtige Stärken von YOLOv5
- Unübertroffene Benutzerfreundlichkeit: Das Markenzeichen der Ultralytics ist die Benutzerfreundlichkeit. YOLOv5 einen nahtlosen Workflow von der Vorbereitung des Datensatzes bis zur Bereitstellung.
- Umfassende Plattformunterstützung: Es bietet native Exportunterstützung für CoreML, TFLiteund ONNX und ist damit unglaublich vielseitig für mobile und Edge-Anwendungen ein.
- Geringer Ressourcenaufwand: Im Gegensatz zu transformatorlastigen Architekturen, die GPU enormen GPU haben, YOLOv5 äußerst effizient und ermöglicht das Training auf handelsüblicher Hardware oder sogar kostenlosen Cloud-Notebooks wie Google .
- Stabilität: Dank jahrelanger aktiver Wartung wurden Randfälle behoben, sodass eine stabile Plattform für unternehmenskritische Anwendungen in den Bereichen intelligente Fertigung und Sicherheit gewährleistet ist.
Beispiel zur Benutzerfreundlichkeit
Die Ausführung von Inferenz mit YOLOv5 oder einem beliebigen Ultralytics ) ist standardisiert und einfach:
from ultralytics import YOLO
# Load a pretrained YOLOv5s model
model = YOLO("yolov5s.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Show results
results[0].show()
YOLOv9: Architektonische Innovation mit PGI
Veröffentlicht Anfang 2024, YOLOv9 konzentriert sich auf die Lösung des Problems des Informationsengpasses in tiefen neuronalen Netzen. Wenn Netzwerke tiefer werden, können wichtige Merkmalsinformationen während des Feedforward-Prozesses verloren gehen. YOLOv9 dieses Problem mit programmierbaren Gradienteninformationen (PGI) und dem Generalized Efficient Layer Aggregation Network (GELAN).
- Autoren: Chien-Yao Wang, Hong-Yuan Mark Liao
- Organisation:Institute of Information Science, Academia Sinica
- Datum: Februar 2024
- Arxiv:YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information
- GitHub:WongKinYiu/yolov9
Architektonische Durchbrüche
- GELAN-Architektur: Diese neuartige Architektur kombiniert die besten Eigenschaften von CSPNet (verwendet in YOLOv5) und ELAN (verwendet in YOLOv7), um die Parametereffizienz zu maximieren. Dadurch kann das Modell im Vergleich zu älteren Architekturen mit weniger Parametern eine höhere Genauigkeit erzielen.
- Programmierbare Gradienteninformationen (PGI): PGI generiert zuverlässige Gradienten über einen Hilfszweig, der nur während des Trainings verwendet wird. Dadurch wird sichergestellt, dass tiefe Schichten semantische Informationen beibehalten, ohne dass zusätzliche Inferenzkosten entstehen, was die Leistung bei schwierigen Aufgaben wie der Erkennung kleiner Objekte verbessert.
Vergleichsanalyse: Wann sollte man welche verwenden?
Die Wahl zwischen diesen beiden Modellen hängt von Ihrer Priorität ab: Einsatzgeschwindigkeit oder maximale Genauigkeit.
1. Trainingseffizienz und Ökosystem
YOLOv5 punktet mit seiner ausgereiften Ökosystem-Reife. Es ist in Tausende von Tools von Drittanbietern integriert und wird von einer riesigen Community unterstützt. Wenn Sie heute ein Modell mit minimalem Aufwand bereitstellen möchten, ist YOLOv5 oder das neuere YOLO11) oft die sicherere Wahl.
YOLOv9 wird innerhalb des Ultralytics vollständig unterstützt, sodass Benutzer dieselben vereinfachten Trainingspipelines nutzen können. Aufgrund seiner komplexen Architektur (Hilfsverzweigungen) kann das Training jedoch manchmal langsamer und etwas speicherintensiver sein als beim optimierten YOLOv5.
2. Edge-Bereitstellung vs. Servergenauigkeit
Bei rein auf Genauigkeit ausgerichteten Aufgaben, wie der Offline -Analyse medizinischer Bilder oder hochpräzisen industriellen Inspektionen, übertrifft YOLOv9e YOLOv5x deutlich und bietet einen mAP von +5 %.
Für Edge-Geräte wie den Raspberry Pi oder NVIDIA gilt jedoch Folgendes: YOLOv5 jedoch weiterhin ein Favorit. Seine einfachere Architektur lässt sich gut auf die int8-Quantisierung übertragen und führt oft zu schnelleren Inferenzgeschwindigkeiten auf eingeschränkter Hardware, obwohl neuere Modelle wie YOLO26 es in dieser Nische schnell ersetzen.
3. Aufgabenvielfalt
Beide Modelle sind vielseitig einsetzbar, aber die Ultralytics stellt sicher, dass sie über die einfache Erkennung hinaus eine Vielzahl von Aufgaben unterstützen:
- Instanzsegmentierung: Präzise Masken auf Pixelebene.
- Klassifizierung: Beschriftung des gesamten Bildes.
- Posen-Schätzung: Verfolgung von Schlüsselpunkten zur Erkennung menschlicher Aktivitäten.
- OBB: Orientierte Begrenzungsrahmen für Luftbilder.
Die Zukunft: YOLO26
YOLOv5 YOLOv9 zwar hervorragende Modelle, doch die Entwicklung in diesem Bereich schreitet schnell voran. Entwickler, die auf der Suche nach dem absolut Modernsten sind, sollten sich YOLO26 ansehen.
YOLO26 wurde im Januar 2026 veröffentlicht und stellt den Höhepunkt dieser architektonischen Fortschritte dar. Es verwendet ein End-to-End-Design NMS, das erstmals durch YOLOv10, das den latenzintensiven Schritt der Nicht-Maximalunterdrückung vollständig eliminiert. Darüber hinaus verfügt es über den MuSGD-Optimierer, eine Mischung aus SGD Muon, der eine schnellere Konvergenz und Stabilität gewährleistet.
Mit Verbesserungen wie ProgLoss + STAL für die Erkennung kleiner Objekte und der Entfernung von Distribution Focal Loss (DFL) für einen einfacheren Export bietet YOLO26 CPU bis zu 43 % schnellere CPU als frühere Generationen und ist damit die erste Wahl sowohl für die Forschung als auch für die Produktion.
Fazit
- Wählen Sie YOLOv5, wenn Sie ein leichtgewichtiges, praxiserprobtes Modell für ältere Systeme oder extreme Ressourcenbeschränkungen benötigen, bei denen neuere Operator-Unterstützung (wie in YOLOv9) möglicherweise fehlt.
- Wählen Sie YOLOv9, wenn Sie eine hohe Genauigkeit bei anspruchsvollen Datensätzen benötigen und etwas höhere Kosten für Trainingsressourcen in Kauf nehmen können.
- Entscheiden Sie sich für YOLO26, um das Beste aus allen Welten zu erhalten: NMS Geschwindigkeit, höchste Genauigkeit und Funktionen der nächsten Generation wie den MuSGD-Optimierer.
Um mit einem dieser Modelle zu beginnen, können Sie die Ultralytics nutzen, um Ihre Datensätze zu verwalten, in der Cloud zu trainieren und mühelos zu implementieren.
Loslegen
Sie können jedes dieser Modelle mit dem Ultralytics Python trainieren. Ändern Sie dazu einfach den Modellnamen in Ihrem Skript:
from ultralytics import YOLO
# Switch between models easily
model = YOLO("yolov5su.pt") # YOLOv5
# model = YOLO("yolov9c.pt") # YOLOv9
# model = YOLO("yolo26n.pt") # YOLO26
# Train on your data
model.train(data="coco8.yaml", epochs=100)