Zum Inhalt springen

YOLOv9 YOLOv5: Ein technischer Einblick in die moderne Objekterkennung

Der Bereich der Bildverarbeitung hat ein enormes Wachstum erlebt, wobei die Objekterkennung als Rückgrat für unzählige industrielle und wissenschaftliche Anwendungen dient. Die Wahl der richtigen Architektur erfordert oft eine sorgfältige Bewertung der mittleren durchschnittlichen Präzision (mAP), der Inferenzgeschwindigkeit und des Speicherbedarfs. In diesem Vergleich untersuchen wir zwei sehr einflussreiche Modelle: YOLOv9, das für seine architektonischen Durchbrüche bei der Beibehaltung von Gradienteninformationen bekannt ist, und Ultralytics YOLOv5, den bewährten Industriestandard, der für seine unglaubliche Benutzerfreundlichkeit und unübertroffene Vielseitigkeit bei der Bereitstellung bekannt ist.

Architektonische Innovationen und technische Ursprünge

Das Verständnis der zugrunde liegenden Mechanismen dieser beiden Modelle liefert wichtige Informationen für ihre jeweiligen Leistungsprofile.

YOLOv9: Programmierbare Gradienteninformation

YOLOv9 von den Forschern Chien-Yao Wang und Hong-Yuan Mark Liao am Institut für Informationswissenschaft der Academia Sinica in Taiwan entwickelt und am 21. Februar 2024 veröffentlicht. Das Modell führt zwei bahnbrechende Konzepte ein, um den in tiefen neuronalen Netzen häufig auftretenden Informationsengpass zu beheben: Programmierbare Gradienteninformationen (PGI) und das Generalized Efficient Layer Aggregation Network (GELAN).

Durch die Verwendung von PGI YOLOv9 , dass wichtige Informationen während des gesamten Feedforward-Prozesses erhalten bleiben, was zu hochpräzisen Gradientenaktualisierungen führt. Gleichzeitig maximiert die GELAN-Architektur die Parametereffizienz, sodass das Modell mit überraschend geringem Rechenaufwand eine hochmoderne Genauigkeit erreicht. Die technischen Details finden Sie im offiziellen YOLOv9 oder im YOLOv9 .

Erfahren Sie mehr über YOLOv9

Ultralytics YOLOv5: Der Produktionsstandard

Verfasst von Glenn Jocher und veröffentlicht von Ultralytics 26. Juni 2020, YOLOv5 die Zugänglichkeit von Computer Vision. Als eines der ersten Objektdetektionsmodelle, das nativ auf der PyTorch basiert, umging es die Komplexität des älteren Darknet C-Frameworks. YOLOv5 ein hochoptimiertes CSPNet-Backbone und einen PANet-Neck und legt dabei Wert auf ein nahtloses Gleichgewicht zwischen Geschwindigkeit und Genauigkeit.

Seine größte Errungenschaft ist jedoch die Integration in das umfassendere Ultralytics . YOLOv5 stark für schnelle Trainingseffizienz und Umgebungen mit geringem Speicherbedarf optimiert, wodurch es für Edge-Bereitstellungen unglaublich stabil ist.

Erfahren Sie mehr über YOLOv5

Speichereffizienz

Bei der Bewertung von Modellen für Edge-Geräte ist zu beachten, dass Ultralytics YOLO im Vergleich zu komplexen Transformer-basierten Architekturen in der Regel sowohl beim Training als auch bei der Inferenz deutlich weniger GPU benötigen.

Performance-Analyse: Geschwindigkeit vs. Genauigkeit

Bei der Entwicklung einer Computer-Vision-Pipeline müssen Entwickler die Kompromisse zwischen Präzision und Latenz abwägen. Die folgende Tabelle veranschaulicht die Leistungsunterschiede beim COCO .

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Analyse der Kompromisse

YOLOv9 in Sachen Rohgenauigkeit einfach unschlagbar. YOLOv9e schafft es, den mAP 55,6 % zu steigern, indem es seine GELAN-Schichten nutzt, um feine Details zu bewahren. Das macht es zu einer super Wahl für medizinische Bildgebung oder Szenarien, in denen es auf kleine Objekte genau ankommt.

Umgekehrt YOLOv5 glänzt durch seine hohe Einsatzgeschwindigkeit und Hardware-Flexibilität. Das YOLOv5n (Nano) ist bekannt für seine Leichtigkeit und führt Inferenzberechnungen in nur 1,12 ms auf einer GPU TensorRT. Wenn Sie auf eingeschränkten IoT-Geräten, Mobiltelefonen oder Raspberry Pi bereitstellen, YOLOv5 der Speicherbedarf von YOLOv5 es außerordentlich zuverlässig.

Der Vorteil des Ultralytics-Ökosystems

Ein wichtiger Aspekt bei der Auswahl eines Modells ist das umgebende Software-Ökosystem. Während YOLOv9 erstklassige Forschungsbenchmarks YOLOv9 , schließt die Verwendung beider Modelle über die moderne Ultralytics Python die Lücke und bietet Entwicklern eine einheitliche und optimierte Erfahrung.

Benutzerfreundlichkeit und Exportieren

Ultralytics komplexe technische Hürden. Funktionen wie automatische Datenanreicherung und Hyperparameter-Optimierung sind sofort einsatzbereit. Die Übertragung von Modellen in die Produktion ist ebenso einfach, dank integrierter Exportbefehle zur Konvertierung von Modellen in ONNX, OpenVINOoder TFLite .

Vielseitigkeit der Aufgaben

Beide Modelle zeichnen sich durch hervorragende Objekterkennung aus, doch moderne Ultralytics sind darauf ausgelegt, eine Vielzahl von Herausforderungen im Bereich Computer Vision zu bewältigen. Das umfassendere Framework bietet native Unterstützung für Bildklassifizierung, Instanzsegmentierung, Posenschätzung und orientierte Begrenzungsrahmen (OBB), sodass Entwickler mehrere Vision-Probleme lösen können, ohne die Codebasis wechseln zu müssen.

Anwendungsfälle und Empfehlungen

Die Wahl zwischen YOLOv9 YOLOv5 von Ihren spezifischen Projektanforderungen, Einsatzbeschränkungen und Ökosystempräferenzen YOLOv5 .

Wann man YOLOv9 wählen sollte

YOLOv9 eine gute Wahl für:

  • Forschung zu Informationsengpässen: Wissenschaftliche Projekte, die sich mit den Architekturen „Programmable Gradient Information“ (PGI) und „Generalized Efficient Layer Aggregation Network“ (GELAN) befassen.
  • Studien zur Optimierung des Gradientenflusses: Die Forschung konzentrierte sich auf das Verständnis und die Minderung von Informationsverlusten in tiefen Netzwerkschichten während des Trainings.
  • Benchmarking für hochpräzise Erkennung: Szenarien, in denen die starke COCO Leistung YOLOv9 als Referenzpunkt für Architekturvergleiche benötigt wird.

Wann man YOLOv5 wählen sollte

YOLOv5 empfohlen für:

  • Bewährte Produktionssysteme: Bestehende Implementierungen, bei denen track langjährige track , die umfangreiche Dokumentation und die massive Unterstützung durch die Community YOLOv5 geschätzt werden.
  • Ressourcenbeschränktes Training: Umgebungen mit begrenzten GPU , in denen die effiziente Training-Pipeline und der geringere Speicherbedarf YOLOv5 von Vorteil sind.
  • Umfassende Unterstützung von Exportformaten: Projekte, die eine Bereitstellung in vielen Formaten erfordern, einschließlich ONNX, TensorRT, CoreMLund TFLite.

Wann sollte man sich für Ultralytics YOLO26) entscheiden?

Für die meisten neuen Projekte bietet Ultralytics die beste Kombination aus Leistung und Entwicklererfahrung:

  • NMS Edge-Bereitstellung: Anwendungen, die eine konsistente Inferenz mit geringer Latenz ohne die Komplexität der Nachbearbeitung mit Non-Maximum Suppression erfordern.
  • CPU: Geräte ohne dedizierte GPU , bei denen CPU bis zu 43 % schnellere CPU von YOLO26 einen entscheidenden Vorteil bietet.
  • Erkennung kleiner Objekte: Anspruchsvolle Szenarien wie Drohnenbilder oder IoT-Sensoranalysen, in denen ProgLoss und STAL die Genauigkeit bei winzigen Objekten deutlich verbessern.

Implementierungsbeispiel

Das Schöne am Ultralytics ist, dass Sie einfach durch Ändern der Gewichtungszeichenfolge zwischen einem YOLOv5 und einem YOLOv9 wechseln können.

from ultralytics import YOLO

# Load a pretrained YOLOv9 model (swap to "yolov5s.pt" to use YOLOv5)
model = YOLO("yolov9c.pt")

# Train the model efficiently on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on new images
predictions = model.predict("https://ultralytics.com/images/zidane.jpg")

# Export to ONNX for seamless deployment
model.export(format="onnx")

Erforschung neuerer Architekturen

YOLOv5 YOLOv9 zwar hervorragende Modelle mit deutlichen Vorteilen, doch die Entwicklung in diesem Bereich schreitet weiter voran. Nutzer, die neue Projekte erkunden, sollten auch die neuesten Versionen von Ultralytics in Betracht ziehen.

  • YOLO11: Eine leistungsstarke, weiterentwickelte Version der YOLOv8 , die bei allen Bildverarbeitungsaufgaben ein ausgezeichnetes Gleichgewicht zwischen Geschwindigkeit und Genauigkeit bietet.
  • YOLO26: YOLO26 wurde 2026 veröffentlicht und ist die ultimative Empfehlung für moderne Pipelines. Es führt ein End-to-End-Design NMS ein, wodurch Engpässe bei der Nachbearbeitung vollständig beseitigt werden. Mit DFL Removal (Distribution Focal Loss entfernt für vereinfachten Export und bessere Kompatibilität mit Edge-/Low-Power-Geräten) erreicht es CPU um bis zu 43 % schnellere CPU . Die Trainingsstabilität wird durch den neuen MuSGD-Optimierer deutlich verbessert, und ProgLoss + STAL liefert verbesserte Verlustfunktionen mit bemerkenswerten Verbesserungen bei der Erkennung kleiner Objekte, was für IoT, Robotik und Luftbildaufnahmen von entscheidender Bedeutung ist. Damit ist es die robusteste Architektur für Edge- und Cloud-Bereitstellungen.

Für Teams, die große Datensätze und komplexe Bereitstellungspipelines verwalten, bietet die Ultralytics eine No-Code-Lösung, mit der sich diese hochmodernen Modelle mühelos trainieren, track und bereitstellen lassen.


Kommentare