Zum Inhalt springen

YOLO11 vs. YOLOv5: Eine technische Evolution in der Objekterkennung

Die Wahl des richtigen Objekterkennungsmodells ist eine wichtige Entscheidung, bei der ein Gleichgewicht zwischen dem Bedarf an Genauigkeit, Geschwindigkeit und einfacher Bereitstellung gefunden werden muss. Diese Seite bietet einen umfassenden technischen Vergleich zwischen zwei wegweisenden Modellen von Ultralytics: dem hochmodernen Ultralytics YOLO11 und dem weit verbreiteten Ultralytics YOLOv5. Während YOLOv5 einen Industriestandard für seine Leistung und Benutzerfreundlichkeit setzte, stellt YOLO11 den nächsten Evolutionsschritt dar und bietet überlegene Genauigkeit, verbesserte Vielseitigkeit und die neuesten architektonischen Innovationen, alles innerhalb des robusten und benutzerfreundlichen Ultralytics-Ökosystems.

Ultralytics YOLO11: Der neue Stand der Technik

YOLO11, verfasst von Glenn Jocher und Jing Qiu, ist das neueste und fortschrittlichste Modell der Ultralytics YOLO-Serie. Es wurde 2024 veröffentlicht und baut auf dem starken Fundament seiner Vorgänger wie YOLOv8 auf, um einen neuen Maßstab in Bezug auf Leistung und Effizienz zu setzen. Es ist nicht nur für die Objekterkennung konzipiert, sondern als umfassendes Framework für eine Vielzahl von Computer-Vision-Aufgaben.

Architektur und Hauptmerkmale

YOLO11 führt bedeutende architektonische Verbesserungen ein, darunter einen ankerfreien Erkennungskopf und eine optimierte Netzwerkstruktur. Diese moderne Designwahl vereinfacht den Trainingsprozess, da keine Ankerboxen vordefiniert werden müssen, was zu einer besseren Verallgemeinerung auf verschiedenen Datensätzen führt. Das Modell erreicht eine höhere mittlere durchschnittliche Präzision (mAP) als YOLOv5 mit weniger Parametern und Rechenanforderungen (FLOPs) in vielen Fällen, was eine überlegene Effizienz demonstriert.

Ein herausragendes Merkmal von YOLO11 ist seine Vielseitigkeit. Es ist ein einheitliches Framework, das nativ Objekterkennung, Instanzsegmentierung, Bildklassifizierung, Pose-Schätzung und orientierte Begrenzungsrahmen (OBB) unterstützt. Diese Multi-Task-Fähigkeit macht es zu einem unglaublich leistungsstarken und flexiblen Werkzeug für komplexe KI-Systeme.

Stärken

  • Modernste Genauigkeit: Liefert deutlich höhere mAP-Werte im Vergleich zu YOLOv5 und setzt damit einen neuen Leistungsstandard.
  • Hohe Effizienz: Erzielt eine bessere Genauigkeit mit einer effizienteren Architektur, die oft weniger Parameter und FLOPs benötigt.
  • Anchor-Free Design: Vereinfacht das Training und verbessert die Leistung, indem die Abhängigkeit von der Anchor-Box-Konfiguration beseitigt wird.
  • Multi-Task-Vielseitigkeit: Ein einzelnes Framework für eine breite Palette von Bildverarbeitungsaufgaben, das die Entwicklung für facettenreiche Anwendungen optimiert.
  • Gut gepflegtes Ökosystem: Profitiert von kontinuierlicher Entwicklung, umfangreicher Dokumentation, starkem Community-Support und nahtloser Integration mit Tools wie Ultralytics HUB für MLOps.
  • Trainingseffizienz: Bietet effiziente Trainingsprozesse mit leicht verfügbaren vortrainierten Gewichten und erfordert im Allgemeinen eine geringere Speichernutzung als komplexere Architekturen wie Transformatoren.

Schwächen

  • Als hochmodernes Modell können größere Varianten von YOLO11 rechenintensiv sein und moderne GPU-Hardware für eine optimale Leistung erfordern.

Ideale Anwendungsfälle

YOLO11 ist die ideale Wahl für neue Projekte, die höchste Genauigkeit und Flexibilität erfordern:

  • Fortschrittliche Robotik: Für präzise Objektinteraktion und Navigation in dynamischen Umgebungen.
  • Industrielle Automatisierung: Hochgenaue Qualitätskontrolle und Fehlererkennung.
  • Gesundheitswesen: Unterstützung bei der medizinischen Bildanalyse für Aufgaben wie die Erkennung von Tumoren.
  • Smart Cities: Ermöglicht komplexe Systeme für Verkehrsmanagement und öffentliche Sicherheit.

Erfahren Sie mehr über YOLO11

YOLOv5: Das etablierte und vielseitige Arbeitstier

YOLOv5 wurde 2020 von Glenn Jocher bei Ultralytics veröffentlicht und entwickelte sich schnell zu einem der beliebtesten Objekterkennungsmodelle der Welt. Es wird für sein außergewöhnliches Gleichgewicht zwischen Geschwindigkeit und Genauigkeit, seine Benutzerfreundlichkeit und seine robuste, gut dokumentierte Implementierung in PyTorch geschätzt.

Architektur und Hauptmerkmale

YOLOv5 verwendet eine Architektur, die auf einem CSPDarknet53-Backbone und einem PANet-Neck für eine effektive Feature-Aggregation basiert. Sein Erkennungskopf ist ankerbasiert, was zum Zeitpunkt seiner Veröffentlichung ein Standard- und effektiver Ansatz war. Eine der größten Stärken von YOLOv5 ist seine Skalierbarkeit, die eine Reihe von Modellen von der winzigen Version 'n' (Nano) bis zur großen Version 'x' (Extra-Large) bietet, sodass Entwickler problemlos zwischen Geschwindigkeit und Genauigkeit wählen können.

Stärken

  • Außergewöhnliche Inferenzgeschwindigkeit: Hochgradig optimiert für Echtzeit-Performance, was es zu einer beliebten Wahl für Anwendungen auf Edge-Geräten wie NVIDIA Jetson macht.
  • Benutzerfreundlichkeit: Bekannt für seine einfache API, umfangreiche Tutorials und optimierte Trainings- und Deployment-Workflows.
  • Ausgereiftes Ökosystem: Unterstützt durch eine riesige Community, jahrelange aktive Entwicklung und unzählige reale Einsätze, was Stabilität und Zuverlässigkeit gewährleistet.
  • Flexibilität: Die große Bandbreite an Modellgrößen ermöglicht die Anpassung an nahezu jede Hardwarebeschränkung.

Schwächen

  • Geringere Genauigkeit: Obwohl immer noch leistungsstark, wird seine Genauigkeit von neueren Modellen wie YOLO11 übertroffen.
  • Anchor-basierte Detektion: Basiert auf vordefinierten Anchor-Boxen, die im Vergleich zu modernen ankerfreien Detektoren manchmal eine manuelle Feinabstimmung erfordern, um eine optimale Leistung bei benutzerdefinierten Datensätzen zu erzielen.

Ideale Anwendungsfälle

YOLOv5 bleibt eine ausgezeichnete Wahl für bestimmte Szenarien:

  • Edge Computing: Bereitstellung auf ressourcenbeschränkten Geräten wie einem Raspberry Pi, bei dem die Inferenzgeschwindigkeit oberste Priorität hat.
  • Schnelle Prototypenerstellung: Seine Einfachheit und Geschwindigkeit machen es perfekt für die schnelle Erstellung und das Testen von Proof-of-Concept-Anwendungen.
  • Legacy-Systeme: Wartung oder Aktualisierung bestehender Projekte, die auf dem YOLOv5-Framework basieren.
  • Echtzeitüberwachung: Unterstützung von Sicherheitssystemen, bei denen eine hohe FPS entscheidend ist.

Erfahren Sie mehr über YOLOv5

Performance und Benchmarks: YOLO11 vs. YOLOv5

Die Leistungsmetriken veranschaulichen deutlich die Entwicklung von YOLOv5 zu YOLO11. Auf dem COCO-Datensatz erzielen YOLO11-Modelle durchweg höhere mAP-Werte als ihre YOLOv5-Pendants ähnlicher Größe. Zum Beispiel erreicht YOLO11m 51,5 mAP und übertrifft damit YOLOv5m mit 45,4 mAP deutlich. Darüber hinaus erreicht YOLO11 dies oft mit einer höheren Recheneffizienz. Insbesondere das kleinste Modell, YOLO11n, ist auf der CPU schneller als YOLOv5n und liefert gleichzeitig einen massiven Anstieg des mAP-Werts um 11,5 Punkte.

Modell Größe
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

Fazit: Welches Modell sollten Sie wählen?

Die Wahl zwischen YOLO11 und YOLOv5 hängt von den spezifischen Bedürfnissen Ihres Projekts ab.

YOLOv5 ist ein bewährtes, zuverlässiges und unglaublich schnelles Modell. Es ist nach wie vor eine fantastische Option für Anwendungen, bei denen Geschwindigkeit oberste Priorität hat, insbesondere auf älterer oder ressourcenbeschränkter Hardware. Seine Reife und der umfangreiche Community-Support bieten eine stabile Grundlage für viele Projekte.

Für fast alle neuen Projekte ist YOLO11 jedoch die klare und empfohlene Wahl. Es stellt einen bedeutenden Fortschritt dar und bietet hochmoderne Genauigkeit, überlegene Effizienz und unübertroffene Vielseitigkeit. Seine ankerfreie Architektur und die native Unterstützung für mehrere Bildverarbeitungsaufgaben machen es zu einer leistungsstärkeren, flexibleren und zukunftssicheren Lösung. Durch die Wahl von YOLO11 nutzen Entwickler die neuesten Fortschritte im Bereich der KI, um leistungsfähigere und genauere Computer-Vision-Anwendungen zu entwickeln, und profitieren gleichzeitig von dem optimierten und gut gepflegten Ultralytics-Ökosystem.

Weitere Modellvergleiche entdecken

Wenn Sie daran interessiert sind, wie diese Modelle im Vergleich zu anderen führenden Architekturen abschneiden, sehen Sie sich unsere anderen Vergleichsseiten an:



📅 Vor 1 Jahr erstellt ✏️ Vor 1 Monat aktualisiert

Kommentare