Zum Inhalt springen

YOLOv8 vs. YOLO11: Entwicklung der Echtzeit-Objekterkennung

Die Wahl der richtigen Computer-Vision-Architektur ist eine wichtige Entscheidung, die sich auf die Geschwindigkeit, Genauigkeit und Skalierbarkeit Ihrer KI-Projekte auswirkt. Dieser Leitfaden bietet einen detaillierten technischen Vergleich zwischen Ultralytics YOLOv8einem weit verbreiteten Industriestandard, der 2023 veröffentlicht wird, und Ultralytics YOLO11, die neueste Entwicklung der YOLO , die auf überragende Effizienz und Leistung ausgelegt ist. Wir werden ihre architektonischen Unterschiede, Benchmark-Metriken und idealen Anwendungsfälle analysieren, um Ihnen bei der Auswahl des besten Modells für Ihre Anforderungen zu helfen.

Ultralytics YOLOv8

Die Autoren: Glenn Jocher, Ayush Chaurasia, und Jing Qiu
Organisation:Ultralytics
Datum: 2023-01-10
GitHubultralytics
Docsyolov8

YOLOv8 wurde Anfang 2023 veröffentlicht und stellte einen bedeutenden Meilenstein in der Geschichte der Objekterkennung dar. Es führte ein einheitliches Framework ein, das mehrere Computer-Vision-Aufgaben - einschließlich Erkennung, Instanzsegmentierung, Posenschätzung und Bildklassifizierung - ineinem einzigen Repository unterstützt. YOLOv8 ging von der ankerbasierten Erkennung zu einem ankerfreien Ansatz über, der das Design vereinfacht und die Generalisierung über verschiedene Objektformen hinweg verbessert.

Architektur und Hauptmerkmale

YOLOv8 ersetzte die C3-Module, die in YOLOv5 durch das C2f-Modul (Cross-Stage Partial Bottleneck mit zwei Faltungen) ersetzt. Diese Änderung verbesserte den Gradientenfluss und die Merkmalsintegration bei gleichzeitiger Beibehaltung eines geringen Platzbedarfs. Die Architektur verfügt außerdem über einen entkoppelten Kopf, der Objektivitäts-, Klassifizierungs- und Regressionsaufgaben voneinander trennt, um die Genauigkeit zu erhöhen.

Das Vermächtnis der Verlässlichkeit

YOLOv8 wurde in Tausenden von kommerziellen Anwendungen getestet, von der Fertigungsautomatisierung bis hin zu autonomen Fahrzeugen, und hat sich dabei einen guten Ruf für seine Stabilität und einfache Bereitstellung erworben.

Stärken und Schwächen

  • Stärken:
    • Ausgereiftes Ökosystem: Unterstützt durch eine große Anzahl von Community-Tutorials, Integrationen und Implementierungsleitfäden.
    • Vielseitigkeit: Unterstützt neben der Standarderkennung auch OBB (Oriented Bounding Box) und Klassifizierung.
    • Bewährte Stabilität: Eine sichere Wahl für Produktionsumgebungen, die ein Modell mit einer langen track erfordern.
  • Schwächen:
    • Geschwindigkeitseffizienz: Obwohl es schnell ist, wird es von YOLO11 in Bezug auf die CPU und die Parametereffizienz übertroffen.
    • Anforderungen an die Rechenleistung: Größere Varianten (L, X) erfordern mehr VRAM und FLOPs im Vergleich zu den optimierten YOLO11 .
from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

Erfahren Sie mehr über YOLOv8

Ultralytics YOLO11

Die Autoren: Glenn Jocher und Jing Qiu
Organisation:Ultralytics
Datum: 2024-09-27
GitHubultralytics
Docsyolo11

YOLO11 stellt die Spitze der Ultralytics dar. Entwickelt, um Echtzeit-Inferenz neu zu definieren, baut es auf den Erfolgen von YOLOv8 auf, führt aber wesentliche architektonische Verfeinerungen ein. YOLO11 konzentriert sich auf die Maximierung der Genauigkeit bei gleichzeitiger Minimierung der Rechenkosten, was es zur ersten Wahl für moderne KI-Anwendungen macht, die von Edge-Geräten bis zu Cloud-Servern reichen.

Architektur und Hauptmerkmale

YOLO11 führt den C3k2-Block und das C2PSA-Modul (Cross-Stage Partial with Spatial Attention) ein. Diese Komponenten verbessern die Fähigkeit des Modells, komplizierte Merkmale zu extrahieren und Verdeckungen effektiver zu behandeln als frühere Iterationen. Die Architektur ist auf Geschwindigkeit optimiert und bietet deutlich schnellere Verarbeitungszeiten auf CPUs - ein entscheidender Faktor für Edge AI-Implementierungen, bei denen GPU möglicherweise nicht verfügbar sind.

Das Modell behält die für Ultralytics charakteristische einheitliche Schnittstelle bei, die gewährleistet, dass Entwickler zwischen Aufgaben wie OBB oder Segmentierung wechseln können, ohne ihren Arbeitsablauf zu ändern.

Stärken und Schwächen

  • Stärken:
    • Überlegene Effizienz: Erzielt höhere mAP mit bis zu 22 % weniger Parametern als YOLOv8, wodurch die Modellgröße und der Speicherbedarf reduziert werden.
    • Schnellere Inferenz: Speziell für moderne Hardware optimiert, mit höheren Geschwindigkeiten sowohl auf CPU als auch auf GPU .
    • Verbesserte Merkmalsextraktion: Das neue Backbone verbessert die Erkennung kleiner Objekte und die Leistung in unübersichtlichen Szenen.
    • Geringerer Speicherbedarf: Benötigt weniger CUDA während des Trainings im Vergleich zu transformatorbasierten Modellen wie RT-DETRund ermöglicht das Training auf besser zugänglicher Hardware.
  • Schwächen:
    • Neuere Version: Da es sich um ein neues Modell handelt, kann es bei bestimmten Nischen-Tools von Drittanbietern einige Zeit dauern, bis die Unterstützung vollständig aktualisiert ist, obwohl das Ultralytics es vom ersten Tag an unterstützt.
from ultralytics import YOLO

# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

Erfahren Sie mehr über YOLO11

Direkter Leistungsvergleich

Der nachstehende Vergleich verdeutlicht die Effizienzgewinne von YOLO11. Während YOLOv8 ein leistungsstarker Konkurrent bleibt, liefert YOLO11 durchweg eine höhere GenauigkeitmAP) bei geringerer Rechenkomplexität (FLOPs) und schnellerer Inferenzgeschwindigkeit. Besonders deutlich wird dies bei den Modellen "Nano" und "Small", bei denen YOLO11n eine mAP von 39,5 im Vergleich zu 37,3 bei YOLOv8n erreicht, während die CPU deutlich schneller arbeitet.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Metrische Analyse

YOLO11 zeigt einen klaren Vorteil beim Kompromiss zwischen Geschwindigkeit und Genauigkeit. So übertrifft das Modell YOLO11l das Modell YOLOv8l in Bezug auf die Genauigkeit (+0,5 mAP), während es etwa 42 % weniger Parameter verwendet und 36 % schneller auf der CPU läuft.

Ökosystem und Benutzerfreundlichkeit

Beide Modelle profitieren von dem robusten Ultralytics , das die KI demokratisieren soll, indem es modernste Technologie für jedermann zugänglich macht.

  • Vereinheitlichte API: Der Wechsel zwischen YOLOv8 und YOLO11 ist so einfach wie das Ändern des Modelstrings von yolov8n.pt zu yolo11n.pt. Ein Refactoring des Codes ist nicht erforderlich.
  • Effizienz bei der Ausbildung: Ultralytics bietet das automatische Herunterladen von Datensätzen und vortrainierten Gewichten, wodurch die Pipeline von der Datenerfassung bis zur Modellschulung rationalisiert wird.
  • Vielseitigkeit bei der Bereitstellung: Beide Modelle unterstützen den Export in Formate wie ONNX, TensorRT, CoreML und TFLite mit nur einem Klick, was die Bereitstellung auf unterschiedlicher Hardware wie Raspberry Pis, Mobiltelefonen und Cloud-Instanzen erleichtert.
  • Gut gewartet: Häufige Updates gewährleisten die Kompatibilität mit den neuesten Versionen von PyTorch und CUDA, unterstützt von einer aktiven Community auf Discord und GitHub.

Fazit und Empfehlungen

Während YOLOv8 ein zuverlässiges und leistungsfähiges Modell für die Wartung von Altsystemen bleibt, YOLO11 die klare Empfehlung für alle Neuentwicklungen ist.

  • Wählen Sie YOLO11 , wenn: Sie die höchstmögliche Genauigkeit, schnellere Inferenzgeschwindigkeiten (insbesondere auf der CPU) benötigen oder auf ressourcenbeschränkten Edge-Geräten einsetzen wollen, wo Speicherplatz knapp ist. Seine architektonischen Verbesserungen bieten eine zukunftssichere Grundlage für kommerzielle Anwendungen.
  • Wählen Sie YOLOv8 , wenn: Sie eine bestehende Pipeline haben, die stark auf v8-spezifische Verhaltensweisen abgestimmt ist, oder durch strenge Projektanforderungen eingeschränkt sind, die eine Aktualisierung auf die neueste Architektur verhindern.

Für diejenigen, die sich für andere Architekturen interessieren, werden in den Ultralytics auch Modelle wie YOLOv9, YOLOv10und RT-DETR. Weitere Vergleiche können Sie auf unserer Modellvergleichsseite einsehen.


Kommentare