Zum Inhalt springen

YOLOv5 vs. YOLO11: Ein umfassender technischer Vergleich

In der sich rasch entwickelnden Landschaft der Computer Vision ist die Wahl des richtigen Objekterkennungsmodells entscheidend für den Projekterfolg. Zwei der wichtigsten Meilensteine in diesem Bereich sind YOLOv5 und das kürzlich veröffentlichte YOLO11. Während YOLOv5 einen legendären Standard für Benutzerfreundlichkeit und Geschwindigkeit gesetzt hat, erweitert YOLO11 die Grenzen der Genauigkeit und Effizienz, indem es jahrelange Forschung und Entwicklung nutzt.

Dieser Leitfaden bietet eine detaillierte technische Analyse dieser beiden Architekturen und hilft Entwicklern, Forschern und Ingenieuren, fundierte Entscheidungen für ihre KI-Anwendungen zu treffen.

Ultralytics YOLOv5: Das zuverlässige Arbeitspferd

YOLOv5 wurde 2020 veröffentlicht und revolutionierte die Zugänglichkeit der Objekterkennung. Es war das erste "You Only Look Once"-Modell, das nativ in PyTorchimplementiert, wodurch es für Entwickler unglaublich einfach zu trainieren und einzusetzen ist. Seine Ausgewogenheit von Geschwindigkeit und Genauigkeit machte es zur ersten Wahl für alles von der industriellen Inspektion bis hin zu autonomen Fahrzeugen.

Technische Details:

Hauptmerkmale und Architektur

YOLOv5 verwendet eine ankerbasierte Architektur. Es wurde ein CSPDarknet-Backbone eingeführt, das den Gradientenfluss erheblich verbessert und die Rechenkosten im Vergleich zu früheren Iterationen reduziert. Das Modell verwendet einen PANet-Hals (Path Aggregation Network), um den Informationsfluss zu verstärken, und integriert die Mosaik-Datenerweiterung während des Trainings, eine Technik, die zu einem Standard für die Verbesserung der Robustheit des Modells gegenüber kleineren Objekten geworden ist.

Stärken

YOLOv5 ist bekannt für seine Stabilität und Ausgereiftheit. Dank jahrelanger Tests durch die Community gibt es ein umfangreiches Ökosystem mit Tutorials, Integrationen von Drittanbietern und Implementierungsleitfäden. YOLOv5 ist eine ausgezeichnete Wahl für ältere Systeme oder Edge-Geräte, bei denen spezifische Hardware-Optimierungen für die Architektur bereits vorhanden sind.

Erfahren Sie mehr über YOLOv5

Ultralytics YOLO11: Der neueste Stand der Technik

Start: Ende 2024, YOLO11 den neuesten Stand der künstlichen Intelligenz. Es baut auf den Erkenntnissen von YOLOv5 und YOLOv8 um ein Modell zu entwickeln, das schneller, genauer und rechenintensiver ist.

Technische Details:

Architektur und Hauptmerkmale

YOLO11 führt bedeutende architektonische Verfeinerungen ein, darunter den C3k2-Block und C2PSA-Module (Cross-Stage Partial with Spatial Attention). Im Gegensatz zu YOLOv5 verwendet YOLO11 einen verankerungsfreien Erkennungskopf, der den Trainingsprozess vereinfacht, da die manuelle Berechnung von Ankerboxen entfällt. Diese Designänderung verbessert die Generalisierung und ermöglicht eine bessere Anpassung des Modells an unterschiedliche Datensätze.

Unerreichte Vielseitigkeit

Eines der bestimmenden Merkmale von YOLO11 ist die native Unterstützung für mehrere Computer-Vision-Aufgaben innerhalb eines einzigen Frameworks. Während sich YOLOv5 in erster Linie auf die Erkennung konzentrierte (mit späterer Unterstützung für die Segmentierung), wurde YOLO11 von Grund auf für die Handhabung entwickelt:

Diese Vielseitigkeit ermöglicht es Entwicklern, komplexe Robotik- und Analyseprobleme anzugehen, ohne das Framework wechseln zu müssen.

Erfahren Sie mehr über YOLO11

Leistungsvergleich

Der Übergang von YOLOv5 zu YOLO11 führt zu erheblichen Leistungssteigerungen. Die Metriken zeigen, dass YOLO11 einen besseren Kompromiss zwischen Geschwindigkeit und Genauigkeit bietet.

Genauigkeit vs. Effizienz

Im Vergleich zu YOLOv5 ähnlicher Größe erreicht YOLO11 im COCO durchweg eine höhere durchschnittliche Genauigkeit (Mean Average Precision,mAP ). So übertrifft das YOLO11m-Modell das viel größere YOLOv5x-Modell in der Genauigkeit (51,5 gegenüber 50,7 mAP), während es mit einem Bruchteil der Parameter arbeitet (20,1M gegenüber 97,2M). Diese drastische Verringerung der Modellgröße führt zu einem geringeren Speicherbedarf sowohl beim Training als auch bei der Inferenz - ein entscheidender Faktor für den Einsatz auf ressourcenbeschränkter Edge-AI-Hardware.

Inferenzgeschwindigkeit

Dank optimierter Architekturentscheidungen glänzt YOLO11 bei den CPU . Das Modell YOLO11n setzt neue Maßstäbe für Echtzeitanwendungen und ist mit nur 56,1 ms auf der CPU mit ONNX deutlich schneller als sein Vorgänger.

Speicher-Effizienz

Die Ultralytics YOLO11 sind für eine optimale Speichernutzung ausgelegt. Im Vergleich zu transformatorbasierten Detektoren wie RT-DETRbenötigt YOLO11 während des Trainings deutlich weniger CUDA , so dass es auch für Entwickler mit Standard-GPUs zugänglich ist.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Schulung und Erfahrung der Entwickler

Beide Modelle profitieren vom umfassenden Ultralytics , das für seine "Benutzerfreundlichkeit" bekannt ist.

Nahtlose Integration

YOLO11 ist integriert in die moderne ultralytics Python , das alle Aufgaben in einer einfachen API zusammenfasst. Dies ermöglicht die Schulung, Validierung und Bereitstellung in nur wenigen Zeilen Code.

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

YOLOv5 hat zwar ein eigenes Repository, kann aber auch einfach über PyTorch Hub geladen oder innerhalb des neueren Ökosystems für bestimmte Aufgaben verwendet werden. Die robuste Dokumentation für beide Modelle stellt sicher, dass Sie bei der Abstimmung von Hyperparametern oder beim Export nach OpenVINOdurchführen, ist der Prozess rationalisiert.

Vorteile für das Ökosystem

Wenn Sie sich für ein Ultralytics entscheiden, erhalten Sie Zugang zu einer gut gewarteten Suite von Tools. Von der Integration mit Comet zur Verfolgung von Experimenten bis hin zur nahtlosen Datensatzverwaltung unterstützt das Ökosystem den gesamten Lebenszyklus von MLOps. Diese aktive Entwicklung stellt sicher, dass regelmäßig Sicherheitspatches und Leistungsverbesserungen bereitgestellt werden.

Ideale Anwendungsfälle

Wann sollten Sie YOLOv5 wählen YOLOv5

  • Legacy-Hardware: Wenn Sie bestehende Edge-Geräte (wie ältere Raspberry Pis) mit speziell für die YOLOv5 optimierten Pipelines haben.
  • Etablierte Arbeitsabläufe: Für Projekte, die sich tief im Wartungsmodus befinden und bei denen eine Aktualisierung der Kernmodellarchitektur mit erheblichen Refactoring-Kosten verbunden wäre.
  • Spezifische GPU : In seltenen Fällen, in denen bestimmte TensorRT stark auf die exakte Schichtstruktur von YOLOv5 abgestimmt sind.

Wann sollten Sie YOLO11 wählen YOLO11

  • Neue Entwicklungen: Für praktisch alle neuen Projekte ist YOLO11 aufgrund seines hervorragenden Verhältnisses zwischen Genauigkeit und Rechenleistung der empfohlene Ausgangspunkt.
  • CPU : Anwendungen, die auf Standard-Prozessoren laufen, wie Laptops oder Cloud-Instanzen, profitieren immens von den CPU von YOLO11.
  • Komplexe Aufgaben: Projekte, die neben der Erkennung auch eine Segmentierung von Instanzen oder eine Schätzung der Körperhaltung erfordern.
  • Hochpräzise Anforderungen: Bereiche wie die medizinische Bildgebung oder die Analyse von Satellitenbildern, in denen die Erkennung kleiner Objekte mit hoher Präzision von größter Bedeutung ist.

Fazit

YOLOv5 ist nach wie vor ein Beweis für effizientes und zugängliches KI-Design und hat in den letzten Jahren zahlreiche Innovationen ermöglicht. YOLO11 repräsentiert jedoch die Zukunft. Mit seiner fortschrittlichen ankerfreien Architektur, überlegenen mAP und verbesserter Vielseitigkeit bietet es Entwicklern ein leistungsfähigeres Toolset für die Lösung moderner Computer-Vision-Herausforderungen.

Durch die Einführung von YOLO11 erhalten Sie nicht nur eine bessere Leistung, sondern auch Zukunftssicherheit für Ihre Anwendungen innerhalb des florierenden Ultralytics .

Andere Modelle entdecken

Wenn Sie daran interessiert sind, diese Architekturen mit anderen führenden Modellen zu vergleichen, lesen Sie unsere detaillierten Vergleiche:


Kommentare