Zum Inhalt springen

YOLOv5 YOLO11: Brückenschlag zwischen Tradition und Innovation in der Objekterkennung

Die Entwicklung der YOLO You Only Look Once) war ein entscheidender Meilenstein im Bereich der Bildverarbeitung. Von der grundlegenden Zuverlässigkeit von YOLOv5 zur fortschrittlichen Effizienz von YOLO11 hat jede neue Version die Grenzen in Bezug auf Geschwindigkeit und Genauigkeit erweitert. Dieser Leitfaden enthält einen detaillierten technischen Vergleich, der Entwicklern, Forschern und Ingenieuren dabei hilft, das richtige Modell für ihre spezifischen Einsatzanforderungen auszuwählen.

Modellübersicht

YOLOv5: Der Industriestandard

Veröffentlicht im Jahr 2020 von Glenn Jocher und Ultralyticsveröffentlicht, YOLOv5 schnell zum Goldstandard für die praktische Objekterkennung. Es war das erste YOLO , das nativ in PyTorchimplementiert wurde und somit für die breitere KI-Community außergewöhnlich gut zugänglich war. Seine Ausgewogenheit zwischen Benutzerfreundlichkeit, robusten Trainingspipelines und Flexibilität bei der Bereitstellung festigte seinen Platz in Tausenden von akademischen und industriellen Anwendungen.

Erfahren Sie mehr über YOLOv5

YOLO11: Der raffinierte Nachfolger

YOLO11, veröffentlicht im Jahr 2024, stellt einen bedeutenden Fortschritt in der Ultralytics dar. Aufbauend auf den architektonischen Weiterentwicklungen von YOLOv8 verfügt es über eine verfeinerte Backbone- und Head-Struktur, die für eine überlegene Merkmalsextraktion und Effizienz ausgelegt ist. YOLO11 auf die Maximierung des Verhältnisses zwischen Genauigkeit und Rechenleistung und liefert im Vergleich zu seinen Vorgängern eine höhere mittlere Genauigkeit (mAP) mit weniger Parametern.

Erfahren Sie mehr über YOLO11

Neueste Empfehlung

Obwohl YOLO11 gegenüber YOLOv5 erhebliche Verbesserungen YOLO11 , sollten Entwickler, die 2026 neue Projekte starten, auch YOLO26 in Betracht ziehen. Es zeichnet sich durch ein natives End-to-End-Design (ohne NMS), einen innovativen MuSGD-Optimierer und CPU um bis zu 43 % schnellere CPU aus und ist damit die erste Wahl für moderne Edge-Bereitstellungen.

Technischer Architekturvergleich

Backbone und Merkmalsextraktion

YOLOv5 nutzt ein CSPDarknet-Backbone. Dieses Cross-Stage-Partial-Netzwerkdesign war revolutionär, um die Rechenredundanz zu reduzieren und gleichzeitig einen reichhaltigen Gradientenfluss aufrechtzuerhalten. Es sorgt für ein effektives Gleichgewicht zwischen Tiefe und Breite, sodass das Modell komplexe Merkmale lernen kann, ohne dass die Parameteranzahl explodiert.

YOLO11 entwickelt dieses Konzept mit einem verbesserten CSP-Backbone (C3k2) weiter und führt verbesserte räumliche Aufmerksamkeitsmechanismen ein. Die Architektur ist speziell darauf abgestimmt, feine Details zu erfassen, was die Leistung bei der Erkennung kleiner Objekte erheblich steigert. YOLO11 dieses verfeinerte Design YOLO11 eine höhere Genauigkeit bei geringerem Platzbedarf des Modells.

Detection Head

Der Detektionskopf in YOLOv5 ist ankerbasiert und stützt sich auf vordefinierte Ankerboxen, um Objektpositionen vorherzusagen. Dieser Ansatz ist zwar effektiv, erfordert jedoch eine sorgfältige Hyperparameter-Optimierung der Ankerabmessungen für benutzerdefinierte Datensätze.

YOLO11 verwendet einen ankerfreien Erkennungskopf. Dieser moderne Ansatz vereinfacht den Trainingsprozess, indem er Objektzentren und -abmessungen direkt vorhersagt und somit die Berechnung von Ankerboxen überflüssig macht. Dies rationalisiert nicht nur die Trainingspipeline, sondern verbessert auch die Generalisierung über verschiedene Objektformen und Seitenverhältnisse hinweg.

Leistungsmetriken

Die folgende Tabelle zeigt die Leistungsunterschiede zwischen YOLOv5 YOLO11. Eine wichtige Beobachtung ist der Kompromiss zwischen Geschwindigkeit und Genauigkeit. YOLO11 erzielt YOLO11 höhere mAP und behält dabei wettbewerbsfähige oder überlegene Inferenzgeschwindigkeiten bei, insbesondere auf GPU .

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv5n64028.073.61.121.94.5
YOLOv5s64037.4120.71.927.216.5
YOLOv5m64045.4233.94.0321.249.0
YOLOv5l64049.0408.46.6146.5109.1
YOLOv5x64050.7763.211.8986.7205.7
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Analyse:

  • Genauigkeit: YOLO11n (Nano) erreicht beeindruckende 39,5 % mAP und übertrifft damit YOLOv5n mit 28,0 % deutlich. Damit ist YOLO11 weitaus bessere Wahl für leichtgewichtige Anwendungen, die eine hohe Präzision erfordern.
  • Geschwindigkeit: YOLO11 weisen schnellere CPU in ONNX , was für den Einsatz aufGPU entscheidend ist.
  • Effizienz: YOLO11 diese Verbesserungen mit einer vergleichbaren oder oft sogar geringeren Parameteranzahl (z. B. YOLO11x im Vergleich zu YOLOv5x) und demonstriert damit die Effizienz seiner architektonischen Optimierungen.

Training und Ökosystem

Benutzerfreundlichkeit

Beide Modelle profitieren vom renommierten Ultralytics , das die Entwicklererfahrung in den Vordergrund stellt.

  • YOLOv5 setzt mit seiner intuitiven Struktur und der Verwendung von Standard-PyTorch den Maßstab für „Training in 5 Minuten starten”. PyTorch Dataloadern
  • YOLO11 integriert sich nahtlos in das einheitliche ultralytics Python . Dieses Paket bietet eine einheitliche API für alle Aufgaben, was bedeutet, dass der Wechsel von Erkennung zu Instanzsegmentierung oder Pose-Schätzung erfordert nur die Änderung eines einzigen String-Arguments.

Trainingseffizienz

YOLO11 optimierte Trainingsroutinen YOLO11 , die oft zu einer schnelleren Konvergenz führen. Funktionen wie die Mosaik-Augmentierung wurden verfeinert, und das ankerfreie Design macht den Vorverarbeitungsschritt der automatischen Ankerentwicklung, wie er in YOLOv5 zu finden ist, überflüssig. Darüber hinaus weisen beide Modelle im Vergleich zu Transformer-basierten Detektoren wie RT-DETR, was größere Batch-Größen auf Consumer-GPUs ermöglicht.

Training mit der Ultralytics

Das Training YOLO11 mit dem Python unglaublich einfach. Die gleiche Syntax gilt für YOLOv5 die ultralytics Package.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Vielseitigkeit

Während YOLOv5 erst später in seinem Lebenszyklus Unterstützung für Segmentierung und Klassifizierung YOLOv5 , YOLO11 von Grund auf als Multi-Task-Lernsystem konzipiert. Es unterstützt nativ:

  • Objekterkennung
  • Instanzsegmentierung
  • Bildklassifizierung
  • Pose-Schätzung
  • Orientierte Bounding Box (OBB)

Dies macht YOLO11 vielseitigeren „Schweizer Taschenmesser” für komplexe Computer-Vision-Pipelines, bei denen mehrere Analysearten gleichzeitig benötigt werden.

Ideale Anwendungsfälle

Wann man YOLOv5 wählen sollte

  • Altsysteme: Wenn Sie bereits über eine Produktionspipeline verfügen, die auf dem spezifischen YOLOv5 basiert, oder requirements.txtDie Fortsetzung mit YOLOv5 Stabilität.
  • Spezifische Hardware-Einschränkungen: Auf extrem alter Hardware oder bestimmten FPGA-Implementierungen verfügt die einfachere Architektur von YOLOv5 über bereits optimierte Bitströme.
  • Replikation der Forschung: Zur Reproduktion wissenschaftlicher Arbeiten aus den Jahren 2020–2023, in denen YOLOv5 Basis verwendet wurde.

Wann YOLO11 wählen?

  • Edge-KI-Einsatz: Dank seines hervorragenden Verhältnisses zwischen Geschwindigkeit und Genauigkeit eignet sich YOLO11 für Geräte wie NVIDIA oder Raspberry Pi, insbesondere für die Echtzeit-Videoverarbeitung.
  • Hohe Genauigkeitsanforderungen: Anwendungen in der medizinischen Bildgebung oder Fehlererkennung, bei denen jeder Prozentpunkt des mAP .
  • Multitasking-Anwendungen: Projekte, die eine Posenschätzung (z. B. Sportanalysen) oder gedrehte Begrenzungsrahmen (z. B. Luftbildvermessung) erfordern, profitieren von der nativen Unterstützung YOLO11.
  • Cloud-Schulung: Nutzung der Ultralytics für optimiertes Datenmanagement und Modelltraining.

Fazit

Sowohl YOLOv5 YOLO11 ein Beweis für das Engagement Ultralytics für Open-Source-Exzellenz. YOLOv5 bleibt ein zuverlässiges, bewährtes Arbeitstier. Allerdings YOLO11 bietet mit seinen architektonischen Verbesserungen, seiner überlegenen Genauigkeit und seiner breiteren Aufgabenunterstützung einen überzeugenden Upgrade-Pfad.

Für Entwickler, die in die Zukunft blicken, ist die Wahl klar: YOLO11 die für moderne Anwendungen erforderliche Leistungssteigerung. Für diejenigen, die nach der absoluten Spitzenleistung suchen, empfehlen wir außerdem dringend, sich mit YOLO26 zu befassen, das eine durchgängige NMS Erkennung für eine noch einfachere Bereitstellung einführt.

Entdecken Sie die YOLO26-Dokumentation

Weitere Modelle, die Sie interessieren könnten, sind YOLOv10 für Echtzeit-Leistungsforschung oder YOLO für die Erkennung offener Vokabulare.


Kommentare