Zum Inhalt springen

YOLOv6-3.0 vs. YOLO11: Ein detaillierter Modellvergleich

Die Wahl des richtigen Computer-Vision-Modells ist entscheidend, um eine optimale Leistung bei Objekterkennungsaufgaben zu erzielen. Diese Seite bietet einen technischen Vergleich zwischen YOLOv6-3.0 und Ultralytics YOLO11, wobei der Schwerpunkt auf ihren Architekturen, Leistungskennzahlen, Trainingsmethoden und idealen Anwendungsfällen liegt, um Ihnen bei der Auswahl des am besten geeigneten Modells für Ihr Projekt zu helfen. Während beide leistungsstarke Modelle sind, stellt YOLO11 den neuesten Stand der Technik in Bezug auf Effizienz und Vielseitigkeit dar.

YOLOv6-3.0

Autoren: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu und Xiangxiang Chu
Organisation: Meituan
Datum: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
Dokumente: https://docs.ultralytics.com/models/yolov6/

YOLOv6-3.0, entwickelt von Meituan, ist ein Objekterkennungs-Framework, das primär für industrielle Anwendungen entwickelt wurde. Es wurde Anfang 2023 veröffentlicht und zielte darauf ab, ein Gleichgewicht zwischen Geschwindigkeit und Genauigkeit zu bieten, das für reale Einsatzszenarien geeignet ist, in denen Echtzeit-Inferenz Priorität hat.

Architektur und Hauptmerkmale

YOLOv6 führte architektonische Modifikationen wie ein hardwarebewusstes, effizientes Backbone- und Neck-Design ein. Version 3.0 verfeinerte diese Elemente weiter und integrierte Techniken wie Self-Distillation während des Trainings, um die Leistung zu steigern. Es bietet auch spezifische Modelle, die für die mobile Bereitstellung optimiert sind (YOLOv6Lite), was den Fokus auf Edge Computing verdeutlicht.

Stärken

  • Gutes Verhältnis zwischen Geschwindigkeit und Genauigkeit: Bietet eine wettbewerbsfähige Leistung, insbesondere für industrielle Objekterkennungsaufgaben.
  • Quantisierungsunterstützung: Bietet Tools und Tutorials für die Modellquantisierung, was für den Einsatz auf Hardware mit begrenzten Ressourcen von Vorteil ist.
  • Mobile Optimierung: Beinhaltet YOLOv6Lite-Varianten, die speziell für mobile oder CPU-basierte Inferenz entwickelt wurden.

Schwächen

  • Eingeschränkte Aufgabenvielfalt: Primär auf Objekterkennung ausgerichtet, es fehlt die native Unterstützung für Instanzsegmentierung, Bildklassifizierung oder Pose-Schätzung, die in Ultralytics YOLO11 zu finden ist.
  • Ökosystem und Wartung: Obwohl Open-Source, ist das Ökosystem nicht so umfassend oder aktiv gepflegt wie die Ultralytics-Plattform, was potenziell zu langsameren Updates und weniger Community-Support führt.
  • Höherer Ressourcenverbrauch: Größere YOLOv6-Modelle können deutlich mehr Parameter und FLOPs im Vergleich zu YOLO11-Äquivalenten für eine ähnliche mAP haben, was potenziell mehr Rechenressourcen erfordert, wie in der Tabelle unten gezeigt.

Ideale Anwendungsfälle

YOLOv6-3.0 eignet sich gut für:

  • Industrielle Anwendungen, bei denen die Geschwindigkeit der Objekterkennung entscheidend ist, z. B. in der Fertigung für die Qualitätskontrolle.
  • Bereitstellungsszenarien, die Quantisierung nutzen oder für Mobilgeräte optimierte Modelle erfordern.
  • Projekte, die sich ausschließlich auf Objekterkennung konzentrieren, ohne dass Multi-Task-Funktionen erforderlich sind.

Erfahren Sie mehr über YOLOv6

Ultralytics YOLO11

Autoren: Glenn Jocher und Jing Qiu
Organisation: Ultralytics
Datum: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Dokumente: https://docs.ultralytics.com/models/yolo11/

Ultralytics YOLO11 ist das neueste State-of-the-Art-Modell von Ultralytics und stellt die neueste Entwicklung in der YOLO-Serie dar. Es wurde im September 2024 veröffentlicht und baut auf früheren Versionen wie YOLOv8 mit architektonischen Verfeinerungen auf, die sowohl die Geschwindigkeit als auch die Genauigkeit verbessern sollen. YOLO11 wurde für überlegene Leistung und Effizienz bei einer Vielzahl von Computer-Vision-Aufgaben entwickelt.

Architektur und Hauptmerkmale

YOLO11 verfügt über eine optimierte Architektur, die ein verfeinertes Gleichgewicht zwischen Modellgröße, Inferenzgeschwindigkeit und Genauigkeit erreicht. Zu den wichtigsten Verbesserungen gehören verbesserte Merkmalsextraktions-Schichten und eine optimierte Netzwerkstruktur, die den Rechenaufwand minimiert. Dieses Design gewährleistet eine effiziente Leistung auf verschiedener Hardware, von Edge-Geräten wie dem NVIDIA Jetson bis hin zu leistungsstarken Cloud-Servern. Als ankerfreier Detektor vereinfacht YOLO11 den Detektionsprozess und verbessert oft die Generalisierung.

Stärken

  • Überlegene Performance-Balance: Erzielt höhere mAP-Werte mit weniger Parametern und FLOPs im Vergleich zu Wettbewerbern und bietet so ein hervorragendes Gleichgewicht zwischen Geschwindigkeit und Genauigkeit.
  • Vielseitigkeit: Unterstützt mehrere Bildverarbeitungsaufgaben innerhalb eines einzigen Frameworks – einschließlich Erkennung, Instanzsegmentierung, Klassifizierung, Pose-Schätzung und orientierte Begrenzungsrahmen (OBB) – und bietet so eine umfassende Lösung.
  • Benutzerfreundlichkeit: Profitiert vom optimierten Ultralytics-Ökosystem mit einer einfachen Python API, umfangreicher Dokumentation und leicht verfügbaren vorab trainierten Gewichten.
  • Gut gepflegtes Ökosystem: Aktiv entwickelt und unterstützt von Ultralytics, mit häufigen Updates, starker Community-Unterstützung über GitHub und Discord sowie Integration mit Ultralytics HUB für nahtloses Training und Deployment.
  • Trainingseffizienz: Bietet effiziente Trainingsprozesse, die oft weniger Speicher benötigen als andere Modelltypen wie Transformer.

Schwächen

  • Neues Modell: Da es sich um die neueste Version handelt, wächst das Volumen an Community-Tutorials und Drittanbieter-Tools im Vergleich zu etablierteren Modellen wie YOLOv5 noch.
  • Erkennung kleiner Objekte: Wie die meisten einstufigen Detektoren kann es bei extrem kleinen Objekten im Vergleich zu spezialisierten zweistufigen Detektoren zu Problemen kommen.

Ideale Anwendungsfälle

Die Kombination aus Genauigkeit, Geschwindigkeit und Vielseitigkeit macht YOLO11 ideal für:

  • Echtzeitanwendungen, die eine hohe Präzision erfordern, wie z. B. autonome Systeme und Robotik.
  • Multi-Task-Szenarien, die gleichzeitig Erkennung, Segmentierung und Pose-Schätzung erfordern.
  • Bereitstellung auf verschiedenen Plattformen, von ressourcenbeschränkten Geräten wie dem Raspberry Pi bis hin zu leistungsstarken Cloud-Infrastrukturen.
  • Anwendungen in den Bereichen Sicherheit, Einzelhandel, Gesundheitswesen und Logistik.

Erfahren Sie mehr über YOLO11

Leistungsvergleich

Die unten aufgeführten Performance-Benchmarks, die auf dem COCO-Datensatz evaluiert wurden, veranschaulichen deutlich die Vorteile von YOLO11. Für ein vergleichbares Genauigkeitsniveau sind YOLO11-Modelle deutlich effizienter. Zum Beispiel erreicht YOLO11l ein höheres mAPval von 53,4 mit nur 25,3 Millionen Parametern und 86,9 Milliarden FLOPs, während YOLOv6-3.0l nur 52,8 mAPval erreicht und dabei mehr als doppelt so viele Parameter (59,6 Millionen) und FLOPs (150,7 Milliarden) benötigt. Diese überlegene Effizienz macht YOLO11 zu einer skalierbareren und kosteneffektiveren Wahl für die Bereitstellung.

Modell Größe
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv6-3.0n 640 37.5 - 1.17 4.7 11.4
YOLOv6-3.0s 640 45.0 - 2.66 18.5 45.3
YOLOv6-3.0m 640 50.0 - 5.28 34.9 85.8
YOLOv6-3.0l 640 52.8 - 8.95 59.6 150.7
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

Trainingsmethoden

Beide Modelle verwenden Standard-Deep-Learning-Trainingspraktiken. YOLOv6-3.0 verwendet Techniken wie Self-Distillation, um die Leistung zu verbessern. Ultralytics YOLO11 profitiert jedoch von seiner tiefen Integration in das umfassende Ultralytics-Ökosystem, das eine deutlich optimiertere und benutzerfreundlichere Erfahrung bietet.

Das Training mit YOLO11 wird durch das Python-Paket und Ultralytics HUB vereinfacht, das Tools für einfache Hyperparameter-Optimierung, effizientes Laden von Daten und automatische Protokollierung mit Plattformen wie TensorBoard und Weights & Biases bietet. Darüber hinaus ist die Architektur von YOLO11 auf Trainingseffizienz optimiert, was oft weniger Speicher und Zeit erfordert. Beide Modelle bieten vortrainierte Gewichte auf dem COCO-Datensatz, um Transfer Learning zu erleichtern.

Fazit

Während YOLOv6-3.0 eine solide Leistung für bestimmte industrielle Anwendungsfälle bietet, erweist sich Ultralytics YOLO11 als die bessere Wahl für die meisten Entwickler und Forscher. YOLO11 bietet modernste Genauigkeit, bemerkenswerte Effizienz (niedrigere Parameter und FLOPs für höhere mAP) und außergewöhnliche Vielseitigkeit bei verschiedenen Bildverarbeitungsaufgaben. Sein größter Vorteil liegt in seiner unübertroffenen Benutzerfreundlichkeit, die durch das robuste, gut dokumentierte und aktiv gepflegte Ultralytics-Ökosystem unterstützt wird. Dieses starke Leistungsverhältnis macht es für eine breitere Palette von Anwendungen und Bereitstellungsumgebungen geeignet, vom Edge bis zur Cloud.

Für Benutzer, die Alternativen erkunden, bietet Ultralytics auch andere leistungsstarke Modelle wie YOLOv10, YOLOv9 und YOLOv8. Weitere Vergleiche mit Modellen wie RT-DETR, YOLOX und YOLOv7 finden Sie in der Ultralytics-Dokumentation.



📅 Vor 1 Jahr erstellt ✏️ Vor 1 Monat aktualisiert

Kommentare