Zum Inhalt springen

YOLOv10 . YOLOv6.0: Showdown der Echtzeit-Objekterkennung der nächsten Generation

In der sich schnell entwickelnden Landschaft der Computervision ist die Wahl des richtigen Objekterkennungsmodells entscheidend für den Erfolg. Zwei herausragende Architekturen, YOLOv10 und YOLOv6.YOLOv6, haben bedeutende Fortschritte bei der Balance zwischen Geschwindigkeit und Genauigkeit erzielt. Dieser detaillierte Vergleich untersucht ihre architektonischen Innovationen, Leistungskennzahlen und idealen Anwendungsfälle, um Ihnen bei der Entscheidung zu helfen, welches Modell Ihren Einsatzanforderungen am besten entspricht.

Beide Modelle bieten robuste Lösungen für Industrie- und Forschungsanwendungen, doch das Ultralytics bietet eine einheitliche Plattform, auf der diese Architekturen einfach trainiert, validiert und bereitgestellt werden können. Ganz gleich, ob Sie eine Smart-City-Infrastruktur aufbauen oder Fertigungslinien optimieren möchten – es ist entscheidend, die Feinheiten dieser Modelle zu verstehen.

Vergleich von Leistungsmetriken

Die folgende Tabelle zeigt die Leistung von YOLOv10 YOLOv6. YOLOv6 bei verschiedenen Modellskalen. Beide Modelle werden anhand des COCO bewertet, wobei der Schwerpunkt auf der mittleren durchschnittlichen Präzision (mAP) und der Inferenzlatenz auf Standardhardware liegt.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

YOLOv10: Der End-to-End-Innovator

YOLOv10, eingeführt von Forschern der Tsinghua-Universität, stellt einen Paradigmenwechsel in der YOLO dar. Sein charakteristischstes Merkmal ist die Eliminierung der Nicht-Maximalunterdrückung (NMS) während der Nachbearbeitung, die durch eine konsistente Doppelzuweisungsstrategie erreicht wird. Dieses Design ermöglicht ein echtes End-to-End-Training und eine echte End-to-End-Bereitstellung, wodurch die Latenzschwankungen in realen Anwendungen erheblich reduziert werden.

Wesentliche Architekturmerkmale

  • NMS Training: Durch die Verwendung doppelter Label-Zuweisungen – eins-zu-viele für eine umfassende Überwachung und eins-zu-eins für eine effiziente Inferenz –YOLOv10 den Rechenengpass von NMS.
  • Ganzheitliches Effizienzdesign: Die Architektur verfügt über einen leichtgewichtigen Klassifizierungskopf und eine räumlich-kanalgetrennte Abwärtsabtastung, wodurch sowohl die Parameteranzahl als auch die FLOPs optimiert werden.
  • Ranggesteuertes Blockdesign: Um Redundanzen zu reduzieren, YOLOv10 ein ranggesteuertes Blockdesign, das die Komplexität an die Stufe des Netzwerks anpasst.

Autor: Ao Wang, Hui Chen, Lihao Liu, et al.
Organisation:Tsinghua-Universität
Datum: 23. Mai 2024
Links:arXiv | GitHub | Docs

Erfahren Sie mehr über YOLOv10

YOLOv6-3.0: Das industrielle Schwergewicht

YOLOv6.YOLOv6, entwickelt von Meituan, konzentriert sich stark auf industrielle Anwendungsszenarien, in denen der Durchsatz auf dedizierter Hardware (wie GPUs) von entscheidender Bedeutung ist. Es führt das „Reloading”-Update ein, das das Netzwerk für eine bessere Genauigkeit und Quantisierungsleistung optimiert.

Wesentliche Architekturmerkmale

  • Bi-Directional Concatenation (BiC): Ein neuartiges Modul im Hals, das die Lokalisierungsgenauigkeit durch eine bessere Verschmelzung von Merkmalen aus verschiedenen Maßstäben verbessert.
  • Anchor-Aided Training (AAT): Diese Strategie ermöglicht es dem Modell, von der Stabilität der ankerbasierten Optimierung zu profitieren und gleichzeitig eine ankerfreie Architektur für die Inferenz beizubehalten.
  • Quantisierungsfreundlich: Die Architektur wurde speziell entwickelt, um Genauigkeitsverluste bei der Quantisierung auf INT8 zu minimieren, wodurch sie sich ideal für Edge-Geräte eignet, die TensorRT verwenden.

Autor: Chuyi Li, Lulu Li, Yifei Geng et al.
Organisation:Meituan
Datum: 13. Januar 2023
Links:arXiv | GitHub | Docs

Erfahren Sie mehr über YOLOv6

Vergleichsanalyse

1. Latenz und Effizienz

YOLOv10 übertrifft YOLOv6. YOLOv6 in Bezug auf Parametereffizienz und FLOPs. So erzielt das YOLOv10s-Modell einen höheren mAP 46,3 % gegenüber 45,0 %) mit deutlich weniger Parametern (7,2 Mio. gegenüber 18,5 Mio.) als YOLOv6.YOLOv6. Die Entfernung von NMS YOLOv10 zu einer geringeren und besser vorhersehbaren Latenz YOLOv10 , insbesondere auf CPUs, wo der Overhead für die Nachbearbeitung erheblich ist. Umgekehrt ist YOLOv6. YOLOv6 in hohem Maße für GPU optimiert und zeigt oft Vorteile in Bezug auf die Rohgeschwindigkeit in Szenarien mit hohen Batch-Größen auf T4-GPUs.

2. Einsatz und Benutzerfreundlichkeit

Beide Modelle werden vom Ultralytics unterstützt, sodass Entwickler über eine einheitliche API darauf zugreifen können. Die native End-to-End-Natur YOLOv10 vereinfacht jedoch die Export-Pipeline in Formate wie ONNX und CoreML, da keine komplexen NMS an den Modellgraphen angehängt werden müssen.

Bereitstellungstipp

Bei der Bereitstellung auf Edge-Geräten wie dem Raspberry Pi oder NVIDIA führen die geringere Parameteranzahl und das NMS Design YOLOv10 im Vergleich zu älteren Architekturen in der Regel zu einem geringeren Speicherverbrauch und schnelleren Startzeiten.

3. Trainingsmethodik

YOLOv6.YOLOv6 nutzt Techniken wie Selbstdestillation und ankergestütztes Training, um die Leistung zu steigern, was jedoch zu einer Verlängerung der Trainingszeit und einem höheren Speicherbedarf führen kann. YOLOv10 konsistente doppelte Zuweisungen YOLOv10 , die die Verlustberechnung optimieren und eine effiziente Konvergenz ermöglichen. Nutzer, die die Ultralytics Plattform kann beide Modelle trainieren, ohne sich um diese internen Komplexitäten kümmern zu müssen, dank der abstrahierten model.train() Schnittstelle.

Der Ultralytics Vorteil

Die Auswahl eines Modells innerhalb des Ultralytics garantiert eine „Zero-to-Hero”-Erfahrung. Im Gegensatz zu eigenständigen Repositorys, denen möglicherweise Dokumentation oder Wartung fehlen, profitieren Ultralytics von folgenden Vorteilen:

  • Einheitliche API: Wechseln Sie zwischen YOLOv10, YOLOv6 und anderen, indem Sie eine einzige Zeichenfolge in Ihrem Code ändern.
  • Vielseitigkeit der Aufgaben: Während YOLOv10 YOLOv6 in erster Linie Detektoren YOLOv6 , Ultralytics in seinen Kernmodellen die Posenschätzung, Instanzsegmentierung und Klassifizierung.
  • Robuster Export: Exportieren Sie Modelle nahtlos nach TensorRT, OpenVINO und TFLite den Einsatz in der Produktion.
from ultralytics import YOLO

# Load a pre-trained YOLOv10 model
model = YOLO("yolov10n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()

Zukunftssicherheit mit YOLO26

YOLOv10 YOLOv6. YOLOv6 sind zwar ausgezeichnete Wahlmöglichkeiten, doch die Entwicklung in diesem Bereich schreitet weiter voran. Für Entwickler, die auf der Suche nach dem absolut Modernsten sind, ist baut YOLO26 auf dem NMS Durchbruch von YOLOv10 auf, führt YOLOv10 wichtige Verbesserungen für die Hardware von 2026 ein.

Warum auf YOLO26 upgraden?

  • End-to-End-Native: Wie YOLOv10 ist auch YOLO26 NMS, was eine möglichst einfache Bereitstellungspipeline gewährleistet.
  • MuSGD-Optimierer: Inspiriert vom LLM-Training sorgt dieser hybride Optimierer für eine stabile Konvergenz und reduziert den Bedarf an umfangreicher Hyperparameter-Optimierung.
  • Edge-First-Design: Durch die Entfernung von Distribution Focal Loss (DFL) und optimierten Blöcken bietet YOLO26 CPU um bis zu 43 % schnellere CPU und ist damit die beste Wahl für Mobil- und IoT-Anwendungen.
  • Aufgabenspezifität: Im Gegensatz zu seinen Vorgängern enthält YOLO26 spezielle Verlustfunktionen wie ProgLoss und STAL, die die Erkennung kleiner Objekte verbessern und native Unterstützung für OBB- und Pose-Aufgaben bieten.

Erfahren Sie mehr über YOLO26

Fazit

YOLOv10 ist die empfohlene Wahl für Benutzer, die Wert auf Parametereffizienz und einfache End-to-End-Bereitstellungspipelines legen. Dank seiner Fähigkeit, mit weniger FLOPs eine hohe Genauigkeit zu erzielen, eignet es sich ideal für Echtzeitanwendungen auf unterschiedlicher Hardware.

YOLOv6.YOLOv6 bleibt ein starker Anwärter für industrielle Umgebungen mit dedizierter GPU , wo seine spezifischen Optimierungen für TensorRT voll ausgeschöpft werden können.

Für diejenigen, die höchste Leistung, Vielseitigkeit bei verschiedenen Aufgaben (Segmentierung, Pose, OBB) und zukunftssicheren Support benötigen, ist YOLO26 die definitive Empfehlung von Ultralytics.

Weiterführende Informationen


Kommentare