Zum Inhalt springen

YOLOv5 YOLOv10: Ein technischer Vergleich von Echtzeit-Objektdetektoren

Die Entwicklung der You Only Look Once (YOLO)-Architektur war ein prägendes Ereignis in der Geschichte der Bildverarbeitung. Zwei wichtige Meilensteine in dieser Entwicklung sind YOLOv5, der Industriestandard für Zuverlässigkeit und Benutzerfreundlichkeit, sowie YOLOv10, ein akademischer Durchbruch, der sich auf die Beseitigung von Engpässen bei der Nachbearbeitung konzentriert. Dieser Leitfaden enthält einen detaillierten technischen Vergleich, der Entwicklern bei der Auswahl des richtigen Tools für ihre Anwendungen hilft und gleichzeitig untersucht, wie das neueste YOLO26 die Stärken beider vereint.

Modellursprünge und Spezifikationen

Bevor wir uns mit den Leistungskennzahlen befassen, ist es wichtig, den Hintergrund jedes Modells zu verstehen.

YOLOv5
Autor: Glenn Jocher
Organisation: Ultralytics
Datum: 26.06.2020
GitHub: yolov5
Dokumente: YOLOv5

YOLOv10
Autoren: Ao Wang, Hui Chen, Lihao Liu, et al.
Organisation: Tsinghua-Universität
Datum: 23.05.2024
Arxiv: arXiv:2405.14458
GitHub: THU-MIG/yolov10
Dokumente: YOLOv10

Erfahren Sie mehr über YOLOv5

Leistungsanalyse

Die folgende Tabelle vergleicht die Modelle anhand des COCO , einem Standard-Benchmark für die Objekterkennung.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

YOLOv10 erzielt YOLOv10 eine höhere mittlere Genauigkeit (mAP) mit weniger Parametern, was die Effizienzsteigerungen durch seine neuere Architektur unterstreicht. YOLOv5 jedoch aufgrund seiner hochoptimierten CUDA in Bezug auf GPU wettbewerbsfähig, insbesondere auf älterer Hardware.

Erfahren Sie mehr über YOLOv10

Architektur und Design

YOLOv5: Der zuverlässige Standard

YOLOv5 auf einem modifizierten CSPNet-Backbone und einem PANet-Neck. Es verwendet standardmäßige ankerbasierte Erkennungsköpfe, die während der Nachbearbeitung eine Nicht-Maximalunterdrückung (NMS) erfordern, um doppelte Begrenzungsrahmen herauszufiltern.

  • Stärken: Äußerst ausgereifte Codebasis, umfassende Unterstützung durch Tools von Drittanbietern und stabile Bereitstellung auf Edge-Geräten wie Raspberry Pi.
  • Schwächen: Basiert auf NMS, was je nach Anzahl der Objekte in der Szene zu Latenzschwankungen führen kann.

YOLOv10: Der Pionier NMS

YOLOv10 einen Paradigmenwechsel YOLOv10 , indem es konsistente doppelte Zuweisungen für NMS Training einsetzte. Dadurch kann das Modell genau eine Box pro Objekt vorhersagen, wodurch die Notwendigkeit von NMS entfällt.

  • Stärken: Geringere Inferenzlatenz in Szenen mit hoher Dichte aufgrund NMS von NMS ; effizientes, ranggesteuertes Blockdesign reduziert Rechenredundanz.
  • Schwächen: Neuere Architektur erfordert möglicherweise spezifische Exporteinstellungen für einige Compiler; im Vergleich zu v5 weniger Unterstützung durch die Community.

Der NMS

Non-Maximum Suppression (NMS) ist ein Nachbearbeitungsschritt, der überlappende Begrenzungsrahmen filtert. Dieser Schritt ist zwar effektiv, aber sequenziell und für CPUs rechenintensiv. Seine Entfernung, wie in YOLOv10 YOLO26, ist für Echtzeitanwendungen auf Edge-Hardware von entscheidender Bedeutung.

Ökosystem und Benutzerfreundlichkeit

Einer der wichtigsten Faktoren für Entwickler ist das Ökosystem, das ein Modell umgibt. Hier wird der Unterschied zwischen einem Forschungsrepository und einer Produktionsplattform deutlich.

Der Ultralytics Vorteil

Beide Modelle können über die ultralytics Python , das ihnen Zugriff auf eine robuste Suite von Tools gewährt.

  • Ultralytics : Mit der Ultralytics können Benutzer Datensätze verwalten, in der Cloud trainieren und Modelle nahtlos bereitstellen.
  • Trainingseffizienz: Ultralytics sind hinsichtlich der Speichereffizienz während des Trainings optimiert und benötigen oft deutlich weniger VRAM als transformatorbasierte Alternativen.
  • Vielseitigkeit: Während YOLOv10 in erster Linie ein Erkennungsmodell YOLOv10 , unterstützt das Ultralytics in seinen Kernmodellen Bildsegmentierung, Posenschätzung und orientierte Objekterkennung (OBB).

Code-Beispiel

Das Umschalten zwischen Modellen ist so einfach wie das Ändern der Modellnamenszeichenfolge.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model
model_v5 = YOLO("yolov5s.pt")
model_v5.train(data="coco8.yaml", epochs=100)

# Load a pre-trained YOLOv10 model
model_v10 = YOLO("yolov10n.pt")
model_v10.predict("path/to/image.jpg")

Ideale Anwendungsfälle

Wann man YOLOv5 wählen sollte

  • Legacy-Systeme: Wenn Sie bereits über eine Pipeline verfügen, die auf YOLOv5 basiert.
  • Breiteste Kompatibilität: Für den Einsatz auf älteren eingebetteten Systemen, auf denen neuere Operatoren möglicherweise noch nicht unterstützt werden.
  • Community-Ressourcen: Wenn Sie Zugriff auf Tausende von Tutorials und Integrationen von Drittanbietern benötigen, die in den letzten fünf Jahren erstellt wurden.

Wann man YOLOv10 wählen sollte

  • Erkennung hoher Dichte: Szenarien wie Personenzählung oder Verkehrsanalyse, bei denen NMS die Verarbeitung NMS .
  • Strenge Latenzauflagen: Echtzeit-Robotik oder autonomes Fahren, wo jede Millisekunde der Inferenzlatenz zählt.
  • Forschung: Experimentieren mit den neuesten Fortschritten bei Zuweisungsstrategien und Architektur-Pruning.

Die ultimative Empfehlung: YOLO26

Während YOLOv5 Stabilität und YOLOv10 NMS Inferenz YOLOv10 , vereint das neu veröffentlichte Ultralytics diese Vorteile in einem einzigen, überlegenen Framework.

Warum auf YOLO26 upgraden? YOLO26 ist von Grund auf End-to-End-fähig und übernimmt das von YOLOv10 eingeführte NMS Design, erweitert es YOLOv10 um die robuste Ultralytics .

  1. MuSGD-Optimierer: Inspiriert durch LLM-Training (insbesondere Moonshot AI's Kimi K2) sorgt dieser Optimierer für stabile Konvergenz und schnelleres Training.
  2. Leistung: Optimiert für Edge-Computing, mit bis zu 43 % schnellerer CPU im Vergleich zu früheren Generationen.
  3. Genauigkeit: Mit ProgLoss und STAL (Semantic-Token Alignment Loss) wird die Erkennung kleiner Objekte, die bei früheren Modellen oft eine Schwäche darstellte, deutlich verbessert.
  4. Volle Vielseitigkeit: Im Gegensatz zu YOLOv10 sich auf die Erkennung konzentriert, bietet YOLO26 modernste Modelle für Segmentierung, Pose, Klassifizierung und OBB.

Für alle neuen Projekte, die im Jahr 2026 beginnen, ist YOLO26 die empfohlene Wahl, da es den einfachsten Weg von der Datensatzannotation bis zum Modellexport bietet.

Erfahren Sie mehr über YOLO26

Fazit

Sowohl YOLOv5 YOLOv10 Meilensteine in der Bildverarbeitung YOLOv10 . YOLOv5 hat KI demokratisiert, indem es sie zugänglich und zuverlässig gemacht hat, während YOLOv10 die technischen Grenzen der End-to-End-Verarbeitung erweitert hat. Allerdings entwickelt sich dieses Gebiet rasant weiter. Mit der Veröffentlichung von YOLO26 müssen Entwickler nicht mehr zwischen der Zuverlässigkeit des Ultralytics und der Geschwindigkeit von NMS Architekturen wählen – YOLO26 bietet beides.

Für weitere moderne Alternativen können Sie auch folgende Optionen in Betracht ziehen YOLO11 für allgemeine Bildverarbeitungsaufgaben oder Real-Time DETR (RT-DETR) für die transformatorbasierte Erkennung.


Kommentare