Zum Inhalt springen

YOLOv5 vs. YOLO26: Evolution der Echtzeit-Objekterkennung

Die Entwicklung der Objekterkennung ist von erheblichen Fortschritten in Effizienz und Genauigkeit geprägt. Jahrelang galt YOLOv5 als Industriestandard, geschätzt für seine Ausgewogenheit aus Geschwindigkeit und Benutzerfreundlichkeit. Die Landschaft der Computer Vision verändert sich jedoch schnell. Hier kommt YOLO26, die neueste Generation von Ultralytics, die neu definiert, was auf Edge-Geräten und Hochleistungsservern gleichermaßen möglich ist.

Dieser Leitfaden bietet einen technischen Vergleich zwischen dem legendären YOLOv5 und dem hochmodernen YOLO26, der deren Architekturen, Leistungsmetriken und idealen Anwendungsfälle analysiert, um Ihnen bei der Wahl des richtigen Tools für Ihr nächstes Computer-Vision-Projekt zu helfen.

Vergleich auf einen Blick

Obwohl beide Modelle das Ergebnis des Engagements von Ultralytics für zugängliche KI sind, repräsentieren sie unterschiedliche Epochen der Designphilosophie. YOLOv5 konzentrierte sich auf den Aufbau eines robusten, benutzerfreundlichen Ökosystems, während YOLO26 die Grenzen der Latenz und der architektonischen Effizienz verschiebt.

YOLOv5: Der etablierte Standard

Im Juni 2020 von Glenn Jocher veröffentlicht, revolutionierte YOLOv5 die Zugänglichkeit der Objekterkennung. Es war eines der ersten Modelle, das ein nahtloses Trainingserlebnis direkt innerhalb des PyTorch-Ökosystems bot und sich vom Darknet-Framework seiner Vorgänger löste.

  • Datum: 2020-06-26
  • Autoren: Glenn Jocher
  • Organisation:Ultralytics
  • Hauptmerkmal: Ankerbasierte Detektion, die Non-Maximum Suppression (NMS) erfordert.

YOLOv5 bleibt ein zuverlässiges Arbeitspferd, insbesondere für Altsysteme, bei denen die Aktualisierung der Inferenz-Pipeline kostspielig sein könnte. Seine „Anchor-Based“-Architektur basiert auf vordefinierten Boxen zur Vorhersage von Objektpositionen, eine Methode, die effektiv ist, aber eine sorgfältige Abstimmung der Hyperparameter erfordert.

Erfahren Sie mehr über YOLOv5

YOLO26: Die neue Ära

Im Januar 2026 von Glenn Jocher und Jing Qiu veröffentlicht, führt YOLO26 radikale architektonische Änderungen ein, die für die moderne Ära der Edge AI konzipiert wurden. Es verzichtet auf Anker und komplexe Nachbearbeitung, um eine hohe Geschwindigkeit ohne Kompromisse bei der Genauigkeit zu liefern.

  • Datum: 2026-01-14
  • Autoren: Glenn Jocher, Jing Qiu
  • Organisation:Ultralytics
  • Hauptmerkmal: End-to-End NMS-frei, MuSGD-Optimierer, DFL-Entfernung.

YOLO26 wurde für Entwickler entwickelt, die maximalen Durchsatz benötigen. Durch den Wegfall der Notwendigkeit von NMS vereinfacht es die Bereitstellungslogik und reduziert die Latenz, was es zur überlegenen Wahl für Echtzeitanwendungen auf CPUs und mobilen Geräten macht.

Erfahren Sie mehr über YOLO26


Technischer Leistungsvergleich

Die folgenden Metriken verdeutlichen den Generationssprung in der Leistung. Tests wurden auf dem COCO-Datensatz durchgeführt, einem Standard-Benchmark für Objekterkennungsaufgaben.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Wichtige Erkenntnisse

  1. CPU-Effizienz: YOLO26n ist auf der CPU fast 2x schneller als YOLOv5n, während es einen massiven Sprung in der Genauigkeit bietet (28,0% vs. 40,9% mAP). Dies ist entscheidend für Bereitstellungen auf Raspberry Pi oder mobilen Geräten, wo GPU-Ressourcen nicht verfügbar sind.
  2. Parameter-Effizienz: YOLO26x erreicht eine deutlich höhere Genauigkeit (57,5% mAP) als YOLOv5x (50,7%), während es fast die Hälfte der Parameter verwendet (55,7 Mio. vs. 97,2 Mio.). Diese Reduzierung der Modellgröße senkt den Speicherbedarf und die Speicherkosten.
  3. Genauigkeits-/Geschwindigkeits-Kompromiss: Die „Nano“-Version von YOLO26 übertrifft die „Small“-Version von YOLOv5 in Bezug auf die Genauigkeit, obwohl sie eine kleinere Modellklasse ist.

Umstieg von YOLOv5

Wenn Sie derzeit YOLOv5s verwenden, wird der Wechsel zu YOLO26n Ihnen wahrscheinlich gleichzeitig eine höhere Genauigkeit und eine schnellere Inferenz ermöglichen, wodurch sowohl Ihre Rechenkosten als auch die Latenz reduziert werden.

Architektonischer Deep Dive

Der Leistungsunterschied resultiert aus grundlegenden Unterschieden in der Herangehensweise der Modelle an das Problem der detect.

1. End-to-End NMS-freies Design

YOLOv5 verwendet einen traditionellen Ansatz, der Tausende potenzieller Bounding Boxes generiert. Ein Nachbearbeitungsschritt namens Non-Maximum Suppression (NMS) ist erforderlich, um diese auf die endgültigen detect zu filtern. Dieser Schritt ist oft langsam und auf Hardware wie FPGAs oder NPUs schwer zu beschleunigen.

YOLO26 ist nativ End-to-End. Es nutzt während des Trainings eine Dual-Label-Zuweisungsstrategie, die das Modell dazu zwingt, eine einzelne, qualitativ hochwertige Box pro Objekt vorherzusagen. Dies eliminiert den NMS-Schritt während der Inferenz vollständig.

  • Vorteil: Geringere Latenz und einfachere Bereitstellungspipelines (keine Notwendigkeit, NMS in C++ oder CUDA für benutzerdefinierte Exporte zu implementieren).
  • Ergebnis: Bis zu 43% schnellere CPU-Inferenz im Vergleich zu früheren Generationen, die auf aufwendige Nachbearbeitung angewiesen waren.

2. Verlustfunktionen: DFL-Entfernung & ProgLoss

YOLOv5 (und das nachfolgende YOLOv8) nutzten Distribution Focal Loss (DFL), um Box-Grenzen zu verfeinern. Obwohl effektiv, fügt DFL dem Exportprozess Rechenaufwand und Komplexität hinzu.

YOLO26 entfernt DFL und kehrt zu einem vereinfachten Regressions-Head zurück, der für die INT8-Bereitstellung leichter zu quantisieren ist. Um potenzielle Genauigkeitsverluste zu kompensieren, führt YOLO26 ProgLoss (Progressive Loss Balancing) und STAL (Small-Target-Aware Label Assignment) ein.

  • STAL: Zielt speziell auf das Problem der „kleinen Objekte“ ab und steigert die Leistung bei weit entfernten oder winzigen Zielen – eine häufige Schwäche in früheren YOLO-Versionen, einschließlich v5.
  • ProgLoss: Passt das Gewicht verschiedener Verlustkomponenten während des Trainings dynamisch an, um die Konvergenz zu stabilisieren.

3. Der MuSGD-Optimierer

Trainingsstabilität war ein Hauptaugenmerk für das YOLO26-Team. Während YOLOv5 typischerweise auf Standard-SGD- oder Adam-Optimierer setzte, integriert YOLO26 MuSGD, einen hybriden Optimierer, der von Moonshot AIs Kimi K2 und den Trainingsmethoden für Large Language Models (LLM) inspiriert ist.

  • Innovation: Es bringt die Stabilität der Muon-Optimierung in die Computer Vision, was höhere Lernraten und eine schnellere Konvergenz ohne das Risiko von Verlustspitzen ermöglicht.

Vielseitigkeit und Aufgabenunterstützung

Beide Modelle sind in das Ultralytics-Ökosystem integriert, was bedeutet, dass sie eine breite Palette von Computer-Vision-Aufgaben unterstützen. YOLO26 enthält jedoch aufgabenspezifische architektonische Verbesserungen, die YOLOv5 fehlen.

MerkmalYOLOv5YOLO26
Objekterkennung✅ Standard Anker-basiertNMS-frei, STAL für kleine Objekte
Segmentation✅ Hinzugefügt in v7.0Semantischer Verlust & Multi-Skalen-Proto
Pose-Schätzung❌ (Verfügbar in Forks)RLE (Residuale Log-Likelihood-Schätzung)
OBB❌ (Verfügbar in Forks)Winkelverlust für präzise Rotation
Klassifizierung✅ Unterstützt✅ Optimierte Architekturen

Die Unterstützung von YOLO26 für Residual Log-Likelihood Estimation (RLE) in der Pose-Schätzung liefert deutlich genauere Keypoints für das menschliche Pose track, was es für Sportanalysen und Anwendungen im Gesundheitswesen überlegen macht.

Training und Nutzung

Eine der Stärken des Ultralytics-Ökosystems ist die vereinheitlichte API. Unabhängig davon, ob Sie YOLOv5 (über das moderne Paket) oder YOLO26 verwenden, bleibt der Code konsistent und einfach.

Python-Codebeispiel

So können Sie mit beiden Modellen trainieren und inferieren, indem Sie das ultralytics Paket. Beachten Sie, dass für YOLOv5 das moderne Paket das yolov5u (ankerfrei angepasste) Gewichte standardmäßig für bessere Kompatibilität, aber der Vergleich gilt für die Architektur.

from ultralytics import YOLO

# Load the models
model_v5 = YOLO("yolov5s.pt")  # Legacy standard
model_26 = YOLO("yolo26n.pt")  # New NMS-free standard

# Comparison: Inference on an image
# YOLO26 requires no NMS post-processing arguments in export/deployment
results_v5 = model_v5("https://ultralytics.com/images/bus.jpg")
results_26 = model_26("https://ultralytics.com/images/bus.jpg")

# Print results to see speed differences
print(f"YOLOv5 Speed: {results_v5[0].speed}")
print(f"YOLO26 Speed: {results_26[0].speed}")

# Train YOLO26 on custom data
# The MuSGD optimizer is handled automatically
results = model_26.train(data="coco8.yaml", epochs=100, imgsz=640)

Die Ultralytics Platform (ehemals HUB) vereinfacht dies zusätzlich, indem sie die Verwaltung von Datensätzen und das Training beider Modelle in der Cloud ohne Code ermöglicht, wobei YOLO26 die empfohlene Standardeinstellung für neue Projekte auf der Plattform ist.

Bereitstellung und Ökosystem

YOLOv5 verfügt über ein riesiges Legacy-Ökosystem. Es gibt Tausende von Tutorials, Drittanbieter-Repositories und Hardware-Integrationen, die speziell für yolov5 Formate geschrieben wurden. Wenn Sie mit einer starren, älteren Hardware-Pipeline arbeiten, die exakt die Ausgabe-tensor-Form von YOLOv5 erfordert, bleibt es eine praktikable Wahl.

Für moderne Implementierungen bietet YOLO26 jedoch überlegene Exportoptionen.

  • Edge AI: Die Entfernung von DFL und NMS erleichtert die Konvertierung von YOLO26-Modellen in Formate wie TensorRT und OpenVINO erheblich.
  • Quantisierung: YOLO26 ist quantisierungsfreundlich konzipiert und behält bei der Konvertierung in INT8 für mobile Prozessoren eine höhere Genauigkeit bei.

Fazit

Während YOLOv5 ein legendäres Modell bleibt, das die Objekterkennung demokratisiert hat, repräsentiert YOLO26 die Zukunft. Mit seinem End-to-End NMS-freien Design, der Entfernung schwergewichtiger Verlustfunktionen und der Integration von LLM-inspirierten Optimierern wie MuSGD bietet YOLO26 ein Leistungsprofil, das YOLOv5 einfach nicht erreichen kann.

Für Entwickler, die neue Projekte starten, ist YOLO26 die klare Empfehlung. Es bietet höhere Genauigkeit bei geringerer Latenz, reduzierten Speicherverbrauch und einen einfacheren Bereitstellungspfad.

Andere Modelle entdecken

Für Benutzer, die an spezialisierten Architekturen interessiert sind, empfiehlt es sich, YOLO11 zu erkunden, den direkten Vorgänger von YOLO26, der eine ausgezeichnete Allround-Leistung bietet, oder YOLO-World für Open-Vocabulary-Erkennungsaufgaben, bei denen Objekte erkannt werden müssen, die nicht in Ihrem Trainingsdatensatz vorhanden sind.


Kommentare