YOLOv5 YOLO26: Ein Generationssprung in der Echtzeit-Objekterkennung

Die Entwicklung der Computervision wurde durch das kontinuierliche Streben nach schnelleren, genaueren und leichter zugänglichen Modellen geprägt. Beim Vergleich von Ultralytics YOLOv5 mit dem hochmodernen Ultralytics vergleichen, sehen wir einen Paradigmenwechsel, der die Lücke zwischen robusten Altsystemen und der neuesten Generation moderner KI-Anwendungen schließt.

Dieser Leitfaden bietet eine umfassende technische Aufschlüsselung beider Architekturen und beleuchtet deren Leistungskennzahlen, strukturelle Unterschiede und ideale Einsatzszenarien.

Modellübersichten

YOLOv5: Das Arbeitspferd der Branche

YOLOv5 wurde 2020 veröffentlicht und YOLOv5 die Zugänglichkeit der Objekterkennung. Durch die native Migration der Architektur auf PyTorch Framework ermöglichte es Entwicklern eine beispiellose „Zero-to-Hero”-Erfahrung.

Autoren: Glenn Jocher
Organisation:Ultralytics
Datum: 2020-06-26
GitHub:https://github.com/ultralytics/yolov5
Dokumentation:YOLOv5 Dokumentation

YOLOv5 den Grundstein für das hochgradig gepflegte Ultralytics . Es führte aggressive Datenvergrößerungstechniken, effiziente Trainingsschleifen und hochoptimierte Exportpfade zu Edge-Formaten wie CoreML und ONNX. Dank seiner Benutzerfreundlichkeit und geringen Speicheranforderungen während des Trainings wurde es zu einem unverzichtbaren Werkzeug für Startups und Forscher weltweit.

Erfahren Sie mehr über YOLOv5

YOLO26: Der Standard für Bildverarbeitungs-KI der nächsten Generation

Schnellvorlauf bis Januar 2026: Ultralytics stellt die Spitze der Echtzeit-Bildverarbeitungs-KI dar. Es integriert nativ die Erfahrungen aus den dazwischenliegenden Generationen wie YOLOv8 und YOLO11, und führt gleichzeitig massive Durchbrüche ein, die durch das Training mit Large Language Models (LLM) inspiriert wurden.

Autoren: Glenn Jocher und Jing Qiu
Organisation:Ultralytics
Datum: 2026-01-14
GitHub:https://github.com/ultralytics/ultralytics
Dokumentation:YOLO26 Dokumentation

YOLO26 setzt neue Maßstäbe in Sachen Leistungsausgewogenheit und bietet modernste Genauigkeit, während es ausdrücklich für den Einsatz in Edge-Computing-Szenarien entwickelt wurde.

Erfahren Sie mehr über YOLO26

Andere Ultralytics

Wenn Sie eine ältere Codebasis migrieren, könnte Sie auch ein Vergleich YOLOv5 YOLO11, dem Vorgängermodell, das erstmals Unterstützung für verschiedene Aufgaben wie Posenschätzung und orientierte Begrenzungsrahmen (OBB) bot.

Architektonische Durchbrüche in YOLO26

Während YOLOv5 auf ankerbasierten Erkennungsköpfen und Standard-Verlustfunktionen YOLOv5 , wurde bei YOLO26 die interne Mechanik komplett überarbeitet, um Engpässe bei der Bereitstellung zu beseitigen.

End-to-End-Design NMS: Der wichtigste Unterschied ist die native End-to-End-Architektur von YOLO26. Im Gegensatz zu YOLOv5, das eine manuelle Non-Maximum Suppression (NMS) zum Filtern redundanter Begrenzungsrahmen erfordert, entfällt dieser Nachbearbeitungsschritt bei YOLO26 vollständig. Dies gewährleistet eine deterministische Inferenzlatenz und vereinfacht die Integration in C++ oder eingebettete Hardware erheblich.
DFL-Entfernung: YOLO26 entfernt Distribution Focal Loss (DFL). Diese architektonische Entscheidung vereinfacht den Modellexport erheblich und verbessert die Kompatibilität mit energiesparenden Edge-Geräten und Mikrocontrollern, die oft mit komplexen Operatoren zu kämpfen haben.
MuSGD-Optimierer: In Anlehnung an Kimi K2 von Moonshot AI nutzt YOLO26 den MuSGD-Optimierer, eine Mischung aus SGD Muon. Dies bringt die Stabilität und schnelle Konvergenz, die beim LLM-Training zu beobachten sind, in die Computer Vision ein, was im Vergleich zu transformatorlastigen Modellen zu einem geringeren Speicherverbrauch und schnelleren Trainingszyklen führt.
ProgLoss + STAL: YOLO26 nutzt hochentwickelte ProgLoss- und STAL-Funktionen, wodurch seine Fähigkeit zur detect und dichter Objekte – eine historische Herausforderung für YOLOv5 – erheblich verbessert wird.

Leistungsvergleich

Beim Vergleich der Modelle im COCO zeigt YOLO26 massive Verbesserungen in der Genauigkeit (mAP) bei gleichzeitiger Reduzierung der Parameteranzahl und CPU .

Modell	Größe ^(Pixel)	mAP^val 50-95	Geschwindigkeit ^{CPU ONNX (ms)}	Geschwindigkeit ^{T4 TensorRT10 (ms)}	Parameter ^(M)	FLOPs ^(B)
YOLOv5n	640	28.0	73.6	1.12	2.6	7.7
YOLOv5s	640	37.4	120.7	1.92	9.1	24.0
YOLOv5m	640	45.4	233.9	4.03	25.1	64.2
YOLOv5l	640	49.0	408.4	6.61	53.2	135.0
YOLOv5x	640	50.7	763.2	11.89	97.2	246.4

YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

Hinweis: YOLO26 Nano (YOLO26n) erreicht beeindruckende 40,9 mAP zu 28,0 mAP bei YOLOv5n und bietet gleichzeitig CPU um bis zu 43 % schnellere CPU dank DFL-Entfernung und NMS Kopf.

Vielseitigkeit und Aufgabenunterstützung

YOLOv5 in erster Linie für die Objekterkennung bekannt. Während spätere Updates eine grundlegende Segmentierung einführten, wurde YOLO26 von Grund auf als einheitliche Multitasking-Engine entwickelt.

YOLO26 unterstützt von Haus aus:

Instanzsegmentierung: Mit aufgabenspezifischen Multiskalen-Protos und semantischem Segmentierungsverlust.
Posen-Schätzung: Verwendung der Residual Log-Likelihood-Schätzung (RLE) für eine hochpräzise Erkennung von Schlüsselpunkten.
Orientierte Begrenzungsrahmen (OBB): Einschließlich spezieller Winkelverluste zur Lösung von Problemen mit Grenzunterbrechungen, die für die Analyse von Satellitenbildern von entscheidender Bedeutung sind.
Bildklassifizierung: Standardmäßige Kategorisierung des gesamten Bildes.

Ökosystemintegration

Beide Modelle profitieren von der Ultralytics , die nahtlose Datenannotation, automatisierte Hyperparameter-Optimierung und Cloud-Bereitstellung mit einem Klick bietet. YOLO26 nutzt jedoch die Vorteile moderner API-Strukturen voll aus.

Verwendung und Code-Beispiele

Die Ultralytics Python macht den Wechsel zwischen Modellen unglaublich einfach. Da beide Modelle dasselbe gut gepflegte Ökosystem nutzen, muss für die Aktualisierung einer älteren YOLOv5 auf YOLO26 lediglich die Gewichtsdatei geändert werden.

Python-Beispiel

from ultralytics import YOLO

# To use YOLOv5, load a v5 weights file
# model = YOLO("yolov5su.pt")

# Migrate to the recommended YOLO26 model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset using the efficient MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=32,  # YOLO26's low memory footprint allows larger batch sizes
)

# Run an NMS-free inference
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

CLI-Beispiel

Sie können YOLO26 direkt über die Befehlszeile mit dem TensorRT für maximalen GPU :

# Export the model to TensorRT format
yolo export model=yolo26n.pt format=engine

# Run inference with the compiled engine
yolo predict model=yolo26n.engine source=path/to/video.mp4

Ideale Anwendungsfälle

Wann YOLO26 wählen

Für jedes moderne Computer-Vision-Projekt ist YOLO26 die unbestrittene Empfehlung.

Edge-KI und IoT: Dank einer um 43 % schnelleren CPU und der Entfernung von DFL eignet es sich perfekt für den Einsatz auf einem Raspberry Pi oder mobilen Geräten.
Hochgeschwindigkeits-Pipelines: Die NMS Architektur gewährleistet eine stabile, vorhersehbare Latenz, die für autonome Robotik und Echtzeit-Sicherheitsalarmsysteme von entscheidender Bedeutung ist.
Komplexe Szenarien: Wenn Ihre Anwendung die Verfolgung kleiner Objekte (z. B. Drohnenüberwachung) oder rotierender Objekte (OBB) erfordert, bieten die fortschrittlichen Verlustfunktionen von YOLO26 (ProgLoss + STAL) einen enormen Genauigkeitsvorteil.

Wann YOLOv5 wählen?

Legacy-Systeme: Wenn Ihre Produktionsumgebung fest codierte Abhängigkeiten von der spezifischen Ankergenerierung oder NMS YOLOv5 aufweist, kann die Migration eine kurze Refactoring-Phase erfordern.
Spezifische akademische Basiswerte: Forscher verwenden YOLOv5 häufig YOLOv5 klassischen Basiswert, um die historische Entwicklung von Architekturen zur Objekterkennung zu veranschaulichen.

Zusammenfassung

Der Übergang von YOLOv5 YOLO26 ist nicht nur ein iteratives Update, sondern ein grundlegender Sprung in der Art und Weise, wie Objekterkennungsmodelle trainiert und eingesetzt werden. Durch die Nutzung des MuSGD-Optimierers, den Verzicht auf komplexe Nachbearbeitung dank eines NMS Designs und die massive Beschleunigung CPU bietet Ultralytics eine kompromisslose Balance zwischen Geschwindigkeit und Präzision.

Während YOLOv5 immer als das Modell in Erinnerung YOLOv5 , das die Bildverarbeitungs-KI demokratisiert hat, sollten Entwickler, die robuste, produktionsreife und zukunftssichere Anwendungen erstellen möchten, getrost auf YOLO26 aufbauen.