Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 gegen YOLOv5#

Die Evolution der Computer Vision wurde durch das unermüdliche Streben nach Geschwindigkeit, Genauigkeit und Zugänglichkeit definiert. Die Wahl der richtigen Architektur ist entscheidend für den Erfolg jedes KI-Projekts. In diesem umfassenden Leitfaden vergleichen wir zwei monumentale Releases von Ultralytics: das bahnbrechende YOLOv5 und das wegweisende YOLO26. Während beide die Landschaft der Echtzeit-Objekterkennung stark beeinflusst haben, spiegeln ihre zugrunde liegenden Technologien einen massiven Paradigmenwechsel in der Verarbeitung visueller Daten durch neuronale Netze wider.

Link to this sectionModellübersicht#

Bevor wir in die architektonischen Feinheiten eintauchen, lassen uns die grundlegenden Details beider Modelle festlegen.

YOLO26 Details:

Erfahre mehr über YOLO26

YOLOv5 Details:

Erfahre mehr über YOLOv5

Weitere Optionen entdecken

Während sich dieser Leitfaden auf YOLO26 und YOLOv5 konzentriert, könnten Entwickler, die Altsysteme migrieren, auch an einem Vergleich von YOLO11 oder der bahnbrechenden NMS-freien Architektur von YOLOv10 interessiert sein. Beide bieten hervorragende Anknüpfungspunkte für spezifische Bereitstellungsumgebungen.

Link to this sectionArchitektonische Innovationen#

Die sechsjährige Lücke zwischen YOLOv5 und YOLO26 stellt einen massiven Sprung in der Deep-Learning-Forschung dar. YOLOv5 popularisierte den weit verbreiteten Einsatz von PyTorch für Vision-Modelle und bot einen hochoptimierten, ankerbasierten Erkennungsmechanismus, der zum Industriestandard wurde. Er stützte sich jedoch stark auf Non-Maximum Suppression (NMS) während der Nachverarbeitung, was auf ressourcenbeschränkten Geräten zu Latenzengpässen führen konnte.

YOLO26 gestaltet die Inference-Pipeline mit einem End-to-End NMS-Free Design völlig neu. Indem die Notwendigkeit einer NMS-Nachverarbeitung entfällt, liefert YOLO26 eine schnellere und deutlich einfachere Bereitstellungslogik – ein Konzept, das zuerst in YOLOv10 erprobt, hier jedoch perfektioniert wurde. Darüber hinaus bietet YOLO26 eine DFL-Entfernung (Distribution Focal Loss), die den Output-Head drastisch vereinfacht. Dies macht den Export des Modells in Formate wie ONNX und TensorRT unglaublich reibungslos und sorgt für eine exzellente Kompatibilität mit Edge- und stromsparenden Geräten.

Während des Trainings verwendet YOLO26 den hochmodernen MuSGD Optimizer, eine hybride Form aus SGD und Muon, inspiriert durch Moonshot AI's Kimi K2. Dies bringt Innovationen aus dem LLM-Training in den Bereich der Computer Vision und garantiert ein hochstabiles Training sowie eine deutlich schnellere Konvergenz im Vergleich zu den traditionellen SGD- oder AdamW-Optimierern, die in YOLOv5 verwendet werden.

Link to this sectionLeistung und Metriken#

Bei der Bewertung von Modellen bestimmt das Gleichgewicht zwischen mean Average Precision (mAP) und Inference-Geschwindigkeit die Praxistauglichkeit. YOLO26 ist nativ sowohl für High-End-GPUs als auch für Edge-CPUs optimiert.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLO26n64040.938,91.72.45,4
YOLO26s64048.687.22,59,520.7
YOLO26m64053.1220.04.720.468,2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049,0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Die Benchmarks zeigen eine atemberaubende Verbesserung. Zum Beispiel erreicht YOLO26n eine mAP von 40.9 im Vergleich zu den 28.0 von YOLOv5n, während es gleichzeitig eine bis zu 43 % schnellere CPU-Inference bietet. Dies macht YOLO26 für eingebettete Bereitstellungen wie Raspberry Pi oder mobile Geräte weitaus überlegen. Während YOLOv5 bei der TensorRT-GPU-Geschwindigkeit im Nano-Bereich leicht die Nase vorn hat, spricht die Genauigkeit deutlich für YOLO26.

Link to this sectionTrainings-Ökosystem und Benutzerfreundlichkeit#

Beide Modelle profitieren enorm vom gut gepflegten Ultralytics-Ökosystem. Sie bieten eine "Zero-to-Hero"-Erfahrung mit einer optimierten Python-API, umfangreicher Dokumentation und aktiver Community-Unterstützung. YOLO26 hebt die Trainingseffizienz jedoch auf ein neues Niveau.

Ultralytics-Modelle erfordern während des Trainings durchweg deutlich weniger CUDA-Speicher als transformer-lastige Alternativen. YOLO26 verstärkt dies mit seinen ProgLoss + STAL-Verlustfunktionen. Diese Fortschritte führen zu bemerkenswerten Verbesserungen bei der Erkennung kleiner Objekte, ohne den Speicherbedarf aufzublähen.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model with the MuSGD optimizer (default for YOLO26)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)

# Run fast, NMS-free inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Dieses einfache Skript ermöglicht es Entwicklern, benutzerdefinierte Datensätze schnell zu iterieren und nahtlos von der Datenaufnahme zu einem produktionsreifen Modell überzugehen.

Bereitstellung leicht gemacht

Über die Ultralytics-Plattform kannst du deine trainierten YOLO26-Modelle automatisch in Formate wie CoreML oder TensorFlow Lite exportieren, ohne eine einzige Zeile Konvertierungscode schreiben zu müssen.

Link to this sectionVielseitigkeit und ideale Anwendungsfälle#

Link to this sectionWann du YOLOv5 verwenden solltest#

YOLOv5 bleibt ein zuverlässiges Arbeitspferd für Altsysteme. Wenn du über eine bestehende industrielle Pipeline verfügst, die stark an ankerbasierte Outputs gekoppelt ist, oder wenn du Inference auf älteren NVIDIA Jetson-Geräten mit ausgereiften, eingefrorenen TensorRT-Stacks ausführst, bietet YOLOv5 eine stabile, gut dokumentierte Lösung.

Link to this sectionWann du YOLO26 verwenden solltest#

YOLO26 ist die definitive Wahl für moderne Computer-Vision-Projekte. Seine Vielseitigkeit übertrifft die seines Vorgängers bei weitem. Während sich YOLOv5 primär auf Erkennung konzentriert (mit späteren Segmentierungserweiterungen), bietet YOLO26 tiefe, native Unterstützung für Instanzsegmentierung, Pose-Schätzung, Bildklassifizierung und orientierte Bounding Boxes (OBB).

YOLO26 führt aufgabenspezifische Verbesserungen ein, wie eine spezialisierte semantische Segmentierungs-Verlustfunktion, Residual Log-Likelihood Estimation (RLE) für hochpräzise Pose-Keypoints und eine fortgeschrittene Winkel-Verlustfunktion für OBB, um knifflige Grenzprobleme zu lösen.

  • Edge-IoT und Robotik: Die NMS-freie Architektur und die 43 % schnellere CPU-Inference machen YOLO26 ideal für die robotergestützte Echtzeit-Navigation und Smart-Home-Kameras.
  • Luftbildaufnahmen: Die ProgLoss + STAL-Verbesserungen machen das Erkennen winziger Objekte von Drohnen aus – wie Fahrzeuge auf Parkplätzen oder Pflanzen auf landwirtschaftlichen Feldern – wesentlich zuverlässiger.
  • Echtzeit-Videoanalyse: Ob beim Tracking von Sportlern in Übertragungen oder bei der Überwachung von Verkehrsflüssen, das Leistungsverhältnis von YOLO26 sorgt für einen hohen Recall, ohne dass Bilder verloren gehen.

Letztendlich stellt das Engagement von Ultralytics für ein zugängliches Hochleistungs-Ökosystem sicher, dass der Übergang von YOLOv5 zu YOLO26 reibungslos verläuft und Forschern wie Entwicklern gleichermaßen modernste Funktionen erschließt.

Mitwirkende

Kommentare