Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 vs. YOLOv10#

Die Landschaft des Computer Vision entwickelt sich ständig weiter, angetrieben von der Nachfrage nach schnelleren, genaueren und effizienteren Modellen. Dieser Leitfaden bietet einen umfassenden technischen Vergleich zwischen zwei bahnbrechenden Architekturen im Bereich der Echtzeit-Objekterkennung: YOLO26 und YOLOv10. Durch die Analyse ihrer Architekturen, Leistungskennzahlen und Bereitstellungsmöglichkeiten möchten wir Entwicklern und Forschern helfen, das optimale Modell für ihre Vision-Anwendungen zu wählen.

Link to this sectionDie Entwicklung von NMS-freien Architekturen#

Jahrelang verließ sich die YOLO (You Only Look Once)-Familie stark auf Non-Maximum Suppression (NMS), um redundante Bounding Boxes während der Nachbearbeitung herauszufiltern. Obwohl effektiv, führt NMS zu Inferenz-Latenz und erschwert die Bereitstellung auf Edge-Geräten wie dem Raspberry Pi oder spezialisierten Neural Processing Units (NPUs).

Die Einführung von YOLOv10 stellte einen Paradigmenwechsel dar, indem es ein End-to-End NMS-freies Design vorstellte. Aufbauend auf diesem grundlegenden Durchbruch hat Ultralytics YOLO26 die Architektur für Produktionsumgebungen verfeinert und eine beispiellose Effizienz sowie Benutzerfreundlichkeit für eine breitere Palette an Aufgaben erreicht.

Der Engpass bei der Nachbearbeitung

Das Entfernen von NMS eliminiert den dynamischen, datenabhängigen Nachbearbeitungsschritt, der traditionell die Optimierung von Computer-Vision-Modellen auf Hardware-Beschleunigern wie TensorRT und OpenVINO behinderte.

Link to this sectionYOLOv10: Wegweisende NMS-freie Erkennung#

Datum: 23.05.2024
Autoren: Ao Wang, Hui Chen, Lihao Liu, et al.
Organisation: Tsinghua University
Ressourcen: ArXiv Paper | GitHub Repository

Entwickelt von Forschern der Tsinghua University, führte YOLOv10 eine konsistente Dual-Assignment-Strategie ein, um die Notwendigkeit von NMS zu eliminieren. Durch den Einsatz eines ganzheitlichen, auf Effizienz und Genauigkeit ausgerichteten Modelldesigns wurde die rechnerische Redundanz reduziert, während ein starkes mAP (mean Average Precision) beibehalten wurde.

Stärken:

  • NMS-freie Architektur: Der ursprüngliche Pionier des NMS-freien Designs in der YOLO-Serie, der die Latenz für Echtzeitanwendungen drastisch reduziert.
  • Effizienz: Bietet ein starkes Gleichgewicht zwischen Parameteranzahl und Inferenzgeschwindigkeit im Vergleich zu Modellen früherer Generationen.

Schwächen:

  • Begrenzte Aufgabenunterstützung: Hauptsächlich auf Standard-Objekterkennung fokussiert, ohne native Unterstützung für fortgeschrittene Aufgaben wie Segmentierung oder Pose Estimation.
  • Akademischer Fokus: Die Codebasis ist zwar robust, tendiert jedoch eher zur Forschung als zur schlanken, unternehmensorientierten Produktion.

Erfahre mehr über YOLOv10

Link to this sectionYOLO26: Der neue Standard für Edge und Cloud#

Datum: 14.01.2026
Autoren: Glenn Jocher und Jing Qiu
Organisation: Ultralytics
Ressourcen: GitHub Repository | Ultralytics Platform

Veröffentlicht als Nachfolger von YOLO11, bringt YOLO26 das NMS-freie Konzept zur vollen Entfaltung. Es integriert nativ die End-to-End-Erkennung in die hochoptimierte Ultralytics Platform und bietet damit ein komplettes Toolset für moderne Machine-Learning-Pipelines.

YOLO26 führt mehrere architektonische Durchbrüche ein:

  • DFL-Entfernung: Distribution Focal Loss wurde vollständig entfernt. Dies vereinfacht den Modellexport erheblich und verbessert die Kompatibilität mit Edge- und stromsparenden Geräten.
  • Bis zu 43 % schnellere CPU-Inferenz: Dank der DFL-Entfernung und strukturellen Optimierungen ist YOLO26 auf CPUs deutlich schneller, was es ideal für IoT- und mobile Einsätze macht.
  • MuSGD-Optimierer: Inspiriert von Trainingsmethoden für große Sprachmodelle (LLMs) (wie Moonshot AI's Kimi K2), verwendet YOLO26 eine Mischung aus SGD und Muon. Dies bringt beispiellose Trainingsstabilität und schnellere Konvergenz in das Computer Vision.
  • ProgLoss + STAL: Diese fortschrittlichen Verlustfunktionen liefern bemerkenswerte Verbesserungen bei der Erkennung kleiner Objekte, was entscheidend für Luftbilder und drohnenbasierte Sicherheitsüberwachung ist.
  • Aufgabenspezifische Verbesserungen: YOLO26 ist nicht nur ein Detektor. Es bietet Semantic Segmentation Loss und Multi-Scale-Proto für Segmentierung, Residual Log-Likelihood Estimation (RLE) für Pose Estimation und spezialisierte Winkelverlust-Funktionen für Oriented Bounding Boxes (OBB).

Erfahre mehr über YOLO26

Link to this sectionLeistungsanalyse und Metriken#

Die folgende Tabelle vergleicht die COCO-Erkennungsleistung von YOLO26- und YOLOv10-Modellen. Beachte, wie YOLO26 eine überlegene Genauigkeit bei gleichzeitiger außergewöhnlicher Parametereffizienz erreicht.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLO26n64040,938,91.72,45,4
YOLO26s64048,687.22,59,520,7
YOLO26m64053,1220.04.720,468,2
YOLO26l64055,0286.26.224,886,4
YOLO26x64057.5525.811.855,7193,9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5,4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054,4-12.256,9160.4

Link to this sectionDer Ultralytics-Vorteil: Trainings- und Speichereffizienz#

Bei der Bereitstellung von Modellen in der Produktion sind Speicheranforderungen und Trainingseffizienz genauso wichtig wie die Inferenzgeschwindigkeit. Ultralytics-Modelle, insbesondere YOLO26, sind hochgradig optimiert, um den CUDA-Speicherverbrauch während des Trainings zu reduzieren. Dies ermöglicht es Entwicklern, größere batch sizes auf Consumer-GPUs zu verwenden, was die Trainingszeit und die Rechenkosten drastisch senkt. Umgekehrt erfordern komplexe Architekturen oder schwere Transformer-Modelle wie RT-DETR oft teure High-End-Hardware für ein effektives Training.

Continuous Integration und Ökosystem

Einer der größten Vorteile bei der Wahl von YOLO26 ist die Integration in das gut gepflegte Ultralytics-Ökosystem. Von der Datenannotation bis zum Experiment-Tracking bietet die Plattform alles, was ein Machine-Learning-Ingenieur unter einem Dach benötigt.

Link to this sectionPraktische Umsetzung: Code-Beispiel#

Das Markenzeichen von Ultralytics ist seine branchenführende Benutzerfreundlichkeit. Mit einer intuitiven Python API erfordert die Migration von einem älteren Modell wie YOLOv8 auf das hochmoderne YOLO26 lediglich das Aktualisieren einer einzigen Zeile Code.

Hier ist ein zu 100 % ausführbares Beispiel, das zeigt, wie man mit YOLO26 trainiert und Inferenzen durchführt:

from ultralytics import YOLO

# 1. Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# 2. Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cpu",  # Easily switch to 0 for GPU
)

# 3. Perform NMS-free inference on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# 4. Display the results to screen
predictions[0].show()

# 5. Export to ONNX for simplified edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to {export_path}")

Link to this sectionAnwendungsfälle und Empfehlungen#

Die Wahl zwischen YOLO26 und YOLOv10 hängt von deinen spezifischen Projektanforderungen, Bereitstellungseinschränkungen und Ökosystem-Präferenzen ab.

Link to this sectionWann man YOLO26 wählen sollte#

YOLO26 ist eine starke Wahl für:

  • NMS-freies Edge-Deployment: Anwendungen, die eine konsistente Inferenz mit niedriger Latenz ohne die Komplexität der Non-Maximum Suppression-Nachverarbeitung erfordern.
  • Umgebungen nur mit CPU: Geräte ohne dedizierte GPU-Beschleunigung, bei denen die bis zu 43 % schnellere CPU-Inferenz von YOLO26 einen entscheidenden Vorteil bietet.
  • Erkennung kleiner Objekte: Anspruchsvolle Szenarien wie Luftaufnahmen von Drohnen oder die Analyse von IoT-Sensoren, bei denen ProgLoss und STAL die Genauigkeit bei winzigen Objekten deutlich steigern.

Link to this sectionWann du dich für YOLOv10 entscheiden solltest#

YOLOv10 wird empfohlen für:

  • NMS-freie Echtzeiterkennung: Anwendungen, die von einer End-to-End-Erkennung ohne Non-Maximum Suppression profitieren, was die Komplexität der Bereitstellung reduziert.
  • Ausgewogene Speed-Accuracy-Tradeoffs: Projekte, die eine gute Balance zwischen Inferenzgeschwindigkeit und Erkennungsgenauigkeit über verschiedene Modellgrößen hinweg erfordern.
  • Anwendungen mit konstanter Latenz: Bereitstellungsszenarien, in denen vorhersehbare Inferenzzeiten kritisch sind, wie etwa in der Robotik oder bei autonomen Systemen.

Link to this sectionFazit#

Während YOLOv10 durch die Einführung des NMS-freien Paradigmas wichtige Beiträge für die akademische Gemeinschaft geleistet hat, hebt YOLO26 diese Technologie auf Unternehmensniveau. Mit seinem bemerkenswerten 43 %-Schub bei der CPU-Geschwindigkeit, dem innovativen MuSGD-Optimierer und der unübertroffenen Vielseitigkeit bei Vision-Aufgaben ist YOLO26 die ultimative Wahl sowohl für Edge-Computing als auch für Cloud-Bereitstellungen im großen Maßstab.

Für Teams, die eine aktive Community, umfassende Dokumentation und eine reibungslose Entwicklererfahrung priorisieren, ist das Ultralytics-Ökosystem konkurrenzlos. Wenn du Modelle für spezialisierte Szenarien untersuchst, möchtest du vielleicht auch YOLO-World für Zero-Shot Open-Vocabulary Detection in Betracht ziehen. Für die überwiegende Mehrheit der realen Anwendungsfälle ist YOLO26 jedoch die definitive Empfehlung.

Mitwirkende

Kommentare