YOLO26 vs. YOLOv9: Die nächste Evolutionsstufe in der Echtzeit-Objekterkennung

Die Entwicklung von Architekturen zur Objekterkennung ist geprägt von einem ständigen Streben nach Geschwindigkeit, Genauigkeit und Effizienz. Vergleich zwischen YOLO26 und YOLOv9 wird diese rasante Entwicklung deutlich. Während YOLOv9 mit programmierbaren Gradienten die Grenzen der Informationsspeicherung YOLOv9 , definiert das neuere YOLO26 die Landschaft mit einer durchgängigen, NMS Architektur neu, die speziell für Edge-Leistung und massive CPU optimiert ist.

Modellübersicht

YOLO26

YOLO26 repräsentiert den Stand der Technik im Bereich der Bildverarbeitungs-KI Anfang 2026. Entwickelt von Ultralyticsentwickelt, verfügt es über ein natives End-to-End-Design, das Non-Maximum Suppression (NMS) überflüssig macht und die Bereitstellungspipelines optimiert. Durch die Entfernung von Distribution Focal Loss (DFL) und die Integration des neuartigen MuSGD-Optimierers– einer Mischung aus SGD Muon, inspiriert durch LLM-Training – erreicht YOLO26 CPU um bis zu 43 % schnellere CPU bei gleichbleibender Spitzenpräzision.

Autoren: Glenn Jocher, Jing Qiu
Organisation:Ultralytics
Datum: 14. Januar 2026
Hauptmerkmal: NMS End-to-End-Erkennung, MuSGD-Optimierer, ProgLoss + STAL
GitHub:Ultralytics Repository

Erfahren Sie mehr über YOLO26

YOLOv9

Veröffentlicht Anfang 2024, YOLOv9 das Konzept der programmierbaren Gradienteninformation (PGI) und die GELAN-Architektur ein. Diese Innovationen behoben das Problem des „Informationsengpasses” in tiefen Netzwerken und stellten sicher, dass wichtige Daten während des Feedforward-Prozesses nicht verloren gingen. Es bleibt ein leistungsstarkes Modell, insbesondere für Forschungsanwendungen, die eine hohe Parametereffizienz erfordern.

Autoren: Chien-Yao Wang, Hong-Yuan Mark Liao
Organisation: Institute of Information Science, Academia Sinica
Datum: 21. Februar 2024
Hauptmerkmal: Programmierbare Gradienteninformationen (PGI), GELAN-Architektur
Arxiv:YOLOv9
GitHub:YOLOv9 Repository

Erfahren Sie mehr über YOLOv9

Technischer Architekturvergleich

Die architektonische Divergenz zwischen diesen beiden Modellen bedeutet eine Verlagerung von der theoretischen Optimierung des Informationsflusses hin zur praktischen Effizienz der Bereitstellung.

YOLO26: Effizienz und Edge-First-Design

YOLO26 konzentriert sich auf die Reduzierung des Rechenaufwands für die Nachbearbeitung und Verlustberechnung.

End-to-End NMS: Im Gegensatz zu herkömmlichen Detektoren, die redundante Begrenzungsrahmen ausgeben, für die NMS erforderlich ist, sagt YOLO26 direkt den genauen Satz von Objekten voraus. Dies reduziert die Latenzschwankungen und vereinfacht den Export in Formate wie ONNX TensorRT, da komplexe benutzerdefinierte NMS nicht mehr erforderlich sind.
ProgLoss + STAL: Die Einführung von Progressive Loss und Soft-Target Anchor Labeling verbessert die Erkennung kleiner Objekte erheblich, was eine wichtige Voraussetzung für Drohnenbilder und Roboterinspektionen ist.
MuSGD Optimizer: Dieser hybride Optimierer bringt Innovationen aus dem Training großer Sprachmodelle in die Computer Vision ein und stabilisiert die Trainingsdynamik, wodurch eine schnellere Konvergenz mit weniger Hyperparameter-Anpassungen ermöglicht wird.

YOLOv9: Informationsspeicherung

Die Architektur YOLOv9 basiert auf der Lösung des Problems der Informationsverluste in tiefen Netzwerken.

PGI (Programmable Gradient Information): Ein zusätzlicher Überwachungszweig generiert zuverlässige Gradienten für die Aktualisierung der Netzwerkgewichte und stellt so sicher, dass tiefe Schichten semantische Informationen beibehalten.
GELAN (Generalized Efficient Layer Aggregation Network): Dieses Backbone optimiert die Parameternutzung, sodass YOLOv9 mit weniger Parametern als einige seiner Vorgänger eine hohe Genauigkeit YOLOv9 , allerdings oft auf Kosten einer höheren Rechenkomplexität (FLOPs) im Vergleich zum optimierten YOLO26.

Vereinfachte Bereitstellung

Die Entfernung von NMS YOLO26 ist ein entscheidender Faktor für den Einsatz am Rand. In älteren Modellen wie YOLOv9 läuft der NMS auf der CPU wenn das Modell auf einer GPU läuft, was zu einem Engpass führt. Die Ausgabe von YOLO26 ist sofort einsatzbereit, wodurch es auf Raspberry Pi und Mobilgeräten deutlich schneller ist.

Leistungsmetriken

Die folgende Tabelle vergleicht die Modelle anhand von Standard-Benchmarks. Beachten Sie den erheblichen Geschwindigkeitsvorteil von YOLO26 auf CPU , der direkt auf die Optimierungen seiner Architektur zurückzuführen ist.

Modell	Größe ^(Pixel)	mAP^val 50-95	Geschwindigkeit ^{CPU ONNX (ms)}	Geschwindigkeit ^{T4 TensorRT10 (ms)}	Parameter ^(M)	FLOPs ^(B)
YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20.0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

Vorteile Ultralytics

Während YOLOv9 eine solide theoretische Grundlage YOLOv9 , hat die Verwendung von YOLO26 innerhalb des Ultralytics für Entwickler und Unternehmen deutliche Vorteile.

Unübertroffene Benutzerfreundlichkeit

Die Ultralytics Python verwandelt komplexe Trainingsabläufe in wenige Zeilen Code. Diese „Zero-to-Hero”-Erfahrung steht im Gegensatz zu den forschungsorientierten Strukturen vieler anderer Repositorien.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer enabled by default
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

Vielseitigkeit über verschiedene Aufgaben hinweg

Im Gegensatz zu YOLOv9, das sich in erster Linie auf die Erkennung konzentriert, unterstützen das Ultralytics und YOLO26 von Haus aus eine breitere Palette von Computer-Vision-Aufgaben. Dadurch können Sie eine einzige einheitliche API für folgende Zwecke verwenden:

Instanzsegmentierung: Präzise Objektmaskierung auf Pixelebene.
Posen-Schätzung: Erkennung von Schlüsselpunkten für die Analyse menschlicher Aktivitäten.
OBB (Oriented Bounding Box): Erkennung gedrehter Objekte wie Schiffe in Satellitenbildern.
Klassifizierung: Kategorisierung des gesamten Bildes.

Training und Gedächtniseffizienz

Ultralytics sind auf Ressourceneffizienz ausgelegt. YOLO26 benötigt während des Trainings in der Regel weniger GPU (VRAM) als transformatorlastige Alternativen. Diese Effizienz ermöglicht:

Größere Stapelgrößen auf Verbraucherhardware.
Geringere Cloud-Computing-Kosten.
Schnellere Experimentierzyklen mit leicht verfügbaren vortrainierten Gewichten.

Anwendungen in der realen Welt

Die Wahl des richtigen Modells hängt von Ihren spezifischen Einsatzbedingungen ab.

Edge Computing und IoT

YOLO26 ist der unangefochtene Champion für Edge-Geräte. Dank seiner um 43 % schnelleren CPU eignet es sich für die Echtzeitüberwachung auf Geräten wie dem Raspberry Pi oder NVIDIA Nano, ohne dass eine aufwendige Quantisierung erforderlich ist. So profitiert beispielsweise ein intelligentes Parksystem, das auf lokaler Hardware läuft, enorm von dem NMS Design, das Latenzspitzen reduziert.

Inspektion in großer Höhe

Bei der landwirtschaftlichen Überwachung oder Infrastrukturinspektion mit Drohnen glänzt YOLO26 dank der Funktionen ProgLoss + STAL. Diese sind speziell darauf abgestimmt, kleine Objekte und schwierige Seitenverhältnisse besser als frühere Generationen zu verarbeiten, sodass Risse in Rohrleitungen oder Schädlinge auf Nutzpflanzen mit höherer Genauigkeit erkannt werden.

Wissenschaftliche Forschung

YOLOv9 bleibt ein starker Kandidat für die akademische Forschung, insbesondere für Studien, die sich mit Gradientenfluss und Netzwerkarchitekturtheorie befassen. Sein PGI-Konzept bietet einen faszinierenden Ansatz, um zu untersuchen, wie neuronale Netze die Informationstiefe bewahren.

Fazit

Beide Architekturen stellen bedeutende Meilensteine in der Computer Vision dar. YOLOv9 die Bedeutung von Gradienteninformationen in tiefen Netzwerken YOLOv9 . YOLO26 setzt diese Erkenntnisse jedoch in ein produktionsreifes Kraftpaket um. Mit seinem durchgängigen NMS Design, CPU überragenden CPU und seiner nahtlosen Integration in die Ultralytics bietet YOLO26 die beste Balance zwischen Geschwindigkeit, Genauigkeit und Benutzerfreundlichkeit für moderne KI-Anwendungen.

Entwicklern, die auf dem neuesten Stand bleiben möchten, empfehlen wir die Migration zu YOLO26, um die neuesten Fortschritte in Bezug auf Optimierer-Stabilität und Edge-Leistung zu nutzen.

Weiterführende Informationen

Wenn Sie sich für andere Hochleistungsmodelle der Ultralytics interessieren, sehen Sie sich YOLO11 für allgemeine Aufgaben oder RT-DETR für die transformatorbasierte Echtzeit-Erkennung.