YOLOv9 . YOLO26: Entwicklung der Echtzeit-Objekterkennung
Im sich rasant entwickelnden Bereich der Computervision ist die Auswahl der richtigen Modellarchitektur entscheidend für das Gleichgewicht zwischen Leistung, Effizienz und einfacher Bereitstellung. Dieser Vergleich untersucht die technischen Unterschiede zwischen YOLOv9, einem leistungsstarken Modell, das Anfang 2024 eingeführt wurde, und YOLO26, der neuesten hochmodernen Version von Ultralytics , die im Januar 2026 Ultralytics . Beide Modelle stellen zwar bedeutende Meilensteine in der YOLO dar, sind jedoch hinsichtlich Geschwindigkeit, Trainingsstabilität und Komplexität der Bereitstellung auf unterschiedliche Anforderungen zugeschnitten.
Modellübersicht und Urheberschaft
Das Verständnis der Herkunft dieser Architekturen liefert den Kontext für ihre Designphilosophien.
YOLOv9: Programmierbare Gradienteninformation
Autoren: Chien-Yao Wang, Hong-Yuan Mark Liao
Organisation:Institut für Informationswissenschaft, Academia Sinica
Datum: 21.02.2024
Links:Arxiv-Artikel | GitHub-Repository
YOLOv9 das Konzept der programmierbaren Gradienteninformation (PGI) und des verallgemeinerten effizienten Schichtaggregationsnetzwerks (GELAN)YOLOv9 . Diese Innovationen befassten sich mit dem Problem des „Informationsengpasses” in tiefen neuronalen Netzen, bei dem Daten beim Durchlaufen aufeinanderfolgender Schichten verloren gehen. PGI stellt sicher, dass wichtige Merkmalsinformationen im gesamten tiefen Netzwerk erhalten bleiben, was insbesondere in komplexen Szenen hochpräzise Erkennungen ermöglicht.
YOLO26: Der End-to-End-Edge-Spezialist
Autoren: Glenn Jocher, Jing Qiu
Organisation:Ultralytics
Datum: 14.01.2026
Links:Offizielle Dokumente | GitHub-Repository
Aufbauend auf dem Erbe von YOLOv8 und YOLO11stellt YOLO26 eine Verlagerung hin zu einer vereinfachten, schnellen Bereitstellung dar. Es ist von Haus aus durchgängig NMS, sodass keine Nachbearbeitung mit Non-Maximum Suppression erforderlich ist. Diese Designentscheidung in Kombination mit der Entfernung von Distribution Focal Loss (DFL) macht YOLO26 auf CPU Edge-Geräten außergewöhnlich schnell. Es ist auch Vorreiter bei der Verwendung des MuSGD-Optimierers, einer Mischung aus SGD Muon (inspiriert durch LLM-Training), um eine stabile Konvergenz zu gewährleisten.
Leistung und Metriken im Vergleich
Die folgende Tabelle vergleicht die Leistung von Standardmodellen auf dem COCO . Beachten Sie den erheblichen Geschwindigkeitsvorteil von YOLO26 auf CPU , der auf die Optimierung seiner Architektur zurückzuführen ist.
| Modell | Größe (Pixel) | mAPval 50-95 | Geschwindigkeit CPU ONNX (ms) | Geschwindigkeit T4 TensorRT10 (ms) | Parameter (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Leistungsanalyse
YOLO26 zeigt einen klaren Vorteil in Bezug auf Latenz und Recheneffizienz. So erreicht YOLO26n beispielsweise einen höheren mAP 40,9 %) als YOLOv9t (38,3 %), während es deutlich weniger FLOPs (5,4 Mrd. gegenüber 7,7 Mrd.) benötigt. Diese Effizienz ist entscheidend für Anwendungen, die auf batteriebetriebenen Edge-Geräten laufen.
Architektonischer Deep Dive
YOLOv9
YOLOv9 auf die Beibehaltung des Informationsflusses. Sein GELAN-Backbone kombiniert die Stärken von CSPNet (Gradientenpfadplanung) und ELAN (Inferenzgeschwindigkeit), um einen leichtgewichtigen und dennoch leistungsstarken Feature-Extractor zu schaffen. Der PGI-Hilfszweig liefert während des Trainings zuverlässige Gradienteninformationen an tiefere Schichten, die dann während der Inferenz entfernt werden, um das Modell leichtgewichtig zu halten.
- Vorteile: Außergewöhnliche Genauigkeit bei schwierigen Benchmarks; hervorragende Informationserhaltung bei komplexen Szenen.
- Nachteile: Erfordert NMS ; Architektur kann für nicht standardmäßige Aufgaben komplex zu modifizieren sein; höhere Rechenlast für gleichwertigen Durchsatz im Vergleich zu neueren Generationen.
YOLO26-Architektur
YOLO26 legt den Schwerpunkt auf Inferenzgeschwindigkeit und einfache Bereitstellung.
- NMS Design: Durch das Training des Modells zur nativen Vorhersage von Eins-zu-Eins-Übereinstimmungen entfällt bei YOLO26 der heuristische NMS . Dies reduziert die Latenzschwankungen und vereinfacht TensorRT , da effiziente NMS nicht mehr erforderlich sind.
- MuSGD-Optimierer: Inspiriert von Moonshot AI's Kimi K2 kombiniert dieser Optimierer die Dynamik von SGD den adaptiven Eigenschaften des Muon-Optimierers. Dies sorgt für Stabilität beim Training großer Sprachmodelle (LLM) für die Bildverarbeitung.
- ProgLoss + STAL: Die Einführung von Progressive Loss und Soft-Target Assignment Loss (STAL) verbessert die Erkennung kleiner Objekte erheblich, eine häufige Schwäche von ankerfreien Detektoren.
Training und Ökosystem
Die Entwicklererfahrung unterscheidet sich zwischen den beiden Modellen erheblich, was vor allem auf die jeweiligen Software-Ökosysteme zurückzuführen ist.
Benutzerfreundlichkeit mit Ultralytics
Während YOLOv9 in das Ultralytics integriert YOLOv9 , ist YOLO26 ein natives Mitglied. Dadurch wird die Unterstützung aller Funktionen vom ersten Tag an gewährleistet, darunter:
- Vereinheitlichte API: Wechseln Sie zwischen Aufgaben wie Pose-Schätzung oder Orientierte Begrenzungsrahmen (OBB) durch einfaches Ändern der Modellgewichtungsdatei (z. B.
yolo26n-pose.pt), oder Auto-Modus mit angegebener Auslastungsfraktion ( - Ultralytics : Laden Sie Datensätze nahtlos hoch, versehen Sie sie mit Anmerkungen mithilfe von KI-Assistenten und trainieren Sie sie in der Cloud mit der Ultralytics .
- Exportflexibilität: Native Unterstützung für den Export mit einem Klick in Formate wie CoreML für iOS, TFLite Android und OpenVINO Intel .
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with MuSGD optimizer enabled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX for simplified deployment (no NMS plugin needed)
path = model.export(format="onnx")
Speicher- und Ressourceneffizienz
YOLO26 benötigt während des Trainings in der Regel weniger GPU als die Dual-Branch-Architektur (PGI) YOLOv9. Dadurch können Forscher größere Batch-Größen auf handelsüblicher Hardware wie der NVIDIA 3060 oder 4090 verwenden und so den Experimentierzyklus beschleunigen.
Anwendungsfälle in der Praxis
Wann man YOLOv9 wählen sollte
YOLOv9 ein starker Anwärter für Szenarien, in denen maximale Genauigkeit bei statischen Benchmarks die einzige Priorität ist und reichlich Rechenressourcen zur Verfügung stehen.
- Wissenschaftliche Forschung: Untersuchung der Information Bottleneck Theory und des Gradientenflusses in CNNs.
- Serverseitige Verarbeitung: Hochleistungs GPU analysieren archiviertes Videomaterial, bei dem Echtzeit-Latenz weniger kritisch ist.
Wann man YOLO26 wählen sollte
YOLO26 ist die empfohlene Wahl für Produktionsumgebungen und Edge-Computing.
- Embedded-Systeme: Dank einer um bis zu 43 % schnelleren CPU eignet es sich ideal für Raspberry Pi- oder NVIDIA in der Robotik.
- Echtzeit-Analysen: Das NMS Design gewährleistet eine deterministische Latenz, die für autonome Fahr- und Sicherheitssysteme von entscheidender Bedeutung ist.
- Multimodale Anwendungen: Mit nativer Unterstützung für Instanzsegmentierung und Pose dient es als vielseitige Grundlage für komplexe Pipelines wie die Analyse des menschlichen Verhaltens im Einzelhandel oder im Sport.
Fazit
Während YOLOv9 mit PGI bahnbrechende theoretische Konzepte YOLOv9 , verfeinert YOLO26 diese Erkenntnisse zu einem pragmatischen, leistungsstarken Paket. Seine End-to-End-Architektur, die Beseitigung von Engpässen bei der Nachbearbeitung und die Integration in das robuste Ultralytics machen es zur ersten Wahl für Entwickler, die die nächste Generation von KI-Anwendungen entwickeln.
Andere Modelle entdecken
Wenn Sie daran interessiert sind, andere Optionen zu erkunden, sollten Sie sich YOLO11, den Vorgänger von YOLO26, oder YOLOv10, der Pionierarbeit im Bereich des NMS Ansatzes geleistet hat.