Zum Inhalt springen

YOLO26 vs. YOLOv9: Die nächste Evolutionsstufe in der Echtzeit-Objekterkennung

Die Entwicklung von Architekturen zur Objekterkennung ist geprägt von einem ständigen Streben nach Geschwindigkeit, Genauigkeit und Effizienz. Vergleich zwischen YOLO26 und YOLOv9 wird diese rasante Entwicklung deutlich. Während YOLOv9 mit programmierbaren Gradienten die Grenzen der Informationsspeicherung YOLOv9 , definiert das neuere YOLO26 die Landschaft mit einer durchgängigen, NMS Architektur neu, die speziell für Edge-Leistung und massive CPU optimiert ist.

Modellübersicht

YOLO26

YOLO26 repräsentiert den Stand der Technik im Bereich der Bildverarbeitungs-KI Anfang 2026. Entwickelt von Ultralyticsentwickelt, verfügt es über ein natives End-to-End-Design, das Non-Maximum Suppression (NMS) überflüssig macht und die Bereitstellungspipelines optimiert. Durch die Entfernung von Distribution Focal Loss (DFL) und die Integration des neuartigen MuSGD-Optimierers– einer Mischung aus SGD Muon, inspiriert durch LLM-Training – erreicht YOLO26 CPU um bis zu 43 % schnellere CPU bei gleichbleibender Spitzenpräzision.

  • Autoren: Glenn Jocher, Jing Qiu
  • Organisation:Ultralytics
  • Datum: 14. Januar 2026
  • Hauptmerkmal: NMS End-to-End-Erkennung, MuSGD-Optimierer, ProgLoss + STAL
  • GitHub:Ultralytics Repository

Erfahren Sie mehr über YOLO26

YOLOv9

Veröffentlicht Anfang 2024, YOLOv9 das Konzept der programmierbaren Gradienteninformation (PGI) und die GELAN-Architektur ein. Diese Innovationen behoben das Problem des „Informationsengpasses” in tiefen Netzwerken und stellten sicher, dass wichtige Daten während des Feedforward-Prozesses nicht verloren gingen. Es bleibt ein leistungsstarkes Modell, insbesondere für Forschungsanwendungen, die eine hohe Parametereffizienz erfordern.

  • Autoren: Chien-Yao Wang, Hong-Yuan Mark Liao
  • Organisation: Institute of Information Science, Academia Sinica
  • Datum: 21. Februar 2024
  • Hauptmerkmal: Programmierbare Gradienteninformationen (PGI), GELAN-Architektur
  • Arxiv:YOLOv9
  • GitHub:YOLOv9 Repository

Erfahren Sie mehr über YOLOv9

Technischer Architekturvergleich

Die architektonische Divergenz zwischen diesen beiden Modellen bedeutet eine Verlagerung von der theoretischen Optimierung des Informationsflusses hin zur praktischen Effizienz der Bereitstellung.

YOLO26: Effizienz und Edge-First-Design

YOLO26 konzentriert sich auf die Reduzierung des Rechenaufwands für die Nachbearbeitung und Verlustberechnung.

  • End-to-End NMS: Im Gegensatz zu herkömmlichen Detektoren, die redundante Begrenzungsrahmen ausgeben, für die NMS erforderlich ist, sagt YOLO26 direkt den genauen Satz von Objekten voraus. Dies reduziert die Latenzschwankungen und vereinfacht den Export in Formate wie ONNX TensorRT, da komplexe benutzerdefinierte NMS nicht mehr erforderlich sind.
  • ProgLoss + STAL: Die Einführung von Progressive Loss und Soft-Target Anchor Labeling verbessert die Erkennung kleiner Objekte erheblich, was eine wichtige Voraussetzung für Drohnenbilder und Roboterinspektionen ist.
  • MuSGD Optimizer: Dieser hybride Optimierer bringt Innovationen aus dem Training großer Sprachmodelle in die Computer Vision ein und stabilisiert die Trainingsdynamik, wodurch eine schnellere Konvergenz mit weniger Hyperparameter-Anpassungen ermöglicht wird.

YOLOv9: Informationsspeicherung

Die Architektur YOLOv9 basiert auf der Lösung des Problems der Informationsverluste in tiefen Netzwerken.

  • PGI (Programmable Gradient Information): Ein zusätzlicher Überwachungszweig generiert zuverlässige Gradienten für die Aktualisierung der Netzwerkgewichte und stellt so sicher, dass tiefe Schichten semantische Informationen beibehalten.
  • GELAN (Generalized Efficient Layer Aggregation Network): Dieses Backbone optimiert die Parameternutzung, sodass YOLOv9 mit weniger Parametern als einige seiner Vorgänger eine hohe Genauigkeit YOLOv9 , allerdings oft auf Kosten einer höheren Rechenkomplexität (FLOPs) im Vergleich zum optimierten YOLO26.

Vereinfachte Bereitstellung

Die Entfernung von NMS YOLO26 ist ein entscheidender Faktor für den Einsatz am Rand. In älteren Modellen wie YOLOv9 läuft der NMS auf der CPU wenn das Modell auf einer GPU läuft, was zu einem Engpass führt. Die Ausgabe von YOLO26 ist sofort einsatzbereit, wodurch es auf Raspberry Pi und Mobilgeräten deutlich schneller ist.

Leistungsmetriken

Die folgende Tabelle vergleicht die Modelle anhand von Standard-Benchmarks. Beachten Sie den erheblichen Geschwindigkeitsvorteil von YOLO26 auf CPU , der direkt auf die Optimierungen seiner Architektur zurückzuführen ist.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Vorteile Ultralytics

Während YOLOv9 eine solide theoretische Grundlage YOLOv9 , hat die Verwendung von YOLO26 innerhalb des Ultralytics für Entwickler und Unternehmen deutliche Vorteile.

Unübertroffene Benutzerfreundlichkeit

Die Ultralytics Python verwandelt komplexe Trainingsabläufe in wenige Zeilen Code. Diese „Zero-to-Hero”-Erfahrung steht im Gegensatz zu den forschungsorientierten Strukturen vieler anderer Repositorien.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer enabled by default
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

Vielseitigkeit über verschiedene Aufgaben hinweg

Im Gegensatz zu YOLOv9, das sich in erster Linie auf die Erkennung konzentriert, unterstützen das Ultralytics und YOLO26 von Haus aus eine breitere Palette von Computer-Vision-Aufgaben. Dadurch können Sie eine einzige einheitliche API für folgende Zwecke verwenden:

Training und Gedächtniseffizienz

Ultralytics sind auf Ressourceneffizienz ausgelegt. YOLO26 benötigt während des Trainings in der Regel weniger GPU (VRAM) als transformatorlastige Alternativen. Diese Effizienz ermöglicht:

Anwendungen in der realen Welt

Die Wahl des richtigen Modells hängt von Ihren spezifischen Einsatzbedingungen ab.

Edge Computing und IoT

YOLO26 ist der unangefochtene Champion für Edge-Geräte. Dank seiner um 43 % schnelleren CPU eignet es sich für die Echtzeitüberwachung auf Geräten wie dem Raspberry Pi oder NVIDIA Nano, ohne dass eine aufwendige Quantisierung erforderlich ist. So profitiert beispielsweise ein intelligentes Parksystem, das auf lokaler Hardware läuft, enorm von dem NMS Design, das Latenzspitzen reduziert.

Inspektion in großer Höhe

Bei der landwirtschaftlichen Überwachung oder Infrastrukturinspektion mit Drohnen glänzt YOLO26 dank der Funktionen ProgLoss + STAL. Diese sind speziell darauf abgestimmt, kleine Objekte und schwierige Seitenverhältnisse besser als frühere Generationen zu verarbeiten, sodass Risse in Rohrleitungen oder Schädlinge auf Nutzpflanzen mit höherer Genauigkeit erkannt werden.

Wissenschaftliche Forschung

YOLOv9 bleibt ein starker Kandidat für die akademische Forschung, insbesondere für Studien, die sich mit Gradientenfluss und Netzwerkarchitekturtheorie befassen. Sein PGI-Konzept bietet einen faszinierenden Ansatz, um zu untersuchen, wie neuronale Netze die Informationstiefe bewahren.

Fazit

Beide Architekturen stellen bedeutende Meilensteine in der Computer Vision dar. YOLOv9 die Bedeutung von Gradienteninformationen in tiefen Netzwerken YOLOv9 . YOLO26 setzt diese Erkenntnisse jedoch in ein produktionsreifes Kraftpaket um. Mit seinem durchgängigen NMS Design, CPU überragenden CPU und seiner nahtlosen Integration in die Ultralytics bietet YOLO26 die beste Balance zwischen Geschwindigkeit, Genauigkeit und Benutzerfreundlichkeit für moderne KI-Anwendungen.

Entwicklern, die auf dem neuesten Stand bleiben möchten, empfehlen wir die Migration zu YOLO26, um die neuesten Fortschritte in Bezug auf Optimierer-Stabilität und Edge-Leistung zu nutzen.

Weiterführende Informationen

Wenn Sie sich für andere Hochleistungsmodelle der Ultralytics interessieren, sehen Sie sich YOLO11 für allgemeine Aufgaben oder RT-DETR für die transformatorbasierte Echtzeit-Erkennung.


Kommentare