YOLO11 . YOLO26: Die Entwicklung der Echtzeit-Objekterkennung
Die Landschaft der Computervision verändert sich ständig, wobei jede neue Modelliteration die Grenzen von Geschwindigkeit, Genauigkeit und Benutzerfreundlichkeit erweitert. Zwei wichtige Meilensteine auf diesem Weg sind YOLO11 und das bahnbrechende YOLO26. Während YOLO11 Ende 2024 einen robusten Standard für den Einsatz in Unternehmen YOLO11 , stellt YOLO26 mit seiner nativen End-to-End-Architektur und seinem CPU Design einen Paradigmenwechsel dar.
Dieser Leitfaden enthält einen umfassenden technischen Vergleich, der Entwicklern, Forschern und Ingenieuren dabei hilft, das richtige Tool für ihre spezifischen Computer-Vision-Anwendungen auszuwählen.
Zusammenfassung: Wesentliche Unterschiede
Obwohl beide Modelle auf den Grundprinzipien der YOLO -Familie YOLO You Only Look Once) basieren, unterscheiden sie sich erheblich in ihrer Architekturphilosophie.
- YOLO11: Entwickelt für Vielseitigkeit und Ökosystemintegration. Es basiert auf traditionellen Nachbearbeitungsmethoden wie Non-Maximum Suppression (NMS), bietet jedoch ein äußerst stabiles und gut unterstütztes Framework für eine Vielzahl von Aufgaben.
- YOLO26: Entwickelt für den Einsatz am Netzwerkrand und zukunftssicher. Es verfügt über ein natives End-to-End-Design NMS, wodurch komplexe Nachbearbeitungsschritte entfallen. Außerdem verfügt es über den innovativen MuSGD-Optimierer und wurde speziell für CPU entwickelt, wodurch es auf Geräten wie dem Raspberry Pi bis zu 43 % schneller ist.
Detaillierte Leistungsanalyse
Die Leistungsunterschiede zwischen den Generationen werden oft in Millisekunden und Prozentpunkten der mittleren durchschnittlichen Genauigkeit (mAP) gemessen. Die folgende Tabelle zeigt die Verbesserungen in Bezug auf Geschwindigkeit und Genauigkeit. Beachten Sie die deutliche Reduzierung der CPU für YOLO26, eine wichtige Kennzahl für Edge-KI-Implementierungen.
| Modell | Größe (Pixel) | mAPval 50-95 | Geschwindigkeit CPU ONNX (ms) | Geschwindigkeit T4 TensorRT10 (ms) | Parameter (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
YOLO11: Der vielseitige Standard
YOLO11
Autoren: Glenn Jocher und Jing Qiu
Organisation: Ultralytics
Datum: 27.09.2024
GitHub: Ultralytics
YOLO11 eine wesentliche Weiterentwicklung der YOLO YOLO11 , deren Schwerpunkt auf der Effizienz der Merkmalsextraktion lag. Es verbesserte YOLOv8 durch die Optimierung des C3k2-Blocks und die Einführung von SPPF-Verbesserungen.
Stärken:
- Bewährte Robustheit: Weit verbreitet in der Industrie, mit umfangreichen Community-Plugins und Support.
- GPU : Hocheffizient auf NVIDIA (T4, A100) unter Verwendung von TensorRT, wodurch es sich hervorragend für cloudbasierte Inferenz eignet.
- Vielseitigkeit der Aufgaben: Starke Leistung bei Erkennung, Segmentierung und Posenschätzung.
Schwächen:
- NMS : Erfordert eine Nachbearbeitung mit Nicht-Maximalunterdrückung, was zu Latenzschwankungen führen und die Bereitstellungspipelines verkomplizieren kann.
- Höhere FLOPs: Etwas rechenintensiver als die neuesten Architekturen.
YOLO26: Der Edge-First-Innovator
YOLO26
Autoren: Glenn Jocher und Jing Qiu
Organisation: Ultralytics
Datum: 14.01.2026
GitHub: Ultralytics
YOLO26 ist eine zukunftsweisende Architektur, die Effizienz auf handelsüblicher Hardware in den Vordergrund stellt. Durch den Wegfall der Notwendigkeit für NMS die Optimierung für CPU ermöglicht sie Echtzeitleistung auf Geräten, die bisher als zu langsam für moderne KI galten.
Wichtige Innovationen:
- End-to-End NMS: Durch die direkte Vorhersage von Eins-zu-Eins-Übereinstimmungen beseitigt YOLO26 den NMS . Dies vereinfacht den Export nach ONNX oder CoreML .
- DFL-Entfernung: Durch die Entfernung des Distribution Focal Loss wird der Ausgabekopf optimiert, wodurch die Kompatibilität mit Edge-Geräten mit geringem Stromverbrauch verbessert wird.
- MuSGD-Optimierer: Inspiriert von den Trainingstechniken großer Sprachmodelle (LLM) (insbesondere Kimi K2 von Moonshot AI) kombiniert dieser hybride Optimierer SGD mit Muon für schnellere Konvergenz und Stabilität.
- ProgLoss + STAL: Neue Verlustfunktionen verbessern die Erkennung kleiner Objekte, eine wichtige Voraussetzung für Luftbildaufnahmen und Robotik.
Architektonischer Deep Dive
Der Wechsel von YOLO11 YOLO26 betrifft nicht nur die Anzahl der Parameter, sondern stellt eine grundlegende Veränderung in der Art und Weise dar, wie das Modell lernt und Vorhersagen trifft.
Trainingsmethoden und Effizienz
Eines der herausragenden Merkmale der Ultralytics ist die Trainingseffizienz. Beide Modelle profitieren von der integrierten Ultralytics , die eine nahtlose Datenverwaltung und Cloud-Training ermöglicht.
YOLO26 führt jedoch den MuSGD-Optimierer ein, der Momentum-Updates anpasst, um die komplexen Verlustlandschaften von Bildverarbeitungsmodellen effektiver zu verarbeiten als AdamW SGD. Dies führt zu Modellen, die schneller konvergieren, wodurch wertvolle GPU eingespart und der CO2-Fußabdruck des Trainings reduziert wird.
Darüber hinaus nutzt YOLO26 verbesserte aufgabenspezifische Verluste:
- Segmentierung: Verbesserter semantischer Segmentierungsverlust und mehrskalige Proto-Module.
- Pose: Residual Log-Likelihood Estimation (RLE) für eine genauere Lokalisierung von Schlüsselpunkten.
- OBB: Spezialisierter Winkelverlust zur Auflösung von Randdiskontinuitäten bei Oriented Bounding Box -Aufgaben.
Speicheranforderungen
Ultralytics YOLO sind bekannt für ihren geringen Speicherbedarf im Vergleich zu transformatorbasierten Architekturen wie RT-DETR oder SAM .
Speicheroptimierung
Sowohl YOLO11 YOLO26 sind für das Training auf handelsüblichen GPUs (z. B. NVIDIA 3060 oder 4070) ausgelegt. Im Gegensatz zu massiven Transformer-Modellen, die 24 GB+ VRAM benötigen, können effiziente YOLO oft mit geeigneten Batch-Größen auf Geräten mit nur 8 GB VRAM feinabgestimmt werden.
Anwendungsfälle in der Praxis
Die Wahl zwischen YOLO11 YOLO26 hängt oft von Ihrer Einsatzhardware und den spezifischen Anwendungsanforderungen ab.
Ideale Szenarien für YOLO11
- Cloud-API-Dienste: Wo leistungsstarke GPUs verfügbar sind und ein hoher Durchsatz (Stapelverarbeitung) wichtiger ist als die Latenz einzelner Bilder.
- Legacy-Integrationen: Systeme, die bereits auf NMS Pipelines aufbauen und bei denen eine Änderung der Nachverarbeitungslogik nicht möglich ist.
- Allgemeine Analysen: Heatmapping im Einzelhandel oder Kundenzählung, wobei GPU zum Einsatz kommen.
Ideale Szenarien für YOLO26
- IoT- und Edge-Geräte: Objektdetektion auf Raspberry Pi, NVIDIA Nano oder Mobiltelefonen. Die 43-prozentige CPU ist hier ein entscheidender Faktor.
- Robotik: Latenzschwankungen sind für Regelkreise fatal. Das NMS Design gewährleistet deterministische Inferenzzeiten, die für die autonome Navigation entscheidend sind.
- Luftbildvermessung: Die ProgLoss -Funktion verbessert die Erkennung kleiner Objekte erheblich, wodurch YOLO26 für die Analyse von Drohnenaufnahmen überlegen ist.
- Eingebettete Systeme: Geräte mit begrenzter Rechenleistung, die den Aufwand für das Sortieren Tausender Kandidatenboxen während NMS nicht bewältigen können.
Code-Implementierung
Beide Modelle zeichnen sich durch dieselbe Benutzerfreundlichkeit aus, die das Ultralytics auszeichnet. Der Wechsel von YOLO11 YOLO26 erfordert lediglich eine Änderung der Modellzeichenfolge.
from ultralytics import YOLO
# Load the latest YOLO26 model (NMS-free, CPU optimized)
model = YOLO("yolo26n.pt")
# Run inference on a local image
results = model("path/to/image.jpg")
# Process results
for result in results:
result.show() # Display to screen
result.save(filename="result.jpg") # Save to disk
Diese einheitliche API stellt sicher, dass Entwickler mit verschiedenen Architekturen experimentieren können, ohne ihre gesamte Codebasis neu schreiben zu müssen.
Fazit
Beide Architekturen zeigen, warum Ultralytics führend im Bereich Open-Source-Computervision Ultralytics . YOLO11 bietet eine ausgereifte, vielseitige und GPU Lösung, die sich perfekt für Unternehmensrechenzentren eignet. YOLO26 hingegen repräsentiert die Zukunft der Edge-KI und bietet CPU blitzschnelle CPU sowie eine vereinfachte End-to-End-Pipeline, die herkömmliche Engpässe beseitigt.
Für die meisten neuen Projekte – insbesondere solche, die Edge-Bereitstellung, mobile Apps oder Robotik umfassen – istYOLO26 aufgrund seines überlegenen Verhältnisses von Geschwindigkeit zu Genauigkeit und seines modernen Architekturdesigns die empfohlene Wahl.
Weitere Modelle zum Erkunden
- YOLOv10: Der Pionier des NMS Ansatzes in der YOLO .
- RT-DETR: Ein transformatorbasierter Detektor, der eine hohe Genauigkeit für Szenarien bietet, in denen Geschwindigkeit zweitrangig ist.
- YOLOv8: Ein äußerst zuverlässiger Klassiker, der aufgrund seiner umfangreichen Ressourcenbibliothek nach wie vor weit verbreitet ist.