Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11 vs. YOLOX#

Der Bereich Computer Vision hat in den letzten Jahren rasante Fortschritte gemacht, wobei Echtzeit-Objekterkennungsmodelle immer ausgefeilter werden. Bei der Wahl einer Architektur für eine Produktionsumgebung oder für die akademische Forschung wägen Entwickler oft die Vor- und Nachteile zwischen historischen Meilensteinen und modernsten Innovationen ab. Dieser umfassende Vergleich beleuchtet die Unterschiede zwischen Ultralytics YOLO11 und YOLOX von Megvii und bietet tiefe Einblicke in ihre Architekturen, Leistungskennzahlen und idealen Einsatzszenarien.

Link to this sectionArchitektonischer Überblick#

Beide Modelle stellen bedeutende Sprünge in der Objekterkennung dar, basieren jedoch auf unterschiedlichen Design-Philosophien und zielen auf verschiedene Entwicklererfahrungen ab.

Link to this sectionYOLO11: Die vielseitige Multi-Task-Engine#

Das im September 2024 von Glenn Jocher und Jing Qiu bei Ultralytics veröffentlichte YOLO11 wurde als einheitliches Framework konzipiert, das hohe Genauigkeit mit extremer Effizienz verbindet.

YOLO11 geht über Standard-Bounding-Boxes hinaus und unterstützt nativ Instanzsegmentierung, Bildklassifizierung, Pose-Schätzung sowie Oriented Bounding Box (OBB) Erkennung. Seine verfeinerte Architektur optimiert die Merkmalsextraktion, um eine bessere Merkmalsspeicherung über komplexe räumliche Hierarchien hinweg sicherzustellen.

Erfahre mehr über YOLO11

Link to this sectionYOLOX: Der Anchor-Free-Pionier#

Das von Forschern bei Megvii entwickelte YOLOX erlangte 2021 große Aufmerksamkeit, da es mit einem rein anchor-free Ansatz die Lücke zwischen Forschung und industriellen Anwendungen schloss.

YOLOX führte einen entkoppelten Kopf (decoupled head) und ein anchor-free Paradigma ein, was die Anzahl der Designparameter erheblich reduzierte und zum Zeitpunkt der Veröffentlichung die Leistung bei akademischen Benchmarks verbesserte.

Erfahre mehr über YOLOX

Wusstest du schon?

Das von YOLOX populär gemachte anchor-free Design inspirierte viele nachfolgende Architekturen. Ultralytics hat diese anchor-free Konzepte in späteren Iterationen wie YOLOv8 und YOLO11 integriert und stark verfeinert, um überlegene Genauigkeit und Flexibilität bei der Bereitstellung zu bieten.

Link to this sectionLeistung und Metriken#

Bei der Bewertung von Erkennungsmodellen ist die Untersuchung des Gleichgewichts zwischen Parametern, Rechenaufwand (FLOPs) und der mittleren durchschnittlichen Genauigkeit (mAP) entscheidend für die Modellbereitstellung in der Praxis.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02,59.421,5
YOLO11m64051.5183.24.720,168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356,9194.9
YOLOXnano41625,8--0,911,08
YOLOXtiny41632,8--5,066,45
YOLOXs64040.5-2,569,026,8
YOLOXm64046,9-5,4325.373,8
YOLOXl64049.7-9,0454,2155,6
YOLOXx64051,1-16,199,1281,9

Wie in der Tabelle zu sehen ist, übertrifft YOLO11x das YOLOXx in der absoluten Genauigkeit (54,7 mAP gegenüber 51,1 mAP) deutlich, während es nur etwa halb so viele Parameter benötigt (56,9M gegenüber 99,1M). Diese Effizienz führt zu geringeren Speicheranforderungen während des Trainings und der Inferenz, was einen massiven Vorteil für Produktionsumgebungen darstellt.

Link to this sectionÖkosystem und Entwicklererfahrung#

Link to this sectionDer Ultralytics-Vorteil#

Einer der gravierendsten Unterschiede zwischen YOLO11 und YOLOX liegt in der Benutzerfreundlichkeit. YOLOX fungiert primär als Forschungs-Codebasis und erfordert komplexe Umgebungskonfigurationen, manuelle Kompilierung von C++ Operatoren und ausführliche Befehlszeilenargumente, um das Training mit benutzerdefinierten Datensätzen zu starten.

Im krassen Gegensatz dazu ist YOLO11 vollständig in das Ultralytics Python-Paket integriert und bietet einen optimierten "Zero-to-Hero"-Workflow. Die Ultralytics Plattform bietet umfassende Tools für Datenannotation, Experiment-Tracking und Cloud-basiertes Training, wodurch der Boilerplate-Code wegfällt, sodass sich Entwickler ganz auf die Modellleistung konzentrieren können.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model effortlessly using the Ultralytics API
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")

Darüber hinaus erfordert der Export eines Ultralytics-Modells in Formate wie TensorRT, CoreML oder OpenVINO nur einen einzigen Befehl, während ältere Repositories oft komplexe Tools von Drittanbietern oder manuelle Graph-Anpassungen erfordern.

Link to this sectionAnwendungsfälle aus der Praxis#

Link to this sectionWann man YOLOX in Betracht ziehen sollte#

YOLOX bleibt eine gültige Option für spezialisierte, ältere Bereitstellungen, bei denen Entwickler bereits stark angepasste C++ Inferenz-Pipelines um die spezifischen Tensor-Ausgaben des entkoppelten Kopfes herum aufgebaut haben. Zudem werden Forscher, die Vergleichsstudien mit dem Stand der Technik von 2021 durchführen, YOLOX weiterhin als Benchmark-Datensatz Basis nutzen.

Link to this sectionWo YOLO11 glänzt#

Für nahezu alle modernen Produktionsszenarien bietet YOLO11 eine weitaus bessere Erfahrung:

  • Smart Cities und Einzelhandel: Aufgrund seines außergewöhnlichen Verhältnisses von Geschwindigkeit zu Genauigkeit bewältigt YOLO11 überfüllte Szenen mühelos und unterstützt automatisierte Einzelhandelsanalysen sowie Verkehrsmanagement-Systeme, ohne riesige GPU-Cluster zu benötigen.
  • Edge Computing: The high memory efficiency and robust export options make YOLO11 perfect for edge AI deployments on devices like Raspberry Pi or NVIDIA Jetson platforms.
  • Komplexe Pipelines: Wenn ein Projekt die Kombination von Objekterkennung mit Pose-Keypoints (z. B. Sportanalytik) oder präziser Instanzsegmentierung (z. B. medizinische Bildgebung) erfordert, erledigt YOLO11 alle Aufgaben nativ über eine einheitliche API.

Link to this sectionAnwendungsfälle und Empfehlungen#

Die Entscheidung zwischen YOLO11 und YOLOX hängt von deinen spezifischen Projektanforderungen, Bereitstellungseinschränkungen und Ökosystempräferenzen ab.

Link to this sectionWann du YOLO11 wählen solltest#

YOLO11 ist eine starke Wahl für:

  • Edge-Deployment in der Produktion: Kommerzielle Anwendungen auf Geräten wie Raspberry Pi oder NVIDIA Jetson, bei denen Zuverlässigkeit und aktive Wartung von größter Bedeutung sind.
  • Multitasking-Vision-Anwendungen: Projekte, die Erkennung, Segmentierung, Pose Estimation und OBB innerhalb eines einzigen einheitlichen Frameworks erfordern.
  • Schnelles Prototyping und Deployment: Teams, die mithilfe der optimierten Ultralytics Python API schnell von der Datenerfassung bis zur Produktion gelangen müssen.

Link to this sectionWann man sich für YOLOX entscheiden sollte#

YOLOX wird empfohlen für:

  • Forschung an ankerfreier Detektion: Akademische Forschung, die die saubere, ankerfreie Architektur von YOLOX als Basislinie verwendet, um mit neuen Detektions-Heads oder Verlustfunktionen zu experimentieren.
  • Ultraleichte Edge-Geräte: Bereitstellung auf Mikrocontrollern oder älterer mobiler Hardware, wo der extrem kleine Platzbedarf der YOLOX-Nano-Variante (0,91 Mio. Parameter) entscheidend ist.
  • SimOTA Label-Zuweisungsstudien: Forschungsprojekte, die transportbasierte Strategien zur Label-Zuweisung und deren Auswirkungen auf die Trainingskonvergenz untersuchen.

Link to this sectionWann du Ultralytics wählen solltest (YOLO26)#

Für die meisten neuen Projekte bietet Ultralytics YOLO26 die beste Kombination aus Leistung und Entwicklererfahrung:

  • NMS-freies Edge-Deployment: Anwendungen, die eine konsistente Inferenz mit niedriger Latenz ohne die Komplexität der Non-Maximum Suppression-Nachverarbeitung erfordern.
  • Umgebungen nur mit CPU: Geräte ohne dedizierte GPU-Beschleunigung, bei denen die bis zu 43 % schnellere CPU-Inferenz von YOLO26 einen entscheidenden Vorteil bietet.
  • Erkennung kleiner Objekte: Anspruchsvolle Szenarien wie Luftaufnahmen von Drohnen oder die Analyse von IoT-Sensoren, bei denen ProgLoss und STAL die Genauigkeit bei winzigen Objekten deutlich steigern.

Link to this sectionBlick in die Zukunft: Die Power von YOLO26#

Obwohl YOLO11 eine hervorragende Wahl darstellt, entwickelt sich die KI-Landschaft ständig weiter. Für Teams, die das absolute Maximum an Effizienz und Stabilität suchen, ist YOLO26 (veröffentlicht im Januar 2026) die ultimative Empfehlung für neue Computer Vision-Projekte.

YOLO26 stellt einen massiven Fortschritt dar, indem es ein End-to-End NMS-freies Design implementiert. Durch den Wegfall der Non-Maximum Suppression (NMS) Nachverarbeitung werden Latenzschwankungen vollständig beseitigt, was die Bereitstellungslogik drastisch vereinfacht – ein Konzept, das erstmals in YOLOv10 eingeführt wurde.

Des Weiteren bietet YOLO26 eine DFL-Entfernung (Distribution Focal Loss), die die Architektur optimiert, um eine bis zu 43% schnellere CPU-Inferenz zu erreichen, was es zum unangefochtenen Champion für Geräte mit geringer Leistung und Edge-Geräte macht. Die Trainingsstabilität wird zudem durch den MuSGD-Optimizer optimiert – ein von LLMs inspirierter Hybrid aus SGD und Muon, der die Konvergenz beschleunigt. Kombiniert mit fortschrittlichen Verlustfunktionen wie ProgLoss + STAL, eignet sich YOLO26 hervorragend zur Erkennung kleiner Objekte in anspruchsvollen Umgebungen wie Drohnenbildern und IoT-Edge-Sensoren.

Weitere Erkundungen

Möchtest du dein Wissen über Objekterkennungsarchitekturen erweitern? Entdecke die Open-Vocabulary-Fähigkeiten von YOLO-World oder tauche ein in das Transformer-basierte RT-DETR Modell, das im Ultralytics-Ökosystem dokumentiert ist.

Zusammenfassend lässt sich sagen, dass YOLOX zwar 2021 wichtige architektonische Konzepte einführte, aber das umfassende Toolset, die Speichereffizienz und die erstklassige Leistung von YOLO11 – und insbesondere die revolutionäre Architektur von YOLO26 – das Ultralytics-Ökosystem zur klaren Wahl für Forscher und Unternehmensentwickler von heute machen.

Kommentare