Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX vs. YOLO11#

Die Entwicklung der Computer Vision wurde stark durch das Streben nach Echtzeit-Objekterkennungs-Frameworks vorangetrieben, die eine hohe Genauigkeit mit Inferenzgeschwindigkeit in Einklang bringen. Zu den bemerkenswertesten Meilensteinen auf diesem Weg gehören YOLOX und Ultralytics YOLO11. Während beide Modelle bedeutende Beiträge zu diesem Bereich geleistet haben, unterscheiden sich ihre zugrunde liegenden Architekturen, Designphilosophien und Entwickler-Ökosysteme grundlegend.

Dieser umfassende technische Vergleich untersucht ihre Architekturen, Leistungsmetriken, Trainingsmethoden und idealen Einsatzszenarien, um dir bei der fundierten Entscheidung für dein nächstes Projekt im Bereich der künstlichen Intelligenz zu helfen.

Link to this sectionYOLOX im Überblick#

YOLOX wurde am 18. Juli 2021 von den Forschern Zheng Ge, Songtao Liu, Feng Wang, Zeming Li und Jian Sun bei Megvii vorgestellt und stellte eine bedeutende Veränderung in der YOLO-Serie dar. Es schlug erfolgreich die Brücke zwischen akademischer Forschung und industrieller Anwendung durch die Einführung eines ankerfreien Designs.

Weitere technische Hintergründe findest du im ursprünglichen YOLOX Arxiv paper.

Link to this sectionWichtige architektonische Merkmale#

YOLOX verabschiedete sich von der traditionellen ankerbasierten Erkennung durch die Einführung eines entkoppelten Heads und eines ankerfreien Mechanismus. Dieses Design reduzierte die Anzahl der Designparameter und verbesserte die Leistung des Modells bei verschiedenen Benchmarks. Zusätzlich wurden fortschrittliche Strategien zur Label-Zuweisung wie SimOTA eingeführt, um den Trainingsprozess zu beschleunigen und die Konvergenz zu verbessern.

Während YOLOX für seine Zeit eine exzellente Genauigkeit bietet, konzentriert es sich primär auf die Objekterkennung mittels BBox und bietet keine native Unterstützung für andere komplexe Vision-Aufgaben von Haus aus.

Erfahre mehr über YOLOX

Ankerfreies Design

Durch den Wegfall vordefinierter Ankerboxen reduzierte YOLOX drastisch die heuristische Optimierung, die für verschiedene Datensätze erforderlich war, was es zu einer starken Grundlage für die Forschung an ankerfreien Methoden machte.

Link to this sectionUltralytics YOLO11 Überblick#

YOLO11 wurde am 27. September 2024 von Glenn Jocher und Jing Qiu bei Ultralytics veröffentlicht und ist ein hochmodernes Modell, das Vielseitigkeit und Benutzerfreundlichkeit in der Computer Vision neu definiert. Basierend auf jahrelanger Grundlagenforschung bietet es eine hochgradig verfeinerte, produktionsreife Lösung, die sich bei einer Vielzahl von Aufgaben auszeichnet.

Link to this sectionDer Ultralytics-Vorteil#

YOLO11 ist nicht nur ein Objektdetektor; es ist ein einheitliches Framework, das instance segmentation, image classification, pose estimation und die Erkennung mittels oriented bounding box (OBB) unterstützt. Es verfügt über eine hocheffiziente Architektur, die ein nahtloses Gleichgewicht zwischen Geschwindigkeit, Parameteranzahl und Genauigkeit priorisiert.

Darüber hinaus ist YOLO11 vollständig in die Ultralytics Platform integriert, die ein optimiertes Ökosystem für Datenannotation, Modelltraining und Bereitstellung bietet.

Erfahre mehr über YOLO11

Link to this sectionVergleich von Leistung und Metriken#

Beim Vergleich dieser Modelle wird das Gleichgewicht der Leistung deutlich. YOLO11 erzielt in den meisten Größenkategorien eine höhere mean Average Precision (mAP) bei deutlich weniger Parametern und FLOPs im Vergleich zu seinen YOLOX-Gegenstücken.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOXnano41625,8--0,911,08
YOLOXtiny41632,8--5,066,45
YOLOXs64040.5-2,569,026,8
YOLOXm64046,9-5,4325.373,8
YOLOXl64049.7-9,0454,2155,6
YOLOXx64051,1-16,199,1281,9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02,59.421,5
YOLO11m64051.5183.24.720,168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356,9194.9

Wie gezeigt, übertreffen YOLO11-Modelle YOLOX in der Genauigkeit konsequent und behalten dabei einen schlankeren Parameter-Footprint bei. So erreicht YOLO11m eine 51.5 mAP mit nur 20.1M Parametern, während YOLOXx eine ähnliche 51.1 mAP erzielt, aber massive 99.1M Parameter benötigt. Diese Speichereffizienz während des Trainings und der Inferenz macht YOLO11 sehr geeignet für den Einsatz auf Edge-KI-Geräten, da es die hohen CUDA-Speicheranforderungen vermeidet, die für ältere oder auf Transformer basierende Modelle wie RT-DETR typisch sind.

Effizientes Training

Ultralytics-Modelle benötigen während des Trainings deutlich weniger GPU-Speicher im Vergleich zu YOLOX und auf Transformern basierenden Architekturen, was es Forschern ermöglicht, leistungsstarke Modelle auf Standard-Consumer-Hardware zu trainieren.

Link to this sectionÖkosystem und Benutzerfreundlichkeit#

Einer der auffälligsten Unterschiede zwischen den beiden Frameworks ist die Entwicklererfahrung.

YOLOX erfordert oft das Klonen von Repositories, das Einrichten komplexer Umgebungen und das Ausführen ausführlicher Befehlszeilenargumente, um Modelle zu trainieren und in Formate wie ONNX oder TensorRT zu exportieren.

Im krassen Gegensatz dazu bietet Ultralytics YOLO11 eine unglaublich einfache Python API und CLI. Die Ultralytics-Bibliothek handhabt data augmentation, hyperparameter tuning und den Export automatisch.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model effortlessly on custom data
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to TensorRT for optimized deployment
model.export(format="engine")

Dieses gut gepflegte Ökosystem wird durch eine umfangreiche documentation und eine nahtlose Integration mit Tools wie Weights & Biases für experiment tracking unterstützt.

Link to this sectionIdeale Anwendungsfälle#

Die Entscheidung zwischen diesen Modellen hängt oft von den Besonderheiten der Bereitstellungsumgebung ab.

Link to this sectionWann du YOLOX verwenden solltest#

  • Legacy-Systeme: Wenn du über eine etablierte Pipeline verfügst, die explizit auf dem MegEngine-Framework oder auf Paradigmen der Objekterkennung von Anfang 2021 aufbaut.
  • Akademische Baselines: Bei der Durchführung von Forschung, die direkte Benchmarks gegen grundlegende ankerfreie Architekturen aus der Ära von 2021 erfordert.

Link to this sectionWann du YOLO11 verwenden solltest#

  • Produktionsbereitstellungen: Für kommerzielle Anwendungen im Bereich smart retail oder security alarm systems, bei denen robuster, gepflegter Code und hohe Genauigkeit unerlässlich sind.
  • Multi-Task-Pipelines: Wenn ein Projekt das Verfolgen von Objekten, das Schätzen menschlicher Posen und das Segmentieren von Instanzen mit einem einzigen, einheitlichen Framework erfordert.
  • Ressourcenbeschränkte Edge-Geräte: Aufgrund seiner geringen Parameteranzahl und seines hohen Durchsatzes ist YOLO11 ideal für die Bereitstellung auf Raspberry Pi oder mobilen Edge-Knoten via CoreML und NCNN.

Link to this sectionEin Blick voraus: Der YOLO26-Vorteil#

Während YOLO11 einen massiven Sprung gegenüber YOLOX darstellt, schreitet der Bereich der Computer Vision schnell voran. Entwicklern, die heute neue Projekte starten, wird Ultralytics YOLO26 uneingeschränkt empfohlen.

YOLO26 wurde im Januar 2026 veröffentlicht und nutzt die architektonische Brillanz von YOLO11, führt jedoch mehrere bahnbrechende Funktionen ein:

  • End-to-End NMS-freies Design: YOLO26 eliminiert die Non-Maximum Suppression (NMS)-Nachbearbeitung und streamt die Inferenz nativ für schnellere, einfachere Bereitstellungspipelines (ein Konzept, das erstmals in YOLOv10 untersucht wurde).
  • Bis zu 43% schnellere CPU-Inferenz: Durch den Wegfall von Distribution Focal Loss (DFL) ist YOLO26 auf CPUs und Edge-Geräten mit geringem Stromverbrauch weitaus effizienter.
  • MuSGD-Optimierer: Inspiriert von Innovationen beim LLM-Training von Moonshot AI, sorgt der MuSGD-Optimierer für hochstabile Trainingsläufe und eine schnelle Konvergenz.
  • Fortschrittliche Verlustfunktionen: Durch den Einsatz von ProgLoss + STAL erzielt YOLO26 bemerkenswerte Verbesserungen bei der Erkennung kleiner Objekte, was für drone imagery und autonome Robotik entscheidend ist.

Für die überwiegende Mehrheit der modernen Computer-Vision-Aufgaben bietet das Upgrade deiner Pipeline auf YOLO26 das absolut beste Gleichgewicht zwischen Geschwindigkeit, Genauigkeit und einfacher Bereitstellung.

Kommentare