Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX vs. PP-YOLOE+#

Bei der Entwicklung einer robusten Computer Vision-Pipeline ist die Auswahl des geeigneten Objekterkennungsmodells eine kritische Entscheidung. Die Landschaft der Echtzeit-Objektdetektoren ist hart umkämpft, wobei zahlreiche Architekturen darum ringen, die optimale Balance zwischen Inferenzgeschwindigkeit und Erkennungsgenauigkeit zu bieten. In diesem technischen Vergleich bewerten wir zwei prominente Modelle: YOLOX und PP-YOLOE+. Durch die Untersuchung ihrer architektonischen Designs, Trainingsmethoden und Leistungsmetriken möchten wir Entwicklern und Forschern die Erkenntnisse liefern, die sie benötigen, um das richtige Werkzeug für ihre Bereitstellungsumgebungen auszuwählen.

Link to this sectionArchitektonische Innovationen und Design#

Beide Modelle wurden entwickelt, um spezifische Schwachstellen früherer YOLO-Iterationen anzugehen, verfolgen jedoch grundlegend unterschiedliche Ansätze zur Lösung des Geschwindigkeits-Genauigkeits-Kompromisses.

Link to this sectionYOLOX: Die Brücke zwischen Forschung und Industrie#

YOLOX wurde von Zheng Ge, Songtao Liu, Feng Wang, Zeming Li und Jian Sun bei Megvii entwickelt und am 18. Juli 2021 veröffentlicht. Es markierte einen bedeutenden Wandel innerhalb der YOLO-Familie, da es vollständig auf ein anchor-free Design setzte. Du kannst die grundlegende Forschung in ihrem offiziellen Arxiv-Papier und den ursprünglichen Quellcode im YOLOX GitHub-Repository erkunden.

YOLOX integriert einen entkoppelten Kopf (decoupled head), der Klassifizierungs- und Regressionsaufgaben trennt, was die Konvergenzgeschwindigkeit während des Trainings erheblich verbessert. Zudem führte es fortschrittliche Label-Zuweisungsstrategien wie SimOTA ein, um positive Stichproben dynamisch zuzuweisen. Dies macht das Modell äußerst effizient, insbesondere in Edge AI-Umgebungen, in denen die Rechenressourcen stark begrenzt sind.

Erfahre mehr über YOLOX

Link to this sectionPP-YOLOE+: Hochleistungs-Industrieerkennung#

PP-YOLOE+ wurde am 2. April 2022 von den PaddlePaddle-Autoren bei Baidu eingeführt und stellt eine hochoptimierte Weiterentwicklung der PP-YOLO-Serie dar. Detailliert beschrieben in ihrer Arxiv-Publikation, ist PP-YOLOE+ tief in das Baidu-Ökosystem integriert und erfordert das PaddlePaddle-Framework. Die Konfigurationen des Modells findest du im PaddleDetection GitHub-Repository.

PP-YOLOE+ stützt sich auf ein leistungsstarkes CSPRepResNet-Backbone und nutzt einen Efficient Task-aligned Head (ET-head) zusammen mit Task Alignment Learning (TAL). Diese Architektur erzielt eine hervorragende mean Average Precision (mAP) auf dem COCO-Datensatz, was es zu einer beeindruckenden Wahl für die industrielle Fehlererkennung und serverseitige Hochleistungsverarbeitung macht, bei der Genauigkeit wichtiger ist als minimale Abhängigkeiten.

Erfahre mehr über PP-YOLOE+

Link to this sectionPerformance-Benchmarks#

Zu verstehen, wie diese Modelle über verschiedene Skalen hinweg abschneiden, ist für die Bereitstellung unerlässlich. Die folgende Tabelle zeigt wichtige Metriken, einschließlich mAP und Inferenzgeschwindigkeiten beim Export nach TensorRT.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOXnano41625,8--0,911,08
YOLOXtiny41632,8--5,066,45
YOLOXs64040.5-2.569,026,8
YOLOXm64046,9-5,4325.373,8
YOLOXl64049.7-9,0454,2155,6
YOLOXx64051,1-16,199,1281,9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
Überlegungen zur Bereitstellung

Während PP-YOLOE+x die höchste absolute Genauigkeit erreicht, bietet YOLOX extrem leichtgewichtige Varianten (Nano und Tiny), die sich hervorragend für stromsparende Mikrocontroller und ältere Mobilhardware eignen.

Link to this sectionAnwendungsfälle und Empfehlungen#

Die Wahl zwischen YOLOX und PP-YOLOE+ hängt von deinen spezifischen Projektanforderungen, Bereitstellungseinschränkungen und Ökosystem-Präferenzen ab.

Link to this sectionWann man sich für YOLOX entscheiden sollte#

YOLOX ist eine starke Wahl für:

  • Forschung an ankerfreier Detektion: Akademische Forschung, die die saubere, ankerfreie Architektur von YOLOX als Basislinie verwendet, um mit neuen Detektions-Heads oder Verlustfunktionen zu experimentieren.
  • Ultraleichte Edge-Geräte: Bereitstellung auf Mikrocontrollern oder älterer mobiler Hardware, wo der extrem kleine Platzbedarf der YOLOX-Nano-Variante (0,91 Mio. Parameter) entscheidend ist.
  • SimOTA Label-Zuweisungsstudien: Forschungsprojekte, die transportbasierte Strategien zur Label-Zuweisung und deren Auswirkungen auf die Trainingskonvergenz untersuchen.

Link to this sectionWann man PP-YOLOE+ wählen sollte#

PP-YOLOE+ wird empfohlen für:

  • PaddlePaddle-Ökosystem-Integration: Organisationen mit bestehender Infrastruktur, die auf dem Baidu PaddlePaddle-Framework und zugehörigen Tools basiert.
  • Paddle Lite Edge-Deployment: Deployment auf Hardware mit hochoptimierten Inferenz-Kernels, speziell für die Paddle Lite- oder Paddle-Inferenz-Engine.
  • Hochpräzise Serverseitige Erkennung: Szenarien, die maximale Erkennungsgenauigkeit auf leistungsstarken GPU-Servern priorisieren, wobei Framework-Abhängigkeiten kein Problem darstellen.

Link to this sectionWann du Ultralytics wählen solltest (YOLO26)#

Für die meisten neuen Projekte bietet Ultralytics YOLO26 die beste Kombination aus Leistung und Entwicklererfahrung:

  • NMS-freies Edge-Deployment: Anwendungen, die eine konsistente Inferenz mit niedriger Latenz ohne die Komplexität der Non-Maximum Suppression-Nachverarbeitung erfordern.
  • Umgebungen nur mit CPU: Geräte ohne dedizierte GPU-Beschleunigung, bei denen die bis zu 43 % schnellere CPU-Inferenz von YOLO26 einen entscheidenden Vorteil bietet.
  • Erkennung kleiner Objekte: Anspruchsvolle Szenarien wie Luftaufnahmen von Drohnen oder die Analyse von IoT-Sensoren, bei denen ProgLoss und STAL die Genauigkeit bei winzigen Objekten deutlich steigern.

Link to this sectionDer Ultralytics-Vorteil: Einführung von YOLO26#

Während sowohl YOLOX als auch PP-YOLOE+ klare Vorteile bieten, erfordert die schnelle Entwicklung der KI Werkzeuge, die modernste Genauigkeit mit unvergleichlicher Benutzerfreundlichkeit kombinieren. Hier übertreffen die Ultralytics-Modelle, insbesondere das kürzlich veröffentlichte Ultralytics YOLO26, herkömmliche Forschungs-Repositories bei weitem.

YOLO26 wurde im Januar 2026 veröffentlicht und setzt einen neuen Standard für moderne Objekterkennung und darüber hinaus. Es bietet eine Entwicklererfahrung, die von konkurrierenden Frameworks schlichtweg unerreicht bleibt.

Link to this sectionWarum Entwickler sich für YOLO26 entscheiden#

  1. End-to-End NMS-freies Design: Basierend auf den Konzepten, die in YOLOv10 eingeführt wurden, ist YOLO26 nativ End-to-End. Durch das vollständige Entfernen der Non-Maximum Suppression (NMS)-Nachverarbeitung wird eine hochkonsistente Latenz sichergestellt und die Export-Pipeline für Edge-Umgebungen drastisch vereinfacht.
  2. Optimierung der nächsten Generation: Die Trainingsstabilität wird durch den MuSGD-Optimierer revolutioniert, eine Mischung aus SGD und Muon (inspiriert von LLM-Methoden wie Kimi K2 von Moonshot AI). Dies garantiert eine schnellere Konvergenz. Darüber hinaus nutzt YOLO26 ProgLoss + STAL, um die Erkennung kleiner Objekte drastisch zu verbessern – ein entscheidendes Merkmal für Anwendungen im Bereich der Luftbildaufnahme und Robotik.
  3. Unübertroffene Hardware-Effizienz: Durch den Wegfall von Distribution Focal Loss (DFL) senkt YOLO26 den Speicherbedarf massiv. Es bietet bis zu 43% schnellere CPU-Inferenz und ist damit die definitive Wahl für Geräte ohne dedizierte GPU-Beschleunigung.
  4. Extreme Vielseitigkeit: Anders als PP-YOLOE+, das sich strikt auf die Erkennung konzentriert, bietet YOLO26 eine einheitliche Unterstützung für zahlreiche Aufgaben. Es integriert einen spezialisierten semantischen Segmentierungsverlust für Instanzsegmentierung, Residual Log-Likelihood Estimation (RLE) für präzise Pose Estimation und fortschrittliche Winkel-Verlustmechanismen für Oriented Bounding Boxes (OBB).

Erfahre mehr über YOLO26

Link to this sectionNahtlose Ökosystem-Integration#

Ultralytics beseitigt die Frustration komplizierter Framework-Installationen. Über die einheitliche Python API oder die intuitive Ultralytics-Plattform kannst du Modelle mit nur wenigen Zeilen Code trainieren, validieren und exportieren.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train on a custom dataset with minimal CUDA memory overhead
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Effortlessly run inference
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX natively, fully benefiting from the NMS-free architecture
model.export(format="onnx")

Für Anwender, die andere robuste Architekturen innerhalb des Ultralytics-Ökosystems bewerten, bleibt YOLO11 eine äußerst zuverlässige Wahl für Legacy-Bereitstellungen, während das Transformer-basierte RT-DETR hervorragende Funktionen für diejenigen bietet, die aufmerksamkeitsbasierte Lösungen suchen.

Link to this sectionZusammenfassung#

Die Entscheidung zwischen YOLOX und PP-YOLOE+ hängt oft von deinen primären Framework-Einschränkungen ab – ob du die Flexibilität von PyTorch bevorzugst oder die tiefe Integration mit Baidus PaddlePaddle benötigst. Für Unternehmen, die ihre KI-Infrastruktur zukunftssicher machen wollen, bietet Ultralytics YOLO26 jedoch eine weitaus überlegene Alternative. Mit seinem revolutionären NMS-freien Design, dem geringen Speicherbedarf und der umfassenden Aufgabenvielfalt befähigt YOLO26 Teams dazu, schnellere, intelligentere und effizientere Computer Vision-Anwendungen mit beispielloser Leichtigkeit zu erstellen.

Mitwirkende

Kommentare