Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX vs YOLOv7#

Die Entwicklung der Echtzeit-Objekterkennung wurde durch kontinuierliche architektonische Durchbrüche vorangetrieben. Zwei bedeutende Meilensteine auf diesem Weg sind YOLOX und YOLOv7. Beide Modelle wurden innerhalb eines Jahres nacheinander veröffentlicht und führten neuartige Ansätze für das Standard-Objekterkennungsparadigma ein, wodurch das Verhältnis zwischen Geschwindigkeit und Genauigkeit erheblich verbessert wurde.

Diese Seite bietet eine fundierte technische Analyse von YOLOX und YOLOv7, vergleicht deren Architekturen, Leistungskennzahlen und ideale Anwendungsfälle, um Entwicklern bei der Auswahl des richtigen Werkzeugs für ihre Computer-Vision-Implementierungen zu helfen.

Link to this sectionYOLOX: Pionierarbeit bei der ankerfreien Erkennung#

YOLOX wurde im Juli 2021 von Forschern bei Megvii vorgestellt und stellte durch den Verzicht auf traditionelle, ankerbasierte Designs eine bedeutende Veränderung dar. Indem YOLOX die Lücke zwischen akademischer Forschung und industrieller Anwendung schloss, vereinfachte es den Erkennungskopf und verbesserte die Gesamtleistung.

Wichtige Modelldetails:

Link to this sectionArchitektonische Innovationen#

YOLOX führte einen ankerfreien Ansatz ein, der die Anzahl der Designparameter und die für benutzerdefinierte Datensätze erforderliche heuristische Feinabstimmung drastisch reduzierte. Es implementierte einen entkoppelten Kopf, der Klassifizierungs- und Regressionsaufgaben trennte, was die Konvergenzgeschwindigkeit und Genauigkeit verbesserte. Zusätzlich nutzte YOLOX fortschrittliche Datenaugmentierungsstrategien wie MixUp und Mosaic, um die Robustheit des Modells zu erhöhen.

Erfahre mehr über YOLOX

Der Vorteil des ankerfreien Designs

Durch den Wegfall von Ankerboxen reduziert YOLOX den Rechenaufwand für die Berechnung der Intersection over Union (IoU) zwischen Vorhersagen und Ground Truths während des Trainings, was zu geringeren CUDA-Speicheranforderungen und schnelleren Trainingszeiten führt.

Link to this sectionYOLOv7: Trainable Bag-of-Freebies#

YOLOv7 wurde im Juli 2022 von Forschern des Institute of Information Science, Academia Sinica, Taiwan, veröffentlicht und erweiterte die Grenzen der Echtzeit-Objekterkennung weiter. Es führte das Konzept eines "trainierbaren Bag-of-Freebies" ein und setzte damit bei seiner Veröffentlichung neue State-of-the-Art-Benchmarks auf dem MS COCO-Datensatz.

Wichtige Modelldetails:

Link to this sectionArchitektonische Innovationen#

Die Architektur von YOLOv7 basiert auf dem Extended Efficient Layer Aggregation Network (E-ELAN), das es dem Modell ermöglicht, kontinuierlich vielfältigere Merkmale zu erlernen, ohne den Gradientenpfad zu verschlechtern. Darüber hinaus nutzte YOLOv7 Techniken zur Modell-Reparametrisierung, wodurch komplexe Multi-Branch-Trainingsnetzwerke während der Inferenz in schnellere Single-Path-Netzwerke vereinfacht werden konnten.

Erfahre mehr über YOLOv7

Link to this sectionLeistungsvergleich#

Bei der Bewertung dieser Modelle für reale Anwendungen ist es entscheidend, ihre Leistung über verschiedene Skalen hinweg zu verstehen. Die folgende Tabelle vergleicht die Standardmetriken für verschiedene Größen von YOLOX und YOLOv7.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOXnano41625,8--0,911,08
YOLOXtiny41632,8--5,066,45
YOLOXs64040.5-2.569,026,8
YOLOXm64046,9-5,4325.373,8
YOLOXl64049.7-9,0454,2155,6
YOLOXx64051,1-16,199,1281,9
YOLOv7l64051.4-6,8436,9104,7
YOLOv7x64053.1-11,5771,3189,9

Link to this sectionAnalyse#

  • Genauigkeit: YOLOv7 erreicht im Allgemeinen ein höheres mAP im Vergleich zu den entsprechenden YOLOX-Modellen. Zum Beispiel erreicht YOLOv7x 53,1 mAP im Vergleich zu 51,1 bei YOLOXx.
  • Geschwindigkeit: Während beide Modelle für die GPU-Ausführung mit TensorRT hochoptimiert sind, bietet die E-ELAN-Architektur von YOLOv7 einen etwas besseren Durchsatz für High-End-Anwendungen, obwohl YOLOX eine hervorragende Latenz auf kleineren Edge-Geräten beibehält.
  • Vielseitigkeit: YOLOv7 erweiterte sein Repertoire über Bounding Boxes hinaus, indem es nativ Gewichte für Instanzsegmentierung und Pose-Schätzung bereitstellt, was es vielseitiger macht als das Basis-YOLOX-Repository.

Link to this sectionAnwendungen in der Praxis#

Die Wahl zwischen diesen Modellen hängt oft von deiner spezifischen Bereitstellungsumgebung ab.

Link to this sectionEdge Computing und IoT#

Für eingeschränkte Edge-Geräte wie Raspberry Pi oder ältere mobile Prozessoren sind YOLOX-Nano und YOLOX-Tiny sehr attraktiv. Ihre minimale Parameteranzahl und ihr ankerfreier Charakter machen sie in Umgebungen mit geringem Stromverbrauch einfacher einsetzbar, etwa für Aufgaben wie einfache Bewegungsverfolgung oder intelligente Türklingelanwendungen.

Link to this sectionHochpräzise Videoanalytik#

Für die Verarbeitung hochauflösender Feeds bei der industriellen Fehlererkennung oder dichten Verkehrsüberwachung ist YOLOv7 überlegen. Seine robuste Merkmalsaggregation ermöglicht es ihm, eine hohe Genauigkeit beizubehalten, selbst wenn Objekte teilweise verdeckt sind oder stark in der Skalierung variieren.

Link to this sectionAnwendungsfälle und Empfehlungen#

Die Wahl zwischen YOLOX und YOLOv7 hängt von deinen spezifischen Projektanforderungen, Bereitstellungsbeschränkungen und Ökosystempräferenzen ab.

Link to this sectionWann man sich für YOLOX entscheiden sollte#

YOLOX ist eine starke Wahl für:

  • Forschung an ankerfreier Detektion: Akademische Forschung, die die saubere, ankerfreie Architektur von YOLOX als Basislinie verwendet, um mit neuen Detektions-Heads oder Verlustfunktionen zu experimentieren.
  • Ultraleichte Edge-Geräte: Bereitstellung auf Mikrocontrollern oder älterer mobiler Hardware, wo der extrem kleine Platzbedarf der YOLOX-Nano-Variante (0,91 Mio. Parameter) entscheidend ist.
  • SimOTA Label-Zuweisungsstudien: Forschungsprojekte, die transportbasierte Strategien zur Label-Zuweisung und deren Auswirkungen auf die Trainingskonvergenz untersuchen.

Link to this sectionWann man YOLOv7 wählen sollte#

YOLOv7 wird empfohlen für:

  • Akademisches Benchmarking: Reproduktion von State-of-the-Art-Ergebnissen aus dem Jahr 2022 oder Untersuchung der Auswirkungen von E-ELAN und "trainable bag-of-freebies"-Techniken.
  • Forschung zur Reparametrisierung: Untersuchung geplanter reparametrisierter Faltungen und Strategien zur zusammengesetzten Modellskalierung.
  • Bestehende benutzerdefinierte Pipelines: Projekte mit stark angepassten Pipelines, die auf der spezifischen Architektur von YOLOv7 basieren und nicht einfach refaktorisiert werden können.

Link to this sectionWann du Ultralytics wählen solltest (YOLO26)#

Für die meisten neuen Projekte bietet Ultralytics YOLO26 die beste Kombination aus Leistung und Entwicklererfahrung:

  • NMS-freies Edge-Deployment: Anwendungen, die eine konsistente Inferenz mit niedriger Latenz ohne die Komplexität der Non-Maximum Suppression-Nachverarbeitung erfordern.
  • Umgebungen nur mit CPU: Geräte ohne dedizierte GPU-Beschleunigung, bei denen die bis zu 43 % schnellere CPU-Inferenz von YOLO26 einen entscheidenden Vorteil bietet.
  • Erkennung kleiner Objekte: Anspruchsvolle Szenarien wie Luftaufnahmen von Drohnen oder die Analyse von IoT-Sensoren, bei denen ProgLoss und STAL die Genauigkeit bei winzigen Objekten deutlich steigern.

Link to this sectionDer Ultralytics-Vorteil#

Während sowohl YOLOX als auch YOLOv7 leistungsstarke Forschungsimplementierungen sind, kann der Übergang von einem Forschungs-Repository zu einer skalierbaren Produktionsumgebung entmutigend sein. Hier glänzt die Ultralytics Plattform.

Ultralytics-Modelle bieten eine einheitliche Python-API, die Modelltraining, Validierung und Bereitstellung als optimierte, standardisierte Aufgaben behandelt. Du vermeidest den Ärger bei der Verwaltung komplexer Drittanbieter-Abhängigkeiten oder benutzerdefinierter C++-Operatoren, die bei älteren Architekturen üblich sind.

Darüber hinaus benötigen Ultralytics YOLO-Modelle während des Trainings deutlich weniger CUDA-Speicher im Vergleich zu Transformer-basierten Detektoren wie RT-DETR. Dies ermöglicht Anwendern, größere Batch-Größen zu verwenden, was das Training stabilisiert und die Konvergenz bei benutzerdefinierten Datensätzen beschleunigt.

Unterstützte Integrationen

Ultralytics unterstützt nativ den Export von Modellen in branchenübliche Formate wie ONNX, OpenVINO und CoreML mit einem einfachen booleschen Flag, was den Modellbereitstellungsprozess enorm vereinfacht.

Link to this sectionCode-Beispiel: Training mit Ultralytics#

Das Ultralytics-Ökosystem ermöglicht es dir, YOLOv7 oder neuere Architekturen mit nur wenigen Zeilen Code einfach zu laden, zu trainieren und die Inferenz durchzuführen.

from ultralytics import YOLO

# Load a pre-trained YOLOv7 model
model = YOLO("yolov7.pt")

# Train the model on a custom dataset (e.g., COCO8)
# The API handles data loading, augmentation, and memory management automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a test image
predictions = model("path/to/image.jpg")
predictions[0].show()

Link to this sectionDie Zukunft: Ultralytics YOLO26#

Während YOLOv7 und YOLOX wichtige historische Schritte darstellen, schreitet der Stand der Technik schnell voran. Die im Januar 2026 veröffentlichte Ultralytics YOLO26 führt bahnbrechende Paradigmen ein, die frühere Modelle ersetzen.

Erfahre mehr über YOLO26

  • End-to-End NMS-freies Design: YOLO26 eliminiert nativ die Non-Maximum Suppression (NMS)-Nachverarbeitung. Dies reduziert Latenzengpässe drastisch und garantiert deterministische Ausführungszeiten über verschiedene Hardware-Setups hinweg.
  • Bis zu 43% schnellere CPU-Inferenz: Durch die Entfernung von Distribution Focal Loss (DFL) und die Optimierung der Netzwerktiefe ist YOLO26 stark auf Edge-Geräte ohne dedizierte GPU-Hardware zugeschnitten.
  • MuSGD-Optimierer: Inspiriert von fortschrittlichen Techniken zum Training großer Sprachmodelle (LLMs), bietet der MuSGD-Optimierer (ein Hybrid aus SGD und Muon) außergewöhnliche Trainingsstabilität und schnellere Konvergenz.
  • Verbesserte Erkennung kleiner Objekte: Die Integration der ProgLoss + STAL-Verlustfunktionen bietet signifikante Verbesserungen bei der Erkennung kleiner, entfernter Objekte – entscheidend für Drohnenkartierung und Sicherheitsüberwachung.
  • Native Aufgabenunterstützung: YOLO26 unterstützt umfassend orientierte Bounding Boxes (OBB), Instanzsegmentierung und Pose-Schätzung nativ innerhalb derselben optimierten API.

Für jeden modernen Entwickler, der heute ein neues Computer-Vision-Projekt startet, ist die Evaluierung von Ultralytics YOLO26 auf der Plattform der empfohlene Weg, um die absolut beste Balance aus Geschwindigkeit, Genauigkeit und Bereitstellungseinfachheit zu erreichen. Für diejenigen, die von früheren Generationen wie YOLO11 oder YOLOv8 aufrüsten, erfordert der Übergang nur das Ändern des Modell-Strings, wodurch sofort überlegene Fähigkeiten freigeschaltet werden.

Mitwirkende

Kommentare