Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10 vs. YOLOv5#

Die Wahl der richtigen neuronalen Netzwerkarchitektur ist entscheidend für die Implementierung erfolgreicher Computer Vision-Pipelines in der Produktion. Diese Seite bietet eine tiefgreifende technische Analyse des Vergleichs zwischen YOLOv10 und YOLOv5, zwei hochwirksamen Modellen in der Entwicklung der Echtzeit-Objekterkennung. Während beide Modelle signifikante Auswirkungen auf die KI-Community hatten, repräsentieren sie unterschiedliche Epochen und Philosophien im Design von Deep-Learning-Architekturen.

Dieser Leitfaden bewertet diese Architekturen basierend auf mean Average Precision (mAP), Inferenzlatenz, Parametereffizienz und Ökosystemunterstützung, um dir bei der Auswahl des besten Modells für deine Bereitstellungsanforderungen zu helfen.

Link to this sectionModellübersichten#

Link to this sectionYOLOv10: End-to-End Objekterkennung in Echtzeit#

YOLOv10 wurde von Forschern der Tsinghua-Universität entwickelt und führte einen neuartigen Ansatz zur Objekterkennung ein, indem die Notwendigkeit einer Nachbearbeitung eliminiert wurde.

Der entscheidende Durchbruch von YOLOv10 ist sein End-to-End NMS-freies Design. Historisch gesehen verließen sich YOLO-Modelle auf Non-Maximum Suppression (NMS), um redundante Bounding Boxes herauszufiltern. YOLOv10 verwendet konsistente duale Zuweisungen für das NMS-freie Training, was die Variabilität der Inferenzlatenz drastisch reduziert und die Bereitstellungslogik vereinfacht. Darüber hinaus zeichnet sich die Architektur durch ein ganzheitliches, auf Effizienz und Genauigkeit ausgerichtetes Design aus, das verschiedene Komponenten gründlich optimiert, um redundante Berechnungen zu reduzieren.

Erfahre mehr über YOLOv10

Link to this sectionYOLOv5: Der Industriestandard für Benutzerfreundlichkeit#

Kurz nach der Gründung des Ultralytics PyTorch-Repositorys veröffentlicht, definierte YOLOv5 neu, was Entwickler von einem Open-Source-Vision-KI-Framework erwarteten. Es bleibt eine der weltweit am häufigsten eingesetzten Architekturen.

YOLOv5 wird für seine Benutzerfreundlichkeit und sein hochgradig gepflegtes Ökosystem gefeiert. Es ist vollständig in PyTorch geschrieben und bietet eine nahtlose „Zero-to-Hero“-Erfahrung mit sofort einsatzbereiter Unterstützung für Training, Validierung und Export in Formate wie ONNX und TensorRT. Im Gegensatz zu YOLOv10, das sich hauptsächlich auf die reine Objekterkennung konzentriert, zeigt YOLOv5 eine außergewöhnliche Vielseitigkeit, indem es Instanzsegmentierung und Bildklassifizierung innerhalb derselben einheitlichen Python API unterstützt.

Erfahre mehr über YOLOv5

Link to this sectionVergleich von Leistung und Metriken#

Die Visualisierung des Verhältnisses zwischen Geschwindigkeit und Genauigkeit ist entscheidend, um die Modelle zu identifizieren, die bei einer gegebenen Geschwindigkeitsvorgabe die beste Genauigkeit bieten. Das Verständnis dieser Leistungsmetriken ist grundlegend für die Auswahl eines Modells, das auf deine spezifischen Hardwarebeschränkungen abgestimmt ist.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5,4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256,9160.4
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049,0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this sectionTechnische Analyse#

  1. Genauigkeit (mAP): YOLOv10 demonstriert einen klaren generationsübergreifenden Vorteil bei der Genauigkeit. Zum Beispiel erreicht das YOLOv10-X Modell eine mAPval von 54,4 % und übertrifft damit YOLOv5x (50,7 % mAP). Dieser Sprung ist größtenteils auf die NMS-freie Trainingsstrategie und die im Jahr 2024 eingeführten architektonischen Verfeinerungen zurückzuführen.
  2. Inferenzlatenz: Während YOLOv5-Modelle bei rohen T4 TensorRT-Benchmarks außergewöhnlich schnell sind (z. B. YOLOv5n bei 1,12 ms), eliminiert YOLOv10 den NMS-Nachbearbeitungsschritt vollständig. In praktischen End-to-End-Bereitstellungen bietet das NMS-freie Design von YOLOv10 eine konsistentere und deterministischere Latenz, was für Echtzeitanwendungen wie autonome Fahrzeuge und Robotik entscheidend ist.
  3. Parametereffizienz: YOLOv10-Modelle bewahren eine äußerst wettbewerbsfähige Leistungsbilanz. YOLOv10-S erreicht 46,7 % mAP mit nur 7,2 Mio. Parametern, während YOLOv5s 37,4 % mAP mit 9,1 Mio. Parametern erreicht.
Bereitstellungstipp

When deploying to edge AI devices like the NVIDIA Jetson, models without NMS logic (like YOLOv10 and YOLO26) often compile more cleanly to TensorRT, avoiding fallback operations to the CPU.

Link to this sectionAnwendungsfälle und Empfehlungen#

Die Entscheidung zwischen YOLOv10 und YOLOv5 hängt von deinen spezifischen Projektanforderungen, Bereitstellungsbeschränkungen und Ökosystempräferenzen ab.

Link to this sectionWann du dich für YOLOv10 entscheiden solltest#

YOLOv10 ist eine starke Wahl für:

  • NMS-freie Echtzeiterkennung: Anwendungen, die von einer End-to-End-Erkennung ohne Non-Maximum Suppression profitieren, was die Komplexität der Bereitstellung reduziert.
  • Ausgewogene Speed-Accuracy-Tradeoffs: Projekte, die eine gute Balance zwischen Inferenzgeschwindigkeit und Erkennungsgenauigkeit über verschiedene Modellgrößen hinweg erfordern.
  • Anwendungen mit konstanter Latenz: Bereitstellungsszenarien, in denen vorhersehbare Inferenzzeiten kritisch sind, wie etwa in der Robotik oder bei autonomen Systemen.

Link to this sectionWann du YOLOv5 wählen solltest#

YOLOv5 wird empfohlen für:

  • Bewährte Produktionssysteme: Bestehende Bereitstellungen, bei denen die langjährige Stabilität, die umfangreiche Dokumentation und die massive Community-Unterstützung von YOLOv5 geschätzt werden.
  • Ressourcenbegrenztes Training: Umgebungen mit begrenzten GPU-Ressourcen, in denen die effiziente Trainings-Pipeline und der geringere Speicherbedarf von YOLOv5 von Vorteil sind.
  • Umfangreiche Unterstützung von Exportformaten: Projekte, die eine Bereitstellung über viele Formate hinweg erfordern, einschließlich ONNX, TensorRT, CoreML und TFLite.

Link to this sectionWann du Ultralytics wählen solltest (YOLO26)#

Für die meisten neuen Projekte bietet Ultralytics YOLO26 die beste Kombination aus Leistung und Entwicklererfahrung:

  • NMS-freies Edge-Deployment: Anwendungen, die eine konsistente Inferenz mit niedriger Latenz ohne die Komplexität der Non-Maximum Suppression-Nachverarbeitung erfordern.
  • Umgebungen nur mit CPU: Geräte ohne dedizierte GPU-Beschleunigung, bei denen die bis zu 43 % schnellere CPU-Inferenz von YOLO26 einen entscheidenden Vorteil bietet.
  • Erkennung kleiner Objekte: Anspruchsvolle Szenarien wie Luftaufnahmen von Drohnen oder die Analyse von IoT-Sensoren, bei denen ProgLoss und STAL die Genauigkeit bei winzigen Objekten deutlich steigern.

Link to this sectionDer Ultralytics-Vorteil#

Während YOLOv10 hervorragende Erkennungsfähigkeiten bietet, kann die Abhängigkeit von akademischen Repositories Produktionspipelines manchmal erschweren. Durch die Verwendung des offiziellen Ultralytics Python-Pakets erhältst du Zugang zu einem einheitlichen Ökosystem, das sowohl YOLOv5 als auch YOLOv10 sowie fortgeschrittene Funktionen unterstützt.

  • Trainingseffizienz: Ultralytics YOLO-Architekturen sind tiefgehend für geringere Speicheranforderungen während des Trainings optimiert. Im Gegensatz zu schweren Transformer-Modellen (wie RT-DETR), die massiven CUDA-Speicher erfordern, kannst du YOLOv5 und YOLOv10 problemlos auf Standard-Consumer-GPUs trainieren.
  • Ökosystem-Integration: Die Integration mit der Ultralytics Platform ermöglicht es Entwicklern, Datensätze visuell zu verwalten, Experimente mit Weights & Biases zu verfolgen und Hyperparameter automatisch abzustimmen.

Link to this sectionCode-Beispiel: Nahtloses Training#

Mit der Ultralytics-Bibliothek ist der Wechsel zwischen diesen Architekturen so einfach wie das Ändern des Modell-Strings. Die Trainings-Pipeline übernimmt automatisch die Datenaugmentierung, Skalierung und Optimierer-Konfiguration.

from ultralytics import YOLO

# To use YOLOv5:
# model = YOLO("yolov5s.pt")

# To use YOLOv10:
model = YOLO("yolov10s.pt")

# Train the model on a custom dataset
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=16,
    device=0,  # Use GPU 0
)

# Export the trained model to ONNX format
path = model.export(format="onnx")

Link to this sectionDie nächste Generation: Ultralytics YOLO26#

Wenn du heute ein neues Machine Learning-Projekt startest, empfehlen wir dringend, das neueste Ultralytics YOLO26 zu evaluieren. Es wurde im Januar 2026 veröffentlicht und repräsentiert den absoluten Stand der Technik, indem es die besten Innovationen der letzten fünf Jahre vereint.

YOLO26 integriert nativ das von YOLOv10 bekannte End-to-End NMS-freie Design, was eine schnelle und deterministische Bereitstellung gewährleistet. Darüber hinaus führt YOLO26 mehrere entscheidende Durchbrüche ein:

  • Bis zu 43 % schnellere CPU-Inferenz: Durch das Entfernen des Distribution Focal Loss (DFL)-Moduls erreicht YOLO26 massive Geschwindigkeitssteigerungen auf Standard-CPUs und ist damit die erste Wahl für mobile Bereitstellungen und stromsparende IoT-Sensoren.
  • MuSGD Optimierer: Inspiriert von Trainingsmethoden für große Sprachmodelle (LLM) wie Moonshot AIs Kimi K2, verwendet YOLO26 eine Hybridlösung aus SGD und Muon. Dies sorgt für unglaublich stabile Trainingsläufe und eine im Vergleich zu den in YOLOv10 verwendeten AdamW-Optimierern weitaus schnellere Konvergenz.
  • ProgLoss + STAL: Diese fortschrittlichen Verlustfunktionen führen zu bemerkenswerten Verbesserungen bei der Erkennung kleiner Objekte, was für Drohnenbilder und Luftüberwachungsanwendungen entscheidend ist.
  • Aufgabenspezifische Meisterschaft: Während YOLOv10 streng genommen ein Bounding-Box-Detektor ist, bietet YOLO26 dedizierte architektonische Verbesserungen für alle Aufgaben, einschließlich Residual Log-Likelihood Estimation (RLE) für Posen und spezialisierte Winkelverlustfunktionen für orientierte Bounding Boxes (OBB).
Mehr erfahren

Wenn du die breitere Landschaft der Objekterkennung erkundest, bist du vielleicht auch daran interessiert, diese Architekturen mit anderen Frameworks zu vergleichen. Schau dir unsere Deep Dives zu YOLO11 vs. EfficientDet oder RT-DETR vs. YOLOv8 für umfassendere Benchmarks an.

Egal, ob du dich auf das robuste Erbe von YOLOv5, die NMS-freie Innovation von YOLOv10 oder die beispiellose Spitzenleistung von YOLO26 verlässt, das Ultralytics-Ökosystem bietet die notwendigen Werkzeuge, um deine Vision-KI-Anwendungen schnell und effizient zum Leben zu erwecken.

Mitwirkende

Kommentare