YOLOv10 YOLOv5: Ein umfassender technischer Vergleich

Die Wahl der richtigen neuronalen Netzwerkarchitektur ist entscheidend für die erfolgreiche Bereitstellung von Computer-Vision-Pipelines in der Produktion. Diese Seite bietet eine detaillierte technische Analyse im Vergleich von YOLOv10 und YOLOv5, zwei äußerst einflussreichen Modellen in der Entwicklung der Echtzeit-Objekterkennung. Obwohl beide Modelle erhebliche Auswirkungen auf die KI-Gemeinschaft hatten, repräsentieren sie unterschiedliche Epochen und Philosophien im Design von Deep-Learning-Architekturen.

Dieser Leitfaden bewertet diese Architekturen anhand der mittleren durchschnittlichen Genauigkeit (mAP), der Inferenzlatenz, der Parametereffizienz und der Ökosystemunterstützung und hilft Ihnen dabei, das beste Modell für Ihre Bereitstellungsanforderungen auszuwählen.

Modellübersichten

YOLOv10: Echtzeit-End-to-End-Objekterkennung

Von Forschern der Tsinghua-Universität entwickelt, führte YOLOv10 einen neuartigen Ansatz zur Objekterkennung ein, indem es die Notwendigkeit der Nachbearbeitung eliminierte.

Autoren: Ao Wang, Hui Chen, Lihao Liu, et al.
Organisation:Tsinghua University
Datum: 2024-05-23
Forschungsarbeit:arXiv:2405.14458
Quellcode:YOLOv10 GitHub-Repository

Der entscheidende Durchbruch von YOLOv10 sein End-to-End-Design NMS. In der Vergangenheit stützten sich YOLO auf Non-Maximum Suppression (NMS), um redundante Begrenzungsrahmen herauszufiltern. YOLOv10 konsistente doppelte Zuweisungen für ein Training NMS, wodurch die Variabilität der Inferenzlatenz drastisch reduziert und die Bereitstellungslogik vereinfacht wird. Darüber hinaus zeichnet sich die Architektur durch ein ganzheitliches, auf Effizienz und Genauigkeit ausgerichtetes Design aus, das verschiedene Komponenten gründlich optimiert, um rechnerische Redundanzen zu reduzieren.

Erfahren Sie mehr über YOLOv10

YOLOv5: Der Industriestandard für Benutzerfreundlichkeit

YOLOv5 wurde kurz nach der Einführung des Ultralytics PyTorch veröffentlicht und YOLOv5 die Erwartungen der Entwickler an ein Open-Source-Framework für visuelle KI YOLOv5 . Es ist nach wie vor eine der weltweit am häufigsten eingesetzten Architekturen.

Autor: Glenn Jocher
Organisation:Ultralytics
Datum: 2020-06-26
Quellcode:YOLOv5 GitHub-Repository

YOLOv5 für seine Benutzerfreundlichkeit und sein gut gepflegtes Ökosystem geschätzt. Es wurde vollständig in PyTorch geschrieben und bot eine nahtlose „Zero-to-Hero”-Erfahrung mit sofort einsatzbereiter Unterstützung für Training, Validierung und Export in Formate wie ONNX und TensorRT. Im Gegensatz zu YOLOv10, das sich in erster Linie auf die reine Objekterkennung konzentriert, YOLOv5 außergewöhnliche Vielseitigkeit YOLOv5 und unterstützt Instanzsegmentierung und Bildklassifizierung innerhalb derselben einheitlichen Python

Erfahren Sie mehr über YOLOv5

Leistung und Metriken im Vergleich

Die Visualisierung des Zusammenhangs zwischen Geschwindigkeit und Genauigkeit ist unerlässlich, um die Modelle zu identifizieren, die bei einer bestimmten Geschwindigkeitsbeschränkung die beste Genauigkeit bieten. Das Verständnis dieser Leistungskennzahlen ist grundlegend für die Auswahl eines Modells, das Ihren spezifischen Hardwarebeschränkungen entspricht.

Modell	Größe ^(Pixel)	mAP^val 50-95	Geschwindigkeit ^{CPU ONNX (ms)}	Geschwindigkeit ^{T4 TensorRT10 (ms)}	Parameter ^(M)	FLOPs ^(B)
YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

YOLOv5n	640	28.0	73.6	1.12	2.6	7.7
YOLOv5s	640	37.4	120.7	1.92	9.1	24.0
YOLOv5m	640	45.4	233.9	4.03	25.1	64.2
YOLOv5l	640	49.0	408.4	6.61	53.2	135.0
YOLOv5x	640	50.7	763.2	11.89	97.2	246.4

Technische Analyse

Genauigkeit (mAP): YOLOv10 zeigt einen klaren Generationsvorteil in der Genauigkeit. Zum Beispiel erreicht das YOLOv10-X-Modell einen mAP^val von 54,4 % und übertrifft damit YOLOv5x (50,7 % mAP). Dieser Sprung ist größtenteils auf die NMS-freie Trainingsstrategie und die 2024 eingeführten architektonischen Verfeinerungen zurückzuführen.
Inferenzlatenz: Während YOLOv5-Modelle auf rohen T4 TensorRT-Benchmarks außergewöhnlich schnell sind (z.B. YOLOv5n bei 1,12 ms), eliminiert YOLOv10 den Nachbearbeitungsschritt NMS vollständig. In praktischen End-to-End-Implementierungen bietet das NMS-freie Design von YOLOv10 eine konsistentere und deterministischere Latenz, was für Echtzeitanwendungen wie autonome Fahrzeuge und Robotik entscheidend ist.
Parameter-Effizienz: YOLOv10-Modelle weisen eine äußerst wettbewerbsfähige Leistungsbalance auf. YOLOv10-S erreicht 46,7 % mAP mit nur 7,2 Mio. Parametern, während YOLOv5s 37,4 % mAP mit 9,1 Mio. Parametern erreicht.

Bereitstellungstipp

Bei der Bereitstellung auf Edge-KI -Geräten wie NVIDIA lassen sich Modelle ohne NMS (wie YOLOv10 YOLO26) oft sauberer in TensorRT kompilieren, wodurch Fallback-Operationen auf die CPU vermieden werden.

Anwendungsfälle und Empfehlungen

Die Wahl zwischen YOLOv10 und YOLOv5 hängt von Ihren spezifischen Projektanforderungen, Bereitstellungsbeschränkungen und Ökosystempräferenzen ab.

Wann man YOLOv10 wählen sollte

YOLOv10 eine gute Wahl für:

NMS-freie Echtzeit-detect: Anwendungen, die von einer End-to-End-detect ohne Non-Maximum Suppression profitieren und die Bereitstellungskomplexität reduzieren.
Ausgewogene Kompromisse zwischen Geschwindigkeit und Genauigkeit: Projekte, die ein ausgewogenes Verhältnis zwischen Inferenzgeschwindigkeit und detect-Genauigkeit über verschiedene Modellskalen hinweg erfordern.
Anwendungen mit konsistenter Latenz: Bereitstellungsszenarien, in denen vorhersehbare Inferenzzeiten kritisch sind, wie z. B. Robotik oder autonome Systeme.

Wann man YOLOv5 wählen sollte

YOLOv5 empfohlen für:

Bewährte Produktionssysteme: Bestehende Implementierungen, bei denen die langjährige Stabilität, die umfassende Dokumentation und der massive Community-Support von YOLOv5 geschätzt werden.
Ressourcenbeschränktes Training: Umgebungen mit begrenzten GPU-Ressourcen, in denen die effiziente Trainingspipeline und die geringeren Speicheranforderungen von YOLOv5 vorteilhaft sind.
Umfangreiche Unterstützung für Exportformate: Projekte, die eine Bereitstellung in vielen Formaten erfordern, einschließlich ONNX, TensorRT, CoreML und TFLite.

Wann sollte man sich für Ultralytics YOLO26) entscheiden?

Für die meisten neuen Projekte bietet Ultralytics die beste Kombination aus Leistung und Entwicklererfahrung:

NMS-freie Edge-Bereitstellung: Anwendungen, die eine konsistente Inferenz mit geringer Latenz ohne die Komplexität der Non-Maximum Suppression Nachbearbeitung erfordern.
Nur-CPU-Umgebungen: Geräte ohne dedizierte GPU-Beschleunigung, bei denen die bis zu 43 % schnellere CPU-Inferenz von YOLO26 einen entscheidenden Vorteil bietet.
detect kleiner Objekte: Herausfordernde Szenarien wie Luftbildaufnahmen von Drohnen oder IoT-Sensoranalyse, bei denen ProgLoss und STAL die Genauigkeit bei winzigen Objekten erheblich steigern.

Der Ultralytics Vorteil

YOLOv10 zwar hervorragende Erkennungsfunktionen, doch die Abhängigkeit von akademischen Repositorys kann Produktionspipelines manchmal komplizieren. Durch die Verwendung des offiziellen Python erhalten Sie Zugriff auf ein einheitliches Ökosystem, das sowohl YOLOv5 YOLOv10 sowie erweiterte Funktionen unterstützt.

Trainingseffizienz: Ultralytics YOLO-Architekturen sind tiefgreifend für geringere Speicheranforderungen während des Trainings optimiert. Im Gegensatz zu schweren Transformer-Modellen (wie RT-DETR), die massiven CUDA-Speicher benötigen, können Sie YOLOv5 und YOLOv10 bequem auf Standard-Consumer-GPUs trainieren.
Ökosystem-Integration: Die Integration mit der Ultralytics Plattform ermöglicht es Entwicklern, Datensätze visuell zu verwalten, Experimente mit Weights & Biases zu tracken und Hyperparameter automatisch abzustimmen.

Code-Beispiel: Nahtloses Training

Mit der Ultralytics ist das Umschalten zwischen diesen Architekturen so einfach wie das Ändern der Modellzeichenfolge. Die Trainingspipeline übernimmt automatisch die Datenvergrößerung, Skalierung und Optimierungskonfiguration.

from ultralytics import YOLO

# To use YOLOv5:
# model = YOLO("yolov5s.pt")

# To use YOLOv10:
model = YOLO("yolov10s.pt")

# Train the model on a custom dataset
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=16,
    device=0,  # Use GPU 0
)

# Export the trained model to ONNX format
path = model.export(format="onnx")

Die nächste Generation: Ultralytics

Wenn Sie heute ein neues Machine-Learning-Projekt starten, empfehlen wir Ihnen dringend, die neueste Version von Ultralytics zu prüfen. Diese wurde im Januar 2026 veröffentlicht und stellt durch die Kombination der besten Innovationen der letzten fünf Jahre den absoluten Stand der Technik dar.

YOLO26 integriert nativ das von YOLOv10 entwickelte NMS und gewährleistet so eine schnelle, deterministische Bereitstellung. Darüber hinaus bietet YOLO26 mehrere wichtige Neuerungen:

Bis zu 43 % schnellere CPU-Inferenz: Durch die Entfernung des Distribution Focal Loss (DFL)-Moduls erzielt YOLO26 massive Geschwindigkeitssteigerungen auf Standard-CPUs, was es zur ersten Wahl für mobile Bereitstellungen und stromsparende IoT-Sensoren macht.
MuSGD-Optimierer: Inspiriert von Trainingsmethoden großer Sprachmodelle (LLM) wie Kimi K2 von Moonshot AI, nutzt YOLO26 einen Hybrid aus SGD und Muon. Dies gewährleistet unglaublich stabile Trainingsläufe und eine erheblich beschleunigte Konvergenz im Vergleich zu den in YOLOv10 verwendeten AdamW-Optimierern.
ProgLoss + STAL: Diese fortschrittlichen Verlustfunktionen führen zu bemerkenswerten Verbesserungen bei der Erkennung kleiner Objekte, was für Drohnenbilder und Luftsicherheitsanwendungen entscheidend ist.
Aufgabenspezifische Beherrschung: Während YOLOv10 ein reiner Bounding-Box-Detektor ist, bietet YOLO26 dedizierte architektonische Verbesserungen für alle Aufgaben, einschließlich Residual Log-Likelihood Estimation (RLE) für die Posenschätzung und spezialisierte Winkelverluste für Oriented Bounding Boxes (OBB).

Mehr erfahren

Wenn Sie sich mit dem Thema Objekterkennung im Allgemeinen beschäftigen, könnte es für Sie interessant sein, diese Architekturen mit anderen Frameworks zu vergleichen. In unseren ausführlichen Artikeln zu YOLO11 EfficientDet oder RT-DETR YOLOv8 finden Sie umfassendere Benchmark-Vergleiche.

Ganz gleich, ob Sie sich auf das robuste Erbe von YOLOv5, die NMS Innovation von YOLOv10 oder die beispiellose Spitzenleistung von YOLO26 verlassen – das Ultralytics bietet Ihnen die notwendigen Tools, um Ihre Vision-KI-Anwendungen schnell und effizient zum Leben zu erwecken.