Zum Inhalt springen

Ultralytics YOLOv8 . YOLOv10: Die Entwicklung der Echtzeit-Erkennung

Der Bereich der Computervision entwickelt sich rasant weiter, wobei neue Architekturen den Stand der Technik ständig neu definieren. Zwei wichtige Meilensteine in dieser Entwicklung sind Ultralytics YOLOv8 und YOLOv10. Beide Modelle stammen zwar aus der legendären YOLO -Reihe YOLO You Only Look Once), repräsentieren jedoch unterschiedliche Designphilosophien und Ökosystemintegrationen.

Dieser Leitfaden enthält einen detaillierten technischen Vergleich, der Forschern und Entwicklern dabei helfen soll, das richtige Tool für ihre spezifischen Anforderungen auszuwählen, wobei Faktoren wie die Reife des Ökosystems, die Vielseitigkeit der Aufgaben und die architektonische Innovation berücksichtigt werden.

Zusammenfassung: Welches Modell sollten Sie wählen?

Bevor wir uns mit der Architektur befassen, hier zunächst einmal die grundlegenden Unterschiede:

  • Ultralytics YOLOv8 ist das robuste „Schweizer Taschenmesser“ der Computervision. Aufgrund seines umfangreichen Ökosystems, der Unterstützung mehrerer Aufgaben (Erkennung, Segmentierung, Pose, OBB, Klassifizierung) und der nahtlosen Integration in die Ultralytics ist es die bevorzugte Wahl für den Einsatz in Unternehmen.
  • YOLOv10 ist ein spezialisiertes Erkennungsmodell, das das NMS Training weltweit eingeführt hat. Es eignet sich hervorragend für Forschungszwecke und spezifische Szenarien, in denen ausschließlich die Erkennung im Vordergrund steht und die Eliminierung der Nachbearbeitung das primäre Ziel ist.

Der neueste Standard: YOLO26

Der Vergleich zwischen YOLOv8 YOLOv10 zwar wertvoll, aber Nutzer, die nach der absolut besten Leistung suchen, sollten sich für YOLO26. YOLO26 wurde im Januar 2026 veröffentlicht und vereint das von YOLOv10 eingeführte NMS Design YOLOv10 dem robusten Ökosystem und der Vielseitigkeit von Ultralytics bei der Multitasking-Fähigkeit. Es bietet CPU um bis zu 43 % schnellere CPU und eine verbesserte Erkennung kleiner Objekte.

Ultralytics YOLOv8: Der Ökosystem-Standard

YOLOv8 wurde Anfang 2023 veröffentlicht und entwickelte sich YOLOv8 zum Industriestandard für praktische Computer Vision. Seine größte Stärke liegt nicht nur in den reinen Kennzahlen, sondern auch in seiner Benutzerfreundlichkeit und Vielseitigkeit.

Hauptmerkmale

Modelldetails

Erfahren Sie mehr über YOLOv8

YOLOv10: Der Pionier NMS

YOLOv10 wurde von Forschern der Tsinghua-Universität entwickelt und YOLOv10 stark auf architektonische Effizienz und die Beseitigung von Engpässen bei der Nachbearbeitung.

Schlüsselinnovationen

  • End-to-End-Training: YOLOv10 konsistente doppelte Zuweisungen, um die Notwendigkeit einer Nicht-Maximalunterdrückung (NMS) während der Inferenz zu eliminieren. Dies reduziert die Latenzschwankungen in überfüllten Szenen.
  • Ganzheitliches Effizienzdesign: Die Architektur verfügt über leichtgewichtige Klassifizierungsköpfe und räumlich-kanalgetrenntes Downsampling, um den Rechenaufwand (FLOPs) zu reduzieren.
  • Fokus: Es ist in erster Linie für Objekterkennungsaufgaben konzipiert.

Modelldetails

Erfahren Sie mehr über YOLOv10

Technischer Vergleich: Kennzahlen und Leistung

Die folgende Tabelle vergleicht die Leistung beider Modelle anhand des COCO .

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Analyse der Daten

  1. Genauigkeit vs. Effizienz: YOLOv10 erzielt im Vergleich zu YOLOv8 YOLOv10 einen höherenmAPval-Wert mit weniger Parametern und FLOPs. Diese Effizienz ist auf die optimierten Architekturblöcke zurückzuführen.
  2. Inferenzgeschwindigkeit: Während YOLOv10 NMS YOLOv10 , bleiben YOLOv8 (insbesondere die Nano-Variante) in Bezug auf den Rohdurchsatz auf Standardhardware unglaublich wettbewerbsfähig.
  3. Trainingsspeicher: Ultralytics YOLOv8 hinsichtlich der Trainingseffizienz hochgradig optimiert und benötigt oft weniger GPU als akademische Implementierungen, wodurch größere Batch-Größen auf Verbraucherhardware möglich sind.

Architektur und Designphilosophie

Der wesentliche Unterschied liegt darin, wie diese Modelle die endgültigen Vorhersagen handhaben.

YOLOv8-Architektur

YOLOv8 einen Task-Aligned Assigner. Es prognostiziert Begrenzungsrahmen und Klassenscores separat, richtet sie jedoch während des Trainings aufeinander aus. Entscheidend ist, dass es sich auf NMS stützt, um doppelte Rahmen herauszufiltern. Dies macht das Modell robust und vielseitig, sodass es leicht für Segmentierung und Posenschätzung angepasst werden kann.

YOLOv10 Architektur

YOLOv10 Dual Label AssignmentsYOLOv10 . Während des Trainings verwendet es einen One-to-Many-Head (wie YOLOv8) für reichhaltige Überwachungssignale und einen One-to-One-Head für die endgültige Inferenz. Diese Struktur ermöglicht es dem Modell, die beste Box für ein Objekt auszuwählen, wodurch NMS .

Auswirkungen auf die Bereitstellung

Das Entfernen NMS die Bereitstellungspipeline erheblich. Beim Exportieren von Modellen in Formate wie TensorRT oder OpenVINOmüssen Ingenieure keine komplexen NMS mehr implementieren, was den technischen Aufwand reduziert.

Benutzerfreundlichkeit und Ökosystem

Hier wird die Unterscheidung für Entwickler am wichtigsten.

Ultralytics YOLOv8 wird von einer großen, aktiven Open-Source-Community unterstützt. Es profitiert von:

YOLOv10ist zwar über das Ultralytics verfügbar, in erster Linie jedoch ein akademischer Beitrag. Es wird möglicherweise nicht so häufig gewartet oder um Funktionen erweitert (wie Tracking oder OBB-Unterstützung) wie Ultralytics .

Code-Vergleich

Beide Modelle können über die einheitliche Ultralytics ausgeführt werden, was die Benutzerfreundlichkeit des Ökosystems unterstreicht.

from ultralytics import YOLO

# Load a pretrained YOLOv8 model (Official Ultralytics)
model_v8 = YOLO("yolov8n.pt")

# Load a pretrained YOLOv10 model (Community supported)
model_v10 = YOLO("yolov10n.pt")

# Train YOLOv8 on a custom dataset
model_v8.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference with YOLOv10 on an image
results = model_v10("https://ultralytics.com/images/bus.jpg")

Anwendungen in der realen Welt

Wann man YOLOv8 verwenden sollte

  • Komplexe Robotik: Wenn Ihr Roboter navigieren (Erkennung) und Objekte manipulieren (Pose/Segmentierung) muss, sind die Multitasking-Fähigkeiten YOLOv8 unverzichtbar.
  • Kommerzielle Produkte: Bei Produkten, die eine langfristige Wartung erfordern, gewährleistet die Stabilität des Ultralytics , dass Ihr Modell über Jahre hinweg einsetzbar bleibt.
  • Satellitenbilder: Die spezialisierten OBB-Modelle in YOLOv8 ideal für die Erkennung gedrehter Objekte wie Schiffe oder Fahrzeuge in Luftaufnahmen.

Wann sollte YOLOv10 verwendet werden?

  • Hochfrequenzhandel mit visuellen Daten: In Szenarien, in denen jede Mikrosekunde Latenzabweichung zählt, sorgt der Wegfall des NMS für eine deterministische Inferenzzeit.
  • Eingebettete Geräte mit begrenzter CPU: Bei Geräten, bei denen NMS auf der CPU einen Engpass CPU , entlastet das End-to-End-Design YOLOv10 den Prozessor.

Fazit

Beide Architekturen sind eine ausgezeichnete Wahl. YOLOv8 bleibt für die meisten Entwickler der vielseitige Champion und bietet einen sicheren, robusten und funktionsreichen Weg zur Produktion. YOLOv10 bietet einen faszinierenden Einblick in die Zukunft der NMS Erkennung.

Allerdings hat sich das Feld bereits weiterentwickelt. Für Entwickler, die heute neue Projekte starten, gilt YOLO26 empfohlen. Es nutzt die NMS Vorteile von YOLOv10 , verfeinert diese YOLOv10 mit dem MuSGD-Optimierer und verbesserten Verlustfunktionen (ProgLoss) und bietet so das Beste aus beiden Welten: die hochmoderne Architektur der akademischen Forschung, unterstützt durch den industrietauglichen Support von Ultralytics.

Weiterführende Informationen


Kommentare