Zum Inhalt springen

YOLOv10 .YOLO: Entwicklung von Architekturen zur Echtzeit-Objekterkennung

In der sich rasant entwickelnden Landschaft der Computervision treibt das Streben nach einem optimalen Gleichgewicht zwischen Latenz und Genauigkeit ständige Innovationen voran. Zwei bedeutende Meilensteine auf diesem Weg sind YOLOv10, bekannt für sein bahnbrechendes NMS Training, und YOLO, das Neural Architecture Search (NAS) nutzte, um die Grenzen der Effizienz zu erweitern. Dieser Vergleich untersucht ihre architektonischen Unterschiede, Leistungskennzahlen und Eignung für moderne KI-Anwendungen.

Analyse von Leistungsmetriken

Die folgende Tabelle enthält einen detaillierten Vergleich der wichtigsten Leistungsindikatoren. YOLOv10 zeigt eine überlegene Effizienz bei der Parameternutzung und Inferenzgeschwindigkeit auf modernen GPUs, insbesondere bei den größeren Modellvarianten.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

YOLOv10: Der End-to-End-Pionier

Im Mai 2024 von Forschern der Tsinghua-Universität veröffentlicht, YOLOv10 einen Paradigmenwechsel ein, indem es die Notwendigkeit der Non-Maximum Suppression (NMS) beseitigte. Diese Architektur behebt die Latenzschwankungen, die häufig durch Nachbearbeitungsschritte in herkömmlichen Detektoren verursacht werden.

Wesentliche Architekturmerkmale

  • NMS Training: Nutzt konsistente doppelte Zuweisungen für NMS Training, wodurch das Modell direkt eine einzelne Begrenzungsbox pro Objekt vorhersagen kann. Dies ist entscheidend für Anwendungen, die eine vorhersagbare Latenz erfordern, wie beispielsweise autonome Fahrzeuge oder Industrieroboter.
  • Ganzheitliches Design für Effizienz und Genauigkeit: Die Autoren Ao Wang et al. optimierten verschiedene Komponenten, darunter das Rückgrat und den Kopf, um Rechenredundanzen zu reduzieren.
  • Leichter Klassifizierungskopf: Reduziert den Overhead des Klassifizierungszweigs, der häufig einen Engpass in ankerfreien Detektoren darstellt.

Sie können YOLOv10 über die Ultralytics Python ausführen und so von der standardisierten Schnittstelle profitieren.

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")
results[0].show()

Erfahren Sie mehr über YOLOv10

YOLO: Neuronale Architektursuche in großem Maßstab

YOLO, entwickelt von der Alibaba Group und veröffentlicht im November 2022, konzentriert sich auf die automatisierte Ermittlung effizienter Architekturen. Durch den Einsatz von Neural Architecture Search (NAS) wollte das Team die optimale Tiefe und Breite für Erkennungs-Backbones unter strengen Rechenbudgets finden.

Wesentliche Architekturmerkmale

  • MAE-NAS-Backbone: Verwendet eine multiobjektive evolutionäre Suche, um Backbones zu finden, die ein Gleichgewicht zwischen Erkennungsgenauigkeit und Inferenzgeschwindigkeit herstellen.
  • Effizientes RepGFPN: Ein Heavy-Neck-Design, das die Merkmalsfusion verbessert, was für die Erkennung von Objekten in verschiedenen Maßstäben, beispielsweise bei der Analyse von Luftbildern, von entscheidender Bedeutung ist.
  • ZeroHead: Ein vereinfachter detection head, der die Komplexität der finalen Vorhersageschichten reduziert.

YOLO zwar eine starke Leistung, aber seine Abhängigkeit von komplexen NAS-Prozessen kann es für durchschnittliche Entwickler schwierig machen, die Architektur für benutzerdefinierte Datensätze neu zu trainieren oder zu modifizieren, verglichen mit der benutzerfreundlichen Konfiguration der Ultralytics .

Ultralytics von Ultralytics : Geben Sie YOLO26 ein

Während YOLOv10 YOLO bedeutende FortschritteYOLO , hat sich das Gebiet weiterentwickelt. Ultralytics baut auf dem NMS Erbe von YOLOv10 auf YOLOv10 integriert es YOLOv10 in ein robusteres, produktionsreifes Ökosystem.

Warum Ultralytics wählen?

Ultralytics ein gut gepflegtes Ökosystem, das sicherstellt, dass Ihre Modelle nicht nur heute funktionieren, sondern auch weiterhin funktionieren, wenn sich Hardware- und Software-Bibliotheken weiterentwickeln. Im Gegensatz zu vielen akademischen Repositorien Ultralytics konsistente Updates, umfangreiche Dokumentation und nahtlose Integration mit Bereitstellungstools wie TensorRT und OpenVINO.

YOLO26 Innovationen

Für Entwickler, die absolute Spitzenleistungen in Sachen Geschwindigkeit und Genauigkeit suchen, bietet YOLO26 gegenüber seinen Vorgängern mehrere entscheidende Verbesserungen:

  1. End-to-End NMS: Wie YOLOv10 ist auch YOLO26 von Haus aus End-to-End. Allerdings wird dies noch weiter verfeinert, indem Distribution Focal Loss (DFL) entfernt wird, was den Modellgraphen vereinfacht und so für eine bessere Kompatibilität mit Edge-Geräten und Chips mit geringem Stromverbrauch sorgt.
  2. MuSGD-Optimierer: Inspiriert von Innovationen im LLM-Training (insbesondere Moonshot AI's Kimi K2) nutzt YOLO26 den MuSGD-Optimierer. Diese Mischung aus SGD Muon sorgt für eine beispiellose Stabilität beim Training, ermöglicht eine schnellere Konvergenz und reduziert GPU .
  3. CPU : YOLO26 ist speziell für Edge-Computing optimiert und bietet eine um bis zu 43 % schnellere Inferenz auf CPUs. Damit ist es die ideale Wahl für IoT-Anwendungen, bei denen keine GPUs verfügbar sind.
  4. Verbesserte Verlustfunktionen: Die Einführung von ProgLoss und STAL (Self-Taught Anchor Learning) verbessert die Leistung bei kleinen Objekten und schwierigen Hintergründen erheblich.

Erfahren Sie mehr über YOLO26

Vergleichende Anwendungsfälle

Die Auswahl des richtigen Modells hängt stark von Ihren spezifischen Einsatzbeschränkungen und Workflow-Anforderungen ab.

Wann sollteYOLO verwendet werden?

YOLO ein starker Kandidat für Forschungsszenarien im Zusammenhang mit Neural Architecture Search (NAS). Wenn Ihr Projekt die Untersuchung der Auswirkungen automatisierter Suchstrategien auf die Merkmalsextraktion erfordert oder wenn Sie tief in das Alibaba-Ökosystem integriert sind, liefert dieses Modell wertvolle Erkenntnisse. Sein RepGFPN-Modul ist auch eine ausgezeichnete Referenz für Studien zur Merkmalsfusion.

Wann sollte YOLOv10 verwendet werden?

YOLOv10 hervorragend für Anwendungen, bei denen eine geringe Latenzvarianz entscheidend ist. Sein NMS Design sorgt dafür, dass die Inferenzzeit unabhängig von der Anzahl der erkannten Objekte stabil bleibt, was für Echtzeit-Sicherheitssysteme von entscheidender Bedeutung ist.

  • Echtzeitüberwachung: Gleichbleibende Bildraten für überfüllte Szenen.
  • Robotik: Vorhersagbare Zeitpunkte für Regelkreise.

Warum YOLO26 die bessere Wahl ist

Für die Mehrheit der Entwickler und kommerziellen Anwendungen bietet Ultralytics das überzeugendste Paket. Es kombiniert die NMS Vorteile von YOLOv10 überlegener Trainingseffizienz und umfassender Hardwareunterstützung.

  • Benutzerfreundlichkeit: Trainieren, validieren und implementieren Sie mit einer einzigen Python .
  • Vielseitigkeit: Im Gegensatz zuYOLO unterstützt YOLO26 eine ganze Reihe von Aufgaben, darunter Instanzsegmentierung, Posenschätzung, Klassifizierung und orientierte Begrenzungsrahmen (OBB).
  • Speichereffizienz: YOLO26 benötigt während des Trainings deutlich weniger CUDA als Transformer-Hybridmodelle, sodass das Training auf handelsüblichen GPUs möglich ist.
  • Plattformintegration: Nahtloser Export zu ONNX, CoreML und TFLite die Ultralytics , wodurch der Weg vom Prototyp zur Produktion optimiert wird.

Code-Beispiel: YOLO26-Workflow

Mit Ultralytics ist der Übergang zur neuesten Technologie ganz einfach. Der folgende Codeausschnitt zeigt, wie Sie das hochmoderne YOLO26-Modell laden, eine Inferenz ausführen und es für die Bereitstellung exportieren können.

from ultralytics import YOLO

# Load the YOLO26s model (Small version)
model = YOLO("yolo26s.pt")

# Train on COCO8 dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for simplified deployment
model.export(format="onnx", opset=13)

Fazit

Sowohl YOLOv10 YOLO wertvolle Innovationen im Bereich der Bildverarbeitung hervorgebracht. YOLOv10 hat die Machbarkeit der NMS Erkennung bewiesen, während YOLO die Leistungsfähigkeit von NAS unter Beweis gestellt hat. Ultralytics vereint diese Fortschritte jedoch in einem umfassenden, benutzerfreundlichen und leistungsstarken Tool. Mit seiner überragenden Geschwindigkeit, seiner Vielseitigkeit und der Unterstützung durch ein robustes Ökosystem ist YOLO26 die empfohlene Lösung für Entwickler, die die nächste Generation von KI-Anwendungen entwickeln.

Für weitere Informationen empfehlen wir Ihnen, die YOLO11 oder den Transformer-basierten RT-DETR für alternative Architekturansätze.


Kommentare