Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10 vs YOLOv7#

Die rasante Entwicklung im Bereich Computer Vision in den letzten Jahren hat zu immer effizienteren Architekturen für Echtzeitanwendungen geführt. Ein Vergleich zwischen YOLOv10 und YOLOv7 verdeutlicht eine entscheidende Übergangsphase in dieser Evolution. Während YOLOv7 hocheffektive Trainingsstrategien und architektonische Skalierung einführte, revolutionierte YOLOv10 das Deployment durch die Abschaffung der langjährigen Abhängigkeit von Non-Maximum Suppression (NMS).

Beide Modelle haben bei ihrer jeweiligen Veröffentlichung die Grenzen der Objekterkennung verschoben, doch das moderne Ultralytics Ökosystem und die Einführung von Modellen der nächsten Generation wie YOLO26 bieten weitaus überlegenere Workflows für heutige KI-Anwender.

Link to this sectionModellprofile und Ursprünge#

Das Verständnis der Ursprünge dieser Modelle liefert wertvollen Kontext zu ihren architektonischen Designentscheidungen und der wissenschaftlichen Forschung, die sie vorantreibt.

Link to this sectionYOLOv10 Details#

Erfahre mehr über YOLOv10

Link to this sectionYOLOv7 Details#

Erfahre mehr über YOLOv7

Link to this sectionArchitektonische Innovationen#

Link to this sectionDer YOLOv7-Ansatz#

YOLOv7 wurde 2022 veröffentlicht und legte den Schwerpunkt auf die Optimierung von Gradientenpfaden. Es führte das Extended Efficient Layer Aggregation Network (E-ELAN) ein, das es dem Modell ermöglichte, vielfältigere Merkmale zu lernen, ohne den ursprünglichen Gradientenpfad zu zerstören. Darüber hinaus implementierten die Autoren eine „trainable bag-of-freebies“-Methodik, bei der Re-Parametrisierungstechniken während des Trainings genutzt wurden, die bei der Inferenz entfernt werden konnten, um hohe Ausführungsgeschwindigkeiten beizubehalten. Trotz dieser beeindruckenden Optimierungen war YOLOv7 bei der Nachverarbeitung weiterhin stark auf NMS angewiesen, was bei Analysen komplexer Szenen zu variabler Latenz führte.

Link to this sectionDer YOLOv10-Durchbruch#

YOLOv10 adressierte den NMS-Flaschenhals direkt. Durch die Einführung konsistenter dualer Zuweisungen während des Trainings ermöglichte das Team der Tsinghua-Universität eine NMS-freie End-to-End-Erkennung. Dieser Dual-Head-Ansatz nutzt einen Zweig mit Eins-zu-viele-Zuweisungen für reichhaltige Überwachungssignale während des Trainings und einen weiteren Zweig mit Eins-zu-eins-Zuweisungen für NMS-freie Inferenz. Diese architektonische Änderung sorgt für eine konsistente, extrem niedrige Inferenzlatenz, die für Hochgeschwindigkeits-Videoanalysen geeignet ist. Zudem setzt YOLOv10 auf ein ganzheitliches, auf Effizienz und Genauigkeit ausgerichtetes Modelldesign, das die in früheren Generationen vorhandene Rechenredundanz eliminiert.

Auswirkungen der Nachverarbeitung

Das Entfernen der NMS-Nachverarbeitung beschleunigt nicht nur die Inferenz, sondern vereinfacht auch das Deployment auf Edge-KI-Hardware erheblich, wie etwa auf KI-Beschleunigern und NPUs, bei denen benutzerdefinierte NMS-Operationen bekanntermaßen schwer zu kompilieren sind.

Link to this sectionLeistungsvergleich#

Beim Vergleich der Rohmetriken auf dem MS COCO Datensatz wird die generationenbedingte Kluft deutlich. YOLOv10 erreicht einen wesentlich günstigeren Kompromiss zwischen Parametern, Rechenanforderungen und Genauigkeit.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5,4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256,9160.4
YOLOv7l64051.4-6,8436,9104,7
YOLOv7x64053,1-11,5771,3189,9

Wie oben zu sehen, liefert YOLOv10x eine überlegene mAP von 54,4 % im Vergleich zu den 53,1 % von YOLOv7x, bei etwa 20 % weniger Parametern. Zudem bieten die leichtgewichtigen YOLOv10-Modelle (Nano und Small) außergewöhnliche TensorRT-Deployment-Geschwindigkeiten, was sie für das mobile Deployment äußerst attraktiv macht.

Link to this sectionDer Vorteil des Ultralytics-Ökosystems#

Das Studium architektonischer Paper ist zwar aufschlussreich, aber moderne Computer-Vision-Entwicklung basiert auf robusten, gut gewarteten Frameworks. Die Auswahl eines von Ultralytics unterstützten Modells bietet einen enormen Vorteil für Entwickler, die schnell vom Prototyp zur Produktion gelangen möchten.

Link to this sectionOptimierte Entwicklung#

Sowohl YOLOv10 als auch YOLOv7 können über das standardmäßige Ultralytics Python-Paket abgerufen werden. Dies bietet eine beispiellose Benutzerfreundlichkeit und ersetzt tausende Zeilen Boilerplate-Code durch eine einfache, intuitive API. Zudem benötigen Ultralytics YOLO-Modelle während des Trainings deutlich weniger CUDA-Speicher im Vergleich zu schweren Transformer-Architekturen, was den Einsatz größerer Batch-Größen auf Consumer-Hardware ermöglicht.

Link to this sectionUnvergleichliche Vielseitigkeit#

Während ältere Repositories oft nur auf Bounding-Box-Erkennung fokussiert sind, unterstützt das integrierte Ultralytics Framework nahtlos eine Vielzahl von Aufgaben. Egal, ob du Instanzsegmentierung, Pose-Schätzung oder Oriented Bounding Box (OBB)-Erkennung durchführst, der Workflow bleibt identisch.

Link to this sectionCode-Beispiel: Konsistente Trainings-Workflows#

Der folgende Code-Schnipsel demonstriert den nahtlosen Trainingsprozess, der automatisch die Datenaugmentierung und die Lernratenplanung übernimmt:

from ultralytics import YOLO

# Load the desired model (YOLOv10, YOLOv7, or the recommended YOLO26)
model = YOLO("yolo26n.pt")

# Train the model effortlessly on your dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)

# Export to ONNX format for rapid deployment
model.export(format="onnx")

Link to this sectionAnwendungsfälle und Empfehlungen#

Die Entscheidung zwischen YOLOv10 und YOLOv7 hängt von deinen spezifischen Projektanforderungen, Deployment-Beschränkungen und Präferenzen im Ökosystem ab.

Link to this sectionWann du dich für YOLOv10 entscheiden solltest#

YOLOv10 ist eine starke Wahl für:

  • NMS-freie Echtzeiterkennung: Anwendungen, die von einer End-to-End-Erkennung ohne Non-Maximum Suppression profitieren, was die Komplexität der Bereitstellung reduziert.
  • Ausgewogene Speed-Accuracy-Tradeoffs: Projekte, die eine gute Balance zwischen Inferenzgeschwindigkeit und Erkennungsgenauigkeit über verschiedene Modellgrößen hinweg erfordern.
  • Anwendungen mit konstanter Latenz: Bereitstellungsszenarien, in denen vorhersehbare Inferenzzeiten kritisch sind, wie etwa in der Robotik oder bei autonomen Systemen.

Link to this sectionWann man YOLOv7 wählen sollte#

YOLOv7 wird empfohlen für:

  • Akademisches Benchmarking: Reproduktion von State-of-the-Art-Ergebnissen aus dem Jahr 2022 oder Untersuchung der Auswirkungen von E-ELAN und "trainable bag-of-freebies"-Techniken.
  • Forschung zur Reparametrisierung: Untersuchung geplanter reparametrisierter Faltungen und Strategien zur zusammengesetzten Modellskalierung.
  • Bestehende benutzerdefinierte Pipelines: Projekte mit stark angepassten Pipelines, die auf der spezifischen Architektur von YOLOv7 basieren und nicht einfach refaktorisiert werden können.

Link to this sectionWann du Ultralytics wählen solltest (YOLO26)#

Für die meisten neuen Projekte bietet Ultralytics YOLO26 die beste Kombination aus Leistung und Entwicklererfahrung:

  • NMS-freies Edge-Deployment: Anwendungen, die eine konsistente Inferenz mit niedriger Latenz ohne die Komplexität der Non-Maximum Suppression-Nachverarbeitung erfordern.
  • Umgebungen nur mit CPU: Geräte ohne dedizierte GPU-Beschleunigung, bei denen die bis zu 43 % schnellere CPU-Inferenz von YOLO26 einen entscheidenden Vorteil bietet.
  • Erkennung kleiner Objekte: Anspruchsvolle Szenarien wie Luftaufnahmen von Drohnen oder die Analyse von IoT-Sensoren, bei denen ProgLoss und STAL die Genauigkeit bei winzigen Objekten deutlich steigern.

Link to this sectionDer neue Standard: Vorstellung von YOLO26#

Während YOLOv10 im Jahr 2024 einen riesigen Sprung nach vorne darstellte, bewegt sich die Computer-Vision-Landschaft unglaublich schnell. Für alle Neuentwicklungen empfehlen wir dringend das Modell der neuesten Generation: Ultralytics YOLO26. Es wurde im Januar 2026 veröffentlicht und repräsentiert die absolute Spitze der Echtzeit-Vision-KI, wobei es sowohl YOLOv7 als auch YOLOv10 weitgehend übertrifft.

Erfahre mehr über YOLO26

YOLO26 bringt beispiellose Innovationen mit sich, die speziell für moderne Deployment-Umgebungen entwickelt wurden:

  • End-to-End NMS-freies Design: Aufbauend auf dem Fundament von YOLOv10 eliminiert YOLO26 nativ die NMS-Nachverarbeitung für einfachere Deployment-Pipelines und konsistente Hochgeschwindigkeits-Inferenz.
  • Bis zu 43 % schnellere CPU-Inferenz: Stark optimiert für Edge-Computing und Geräte ohne dedizierte GPUs, was enorme Einsparungen bei den Hardwarekosten ermöglicht.
  • DFL-Entfernung: Die Distribution Focal Loss wurde vollständig entfernt, was die Exportlogik radikal vereinfacht und die Kompatibilität mit Edge-Geräten mit geringem Stromverbrauch und Mikrocontrollern erheblich verbessert.
  • MuSGD Optimizer: Inspiriert von Moonshot AIs Kimi K2, bringt diese Hybrid-Form aus SGD und Muon Innovationen aus dem Training von Large Language Models (LLM) direkt in die Computer Vision, was zu unglaublich stabilen Trainingsdynamiken und schnellerer Konvergenz führt.
  • ProgLoss + STAL: Diese fortgeschrittenen Verlustfunktionen liefern bemerkenswerte Verbesserungen bei der Erkennung kleiner Objekte, einem historisch schwierigen Bereich, der entscheidend für Drohnen, Robotik und Smart City Monitoring ist.
  • Aufgabenspezifische Verbesserungen: YOLO26 ist nicht nur ein Detektor. Es enthält spezialisierte semantische Segmentierungsverlustfunktionen, Residual Log-Likelihood Estimation (RLE) für extrem präzises Pose-Tracking und spezialisierte Winkel-Verlustalgorithmen, um Probleme mit OBB-Grenzen zu eliminieren.
Verwaltung von Datensätzen und Training

Für die absolut beste Erfahrung bei der Verwaltung deiner Datensätze, dem Training von YOLO26 und dem Deployment von Modellen in die Cloud, entdecke die Ultralytics Plattform. Sie bietet ein No-Code-Interface, das die Python-SDK perfekt ergänzt.

Link to this sectionAnwendungsfälle aus der Praxis#

Die Wahl der richtigen Architektur hängt stark von deiner Hardware und den Anwendungsbeschränkungen ab.

Link to this sectionWann sollte man YOLOv7 verwenden?#

YOLOv7 bleibt eine zuverlässige Wahl für die Aufrechterhaltung älterer Pipelines, die bereits tief in seine spezifischen Tensor-Strukturen integriert sind, oder wenn akademische Benchmarks von 2022 und 2023 reproduziert werden sollen. Es leistet hervorragende Arbeit auf High-End-Server-GPUs.

Link to this sectionWann sollte man YOLOv10 verwenden?#

YOLOv10 glänzt in Szenarien, die eine strikte, unveränderliche Latenz erfordern. Da es NMS-frei ist, eignet es sich hervorragend für die Zählung von Menschenmengen in hoher Dichte oder die Erkennung von Fertigungsfehlern, bei denen die Anzahl der Objekte stark schwankt, die Verarbeitungszeit pro Frame jedoch konstant bleiben muss.

Link to this sectionWann du YOLO26 verwenden solltest#

YOLO26 ist die definitive Wahl für jedes Greenfield-Projekt. Vom Einsatz anspruchsvoller Sicherheitsalarmsysteme auf einem einfachen Raspberry Pi bis hin zur Ausführung massiver Cloud-basierter Videoanalysen macht es seine überlegene CPU-Geschwindigkeit und die fortschrittliche Erkennung kleiner Objekte den älteren Generationen weit überlegen.

Für Entwickler, die an der Erforschung alternativer moderner Architekturen interessiert sind, bieten wir auch umfassenden Support für transformer-basierte Detektoren wie RT-DETR und frühere generationenübergreifende Klassiker wie Ultralytics YOLO11.

Kommentare