Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 vs YOLO11#

Wenn du die richtige Computer-Vision-Architektur für ein neues Projekt auswählst, ist das Verständnis der Entwicklung modernster Modelle entscheidend. Der Fortschritt von früheren Architekturen hin zu modernen, vereinheitlichten Frameworks zeigt signifikante Sprünge sowohl bei der algorithmischen Effizienz als auch bei der Entwicklererfahrung. Dieser Leitfaden bietet einen detaillierten technischen Vergleich zwischen zwei wegweisenden Modellen, die von Ultralytics entwickelt wurden: dem bahnbrechenden YOLOv5 und dem hochgradig verfeinerten YOLO11.

Link to this sectionEinführung in die Modelle#

Beide Architekturen stellen bedeutende Meilensteine im Bereich der Echtzeit-Objekterkennung dar und bieten je nach Bereitstellungsumgebung und Altanforderungen unterschiedliche Vorteile.

Link to this sectionYOLOv5: Das Arbeitstier der Branche#

YOLOv5 wurde im Sommer 2020 veröffentlicht und entwickelte sich aufgrund seiner nativen PyTorch-Implementierung schnell zum Industriestandard, was die Einstiegshürde für Training und Bereitstellung drastisch senkte. Es distanzierte sich von den komplexen Darknet-C-Frameworks seiner Vorgänger und bot einen Python-orientierten Ansatz für den Modellbau.

YOLOv5 etablierte eine starke Grundlage für Benutzerfreundlichkeit und führte leistungsstarke Trainingsmethoden ein, einschließlich fortgeschrittener Mosaik-Datenaugmentation und Auto-Anchoring. Es bleibt bei Forschern, die auf einer gut dokumentierten, intensiv getesteten Codebasis aufbauen, unglaublich beliebt.

Erfahre mehr über YOLOv5

Link to this sectionYOLO11: Das vereinheitlichte Vision-Framework#

Aufbauend auf jahrelangem Feedback und architektonischer Forschung wurde YOLO11 als Teil eines vereinheitlichten Frameworks eingeführt, das in der Lage ist, mehrere Vision-Aufgaben nativ zu handhaben. Es geht über reine Begrenzungsrahmen hinaus und wurde von Grund auf für maximale Vielseitigkeit und Effizienz konzipiert.

YOLO11 bietet eine optimierte Benutzererfahrung durch das ultralytics Python-Paket und besticht durch eine einfache API, die Objekterkennung, Instanzsegmentierung, Klassifizierung, Pose-Schätzung und orientierte Begrenzungsrahmen (OBB) vereint. Es erzielt ein sehr vorteilhaftes Gleichgewicht zwischen Geschwindigkeit und Genauigkeit, was es ideal für verschiedene reale Bereitstellungsszenarien macht.

Erfahre mehr über YOLO11

Integrierte Plattform

Beide Modelle profitieren von dem gut gepflegten Ökosystem, das die Ultralytics Platform bereitstellt. Diese integrierte Umgebung vereinfacht die Datensatzannotation, das Cloud-Training und den Modellexport für verschiedene Hardwareziele.

Link to this sectionVergleich von Leistung und Metriken#

Ein direkter Vergleich dieser Modelle zeigt, wie sich architektonische Verfeinerungen in greifbare Leistungszuwächse übersetzen. Die folgende Tabelle veranschaulicht die mittlere durchschnittliche Präzision (mAP), die auf dem COCO-Datensatz evaluiert wurde, sowie die CPU- und GPU-Inferenzgeschwindigkeiten und Parameterzahlen.

ModellGröße
(Pixel)
mAPval
50-95
Geschwindigkeit
CPU ONNX
(ms)
Geschwindigkeit
T4 TensorRT10
(ms)
Parameter
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049,0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02,59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Link to this sectionAnalyse der Ergebnisse#

Die Metriken unterstreichen einen klaren Sprung in der Leistungsbilanz, die von YOLO11 erreicht wurde. So erzielt das YOLO11n (nano)-Modell eine mAP von 39,5 % im Vergleich zu 28,0 % bei YOLOv5n, während gleichzeitig die CPU-Inferenzzeit bei einem Export via ONNX reduziert wird. Darüber hinaus behält YOLO11 beim Training deutlich geringere Speicheranforderungen bei als schwere Transformer-basierte Modelle, was es für die Bereitstellung auf Konsumer-Hardware und Edge-Geräten sehr zugänglich macht.

Link to this sectionArchitektonische Unterschiede#

Die Leistungsverbesserungen in YOLO11 resultieren aus mehreren wichtigen architektonischen Entwicklungen. Während YOLOv5 ein standardmäßiges CSPNet-Backbone mit C3-Modulen verwendete, führte YOLO11 effizientere Merkmalsextraktionsblöcke wie C2f und später C3k2 ein, die den Gradientenfluss optimieren und den Rechenaufwand reduzieren.

YOLO11 verfügt zudem über einen stark verfeinerten Kopf. Weg vom Anchor-basierten Design älterer Modelle, verfolgen neuere Ultralytics-Architekturen einen Anchor-freien Ansatz. Dies reduziert die Anzahl der Box-Vorhersagen, vereinfacht die Nachbearbeitungs-Pipeline und verbessert die Fähigkeit des Modells, über verschiedene Skalen und Seitenverhältnisse hinweg zu generalisieren. Zusätzlich bieten diese Modelle eine überlegene Trainingseffizienz und leicht verfügbare vortrainierte Gewichte, die die Konvergenz auf feinabgestimmten Datensätzen beschleunigen.

Link to this sectionImplementierung und Codebeispiele#

Eines der herausragenden Merkmale des Ultralytics-Ökosystems ist seine Einfachheit. Während YOLOv5 die Verwendung von torch.hub für schnelle Inferenz populär machte, geht YOLO11 mit dem vereinheitlichten ultralytics Python-Paket einen Schritt weiter.

Link to this sectionTraining mit YOLO11#

Das Laden, Trainieren und Validieren eines Modells erfordert minimalen Boilerplate-Code. Die API handhabt Hyperparameter-Tuning und Modellverwaltung nahtlos.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11s.pt")

# Train on a custom dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run fast inference and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

# Easily export the model to TensorRT for hardware acceleration
model.export(format="engine")

Link to this sectionLegacy-Inferenz mit YOLOv5#

Wenn du eine ältere Pipeline wartest, lässt sich YOLOv5 direkt in den nativen Lademechanismus von PyTorch integrieren, wodurch es trivial ist, es in bestehende Inferenzskripte einzubinden.

import torch

# Load a custom or pretrained YOLOv5 model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")

# Perform inference on an image URL
results = model("https://ultralytics.com/images/zidane.jpg")

# Print prediction details to the console
results.print()
Deployment-Flexibilität

Beide Modelle unterstützen umfangreiche Exportformate. Egal, ob du ein NVIDIA Jetson mit TensorRT oder eine iOS-Anwendung mit CoreML anvisierst, der Bereitstellungsprozess ist gründlich dokumentiert und wird von der Community unterstützt.

Link to this sectionIdeale Anwendungsfälle#

Die Entscheidung zwischen diesen Modellen hängt weitgehend von der Lebenszyklusphase deines Projekts und spezifischen Anforderungen ab.

Link to this sectionWann du YOLOv5 wählen solltest#

  • Wartung von Legacy-Codebasen: Wenn deine Produktionsumgebung stark um die YOLOv5-Repository-Struktur oder spezifische Hyperparameter-Evolution-Techniken angepasst ist.
  • Akademische Benchmarks: Wenn du Forschung veröffentlichst, die direkte Vergleiche mit etablierten Computer-Vision-Standards von 2020–2022 erfordert.

Link to this sectionWann du YOLO11 wählen solltest#

  • Multi-Task-Projekte: Wenn deine Anwendung eine Mischung aus Aufgaben wie Pose-Schätzung und Instanzsegmentierung über eine einzige, vereinheitlichte API erfordert.
  • Edge-Bereitstellungen: Für Edge-Computing-Szenarien, bei denen es entscheidend ist, für ein gegebenes Rechenbudget (FLOPs) die maximale mAP herauszuholen.
  • Kommerzielle KI-Lösungen: Ideal für Unternehmensanwendungen in Einzelhandel und Sicherheit, unter Nutzung der robusten Unterstützung der Ultralytics Platform.

Link to this sectionDie nächste Generation: Ultralytics YOLO26#

Während YOLO11 ein fantastisches Gleichgewicht zwischen Geschwindigkeit und Genauigkeit darstellt, entwickelt sich das Feld der künstlichen Intelligenz rasant weiter. Für Entwickler, die heute neue Projekte starten, empfehlen wir dringend, den neuesten Standard in Vision-KI zu erkunden: Ultralytics YOLO26.

YOLO26 wurde im Januar 2026 veröffentlicht und führt paradigmenwechselnde Fortschritte ein, die speziell für moderne Bereitstellungsanforderungen entwickelt wurden:

  • End-to-End NMS-freies Design: Basierend auf Konzepten, die zuerst in YOLOv10 erprobt wurden, ist YOLO26 nativ End-to-End. Es eliminiert die Notwendigkeit für eine Non-Maximum Suppression (NMS)-Nachbearbeitung, was Bereitstellungs-Pipelines erheblich vereinfacht und die Latenz reduziert.
  • MuSGD-Optimierer: Inspiriert von Innovationen im LLM-Training von Modellen wie Moonshot AIs Kimi K2, sorgt diese Hybrid-Lösung aus SGD und Muon für ein unglaublich stabiles Training und eine dramatisch schnellere Konvergenz.
  • Beispiellose CPU-Geschwindigkeit: Durch das Entfernen von Distribution Focal Loss (DFL) erreicht YOLO26 eine bis zu 43 % schnellere CPU-Inferenz, was es zur absolut besten Wahl für Edge-Geräte und Umgebungen ohne dedizierte GPUs macht.
  • Fortgeschrittene Verlustfunktionen: Die Integration von ProgLoss und STAL liefert bemerkenswerte Verbesserungen bei der Erkennung kleiner Objekte, was für Drohnen-Analytik, IoT und Robotik entscheidend ist.
  • Aufgabenspezifische Erweiterungen: Es führt spezialisierte Optimierungen ein, wie die Residual Log-Likelihood Estimation (RLE) für Pose und spezialisierten Winkelverlust für orientierte Begrenzungsrahmen, wodurch eine überlegene Leistung bei allen Computer-Vision-Aufgaben gewährleistet wird.

Erfahre mehr über YOLO26

Für Benutzer, die an spezialisierten Architekturen jenseits der Standard-Objekterkennung interessiert sind, könntest du auch Modelle wie RT-DETR für Transformer-basierte Erkennung oder YOLO-World für Open-Vocabulary-Tracking und Erkennung erkunden. Die Nutzung dieser gut gepflegten, hochoptimierten Tools stellt sicher, dass deine Computer-Vision-Pipelines effizient, skalierbar und auf dem neuesten Stand bleiben.

Kommentare