Meet YOLO26: next-gen vision AI.

Link to this sectionModellvergleiche: Wähle das beste Objekterkennungsmodell für dein Projekt#

Die Wahl der richtigen neuronalen Netzwerkarchitektur ist der Grundstein jedes erfolgreichen Computer Vision-Projekts. Willkommen im Ultralytics Model Comparison Hub! Diese Seite bündelt detaillierte technische Analysen und Leistungsbenchmarks und analysiert die Kompromisse zwischen dem neuesten Ultralytics YOLO26 und anderen führenden Architekturen wie YOLO11, YOLOv10, RT-DETR und EfficientDet.

Egal, ob deine Anwendung die Millisekunden-Latenz von Edge AI erfordert oder die hohe Präzision für die medizinische Bildgebung, dieser Leitfaden liefert die datengesteuerten Erkenntnisse, die du für eine fundierte Entscheidung benötigst. Wir bewerten Modelle basierend auf mean Average Precision (mAP), Inferenzgeschwindigkeit, Parametereffizienz und der Einfachheit der Bereitstellung.

Link to this sectionInteraktive Leistungsbenchmarks#

Die Visualisierung des Verhältnisses zwischen Geschwindigkeit und Genauigkeit ist entscheidend, um die "Pareto-Front" der Objekterkennung zu identifizieren—Modelle, die für eine gegebene Geschwindigkeitsbeschränkung die beste Genauigkeit bieten. Die folgende Tabelle vergleicht wichtige Metriken auf Standard-Datensätzen wie COCO.

Dieses Diagramm visualisiert wichtige Leistungsmetriken, mit denen du die Kompromisse zwischen verschiedenen Modellen schnell bewerten kannst. Das Verständnis dieser Metriken ist grundlegend für die Auswahl eines Modells, das deinen spezifischen Bereitstellungsbeschränkungen entspricht.

Link to this sectionKurzer Entscheidungsleitfaden#

Du weißt nicht, wo du anfangen sollst? Nutze diesen Entscheidungsbaum, um die Architektur einzugrenzen, die am besten zu deiner Hardware und deinen Leistungsanforderungen passt.

graph TD
    A[Start: Define Project Needs] --> B{Deployment Hardware?}
    B -- "Edge / Mobile (CPU/NPU)" --> C{Latency Priority?}
    B -- "Cloud / GPU" --> D{Accuracy vs Speed?}

    C -- "Extreme Speed (Real-time)" --> E[YOLO26n / YOLO26s]
    C -- "Balanced Legacy" --> F[YOLO11s / YOLOv8s]

    D -- "Max Accuracy (SOTA)" --> G[YOLO26x / YOLO26l]
    D -- "Balanced Performance" --> H[YOLO26m / YOLO11m]

    A --> I{Specialized Features?}
    I -- "NMS-Free Inference" --> J[YOLO26 / YOLOv10]
    I -- "Multitask (Seg/Pose/OBB)" --> K[YOLO26 / YOLO11]
    I -- "Video Analytics" --> L[YOLO26 + Tracking]

Link to this sectionDie aktuelle Landschaft: YOLO26 und darüber hinaus#

Der Bereich der Objekterkennung entwickelt sich schnell. Während ältere Modelle für die Unterstützung von Altsystemen relevant bleiben, verschieben neue Architekturen die Grenzen des Möglichen.

Link to this sectionUltralytics YOLO26#

Das im Januar 2026 veröffentlichte YOLO26 ist das neueste State-of-the-Art-Modell und der empfohlene Startpunkt für alle neuen Projekte. Es führt bahnbrechende architektonische Innovationen ein, darunter ein End-to-End NMS-Free Design, das die Notwendigkeit einer Non-Maximum Suppression-Nachbearbeitung eliminiert, was zu schnelleren und vorhersehbareren Inferenzzeiten führt. YOLO26 ist im Vergleich zu früheren Generationen bis zu 43% schneller auf CPUs, was es ideal für die Edge-Bereitstellung macht.

Zu den wichtigsten Innovationen gehören:

  • NMS-Free End-to-End: Vereinfachte Bereitstellung ohne erforderliche Nachbearbeitung
  • DFL-Entfernung: Optimierte Exporte nach ONNX, TensorRT und CoreML
  • MuSGD Optimizer: Hybrider SGD/Muon-Optimierer, inspiriert vom Training großer Sprachmodelle für stabile Konvergenz
  • ProgLoss + STAL: Verbesserte Leistung bei der Erkennung kleiner Objekte
Warum YOLO26 wählen?

YOLO26 repräsentiert den Höhepunkt der Ultralytics-Entwicklung und kombiniert das Beste aus CNN-Effizienz mit Transformer-ähnlichen End-to-End-Fähigkeiten. Es unterstützt alle Aufgaben—Erkennung, Segmentierung, Pose-Schätzung, Klassifizierung und OBB—und ist dabei kleiner, schneller und einfacher bereitzustellen als je zuvor.

Link to this sectionUltralytics YOLO11#

YOLO11 bleibt ein hochleistungsfähiges Modell und bietet eine Reduzierung der Parameter um 22% gegenüber YOLOv8 bei gleichzeitiger Verbesserung der Erkennungsgenauigkeit. Es wird vollständig unterstützt und für Benutzer empfohlen, die nachgewiesene Stabilität benötigen oder über bestehende YOLO11-Pipelines verfügen.

Link to this sectionCommunity-Modelle: Ein Hinweis zu YOLO12 und YOLO13#

Du triffst in Community-Diskussionen oder Repositories möglicherweise auf Verweise zu YOLO12 oder YOLO13.

Produktionshinweis

Wir empfehlen derzeit nicht, YOLO12 oder YOLO13 für den Produktionseinsatz zu verwenden.

  • YOLO12: Verwendet Attention-Layer, die oft zu Trainingsinstabilität, übermäßigem Speicherverbrauch und deutlich langsameren CPU-Inferenzgeschwindigkeiten führen.
  • YOLO13: Benchmarks zeigen nur marginale Genauigkeitsgewinne gegenüber YOLO11 bei gleichzeitigem höherem Speicherbedarf und langsamerer Ausführung. Gemeldete Ergebnisse haben Probleme mit der Reproduzierbarkeit gezeigt.


Watch: YOLO Models Comparison: Ultralytics YOLO11 vs. YOLOv10 vs. YOLOv9 vs. Ultralytics YOLOv8

Link to this sectionDetaillierte Modellvergleiche#

Entdecke unsere eingehenden technischen Vergleiche, um spezifische architektonische Unterschiede wie die Wahl des Backbones, das Head-Design und die Verlustfunktionen zu verstehen. Wir haben sie zur einfachen Übersicht nach Modellen sortiert:

Link to this sectionYOLO26 vs#

YOLO26 ist das neueste Ultralytics-Modell, das NMS-freie End-to-End-Erkennung, den MuSGD-Optimierer und eine bis zu 43% schnellere CPU-Inferenz bietet. Es ist für die Edge-Bereitstellung optimiert und erzielt gleichzeitig eine erstklassige Genauigkeit.

Link to this sectionYOLO11 vs#

YOLO11 baut mit modernster Forschung auf dem Erfolg seiner Vorgänger auf. Es zeichnet sich durch eine verbesserte Backbone- und Neck-Architektur für eine bessere Merkmalsextraktion und optimierte Effizienz aus.

Link to this sectionYOLOv10 vs#

Das von der Tsinghua-Universität entwickelte YOLOv10 konzentriert sich auf die Entfernung des Non-Maximum Suppression (NMS)-Schritts, um die Latenzvarianz zu reduzieren und eine erstklassige Leistung bei reduziertem Rechenaufwand zu bieten.

Link to this sectionYOLOv9 vs#

YOLOv9 führt Programmable Gradient Information (PGI) und das Generalized Efficient Layer Aggregation Network (GELAN) ein, um dem Informationsverlust in tiefen neuronalen Netzen entgegenzuwirken.

Link to this sectionYOLOv8 vs#

Ultralytics YOLOv8 bleibt eine sehr beliebte Wahl und bietet fortschrittliche Backbone- und Neck-Architekturen sowie einen anchor-freien Split-Head für optimale Genauigkeits-Geschwindigkeits-Kompromisse.

Link to this sectionYOLOv7 vs#

YOLOv7 führte "trainable bag-of-freebies" und Modell-Reparametrisierung ein, wobei der Fokus auf der Optimierung des Trainingsprozesses lag, ohne die Inferenzkosten zu erhöhen.

Link to this sectionYOLOv6 vs#

Das YOLOv6 von Meituan wurde für industrielle Anwendungen entwickelt und bietet Bi-directional Concatenation (BiC)-Module sowie anchor-aided Trainingsstrategien.

Link to this sectionYOLOv5 vs#

Ultralytics YOLOv5 ist bekannt für seine einfache Bedienung, Stabilität und Geschwindigkeit. Es bleibt eine robuste Wahl für Projekte, die eine breite Gerätekompatibilität erfordern.

Link to this sectionRT-DETR vs#

RT-DETR (Real-Time Detection Transformer) nutzt Vision Transformer, um eine hohe Genauigkeit bei Echtzeitleistung zu erreichen und glänzt beim Verständnis des globalen Kontexts.

Link to this sectionPP-YOLOE+ vs#

PP-YOLOE+, entwickelt von Baidu, verwendet Task Alignment Learning (TAL) und einen entkoppelten Kopf, um Effizienz und Genauigkeit in Einklang zu bringen.

Link to this sectionDAMO-YOLO vs#

Das von der Alibaba Group entwickelte DAMO-YOLO nutzt Neural Architecture Search (NAS) und ein effizientes RepGFPN, um die Genauigkeit auf statischen Benchmarks zu maximieren.

Link to this sectionYOLOX vs#

YOLOX, entwickelt von Megvii, ist eine anchor-freie Weiterentwicklung, die für ihren entkoppelten Kopf und die SimOTA-Label-Zuweisungsstrategie bekannt ist.

Link to this sectionEfficientDet vs#

EfficientDet von Google Brain nutzt Compound Scaling und BiFPN zur Optimierung der Parametereffizienz und bietet ein Spektrum an Modellen (D0-D7) für verschiedene Anforderungen.

Dieser Index wird laufend aktualisiert, sobald neue Modelle veröffentlicht und Benchmarks verfeinert werden. Wir laden dich ein, diese Ressourcen zu erkunden, um die perfekte Lösung für dein nächstes Computer-Vision-Projekt zu finden. Wenn du nach Lösungen für Unternehmen mit privater Lizenzierung suchst, besuche bitte unsere Lizenzierungsseite. Viel Erfolg beim Vergleichen!

Kommentare