YOLO11 YOLOv5: Ein umfassender technischer Vergleich der Ultralytics

Die Auswahl der richtigen neuronalen Netzwerkarchitektur ist eine entscheidende Entscheidung für jedes Computer-Vision-Projekt. Mit der Weiterentwicklung der künstlichen Intelligenz entwickeln sich auch die Tools weiter, die Entwicklern und Forschern zur Verfügung stehen. Dieser umfassende Leitfaden bietet einen detaillierten technischen Vergleich zwischen zwei wegweisenden Modellen aus dem Ultralytics -Ökosystems: dem viel gepriesenen YOLOv5 dem fortschrittlichen YOLO11.

Unabhängig davon, ob Sie leichtgewichtige Modelle für Edge-KI-Anwendungen einsetzen oder hochauflösende Videostreams auf Cloud-GPUs verarbeiten, können Sie durch das Verständnis der architektonischen Nuancen, Leistungskennzahlen und idealen Anwendungsfälle für diese Modelle eine datengestützte Entscheidung für Ihre spezifischen Einsatzbedingungen treffen.

Modellreihe und technische Details

Beide Modelle spiegeln das Engagement von Ultralytics für Open-Source-Zusammenarbeit, robuste Leistung und unübertroffene Benutzerfreundlichkeit wider, was sie in der globalen Community des maschinellen Lernens sehr beliebt macht.

YOLO11

Autoren: Glenn Jocher und Jing Qiu
Organisation: Ultralytics
Datum: 27.09.2024
GitHub: ultralytics
Dokumente: YOLO11

Erfahren Sie mehr über YOLO11

YOLOv5

Autoren: Glenn Jocher
Organisation: Ultralytics
Datum: 26.06.2020
GitHub: yolov5
Dokumentation: YOLOv5 Dokumentation

Erfahren Sie mehr über YOLOv5

Architektonische Unterschiede

Die Weiterentwicklung von YOLOv5 YOLO11 mehrere tiefgreifende architektonische Veränderungen YOLO11 , die darauf abzielen, die Genauigkeit und Parametereffizienz zu optimieren.

YOLOv5 ein Vorreiter im Bereich PyTorch Ökosystem und führte ein hochoptimiertes CSPNet (Cross Stage Partial Network) Backbone und ein PANet (Path Aggregation Network) Neck ein. Es basierte auf einer ankerbasierten Erkennung, die vordefinierte Ankerboxen erforderte, um Objektgrenzen vorherzusagen. Diese Anker waren zwar sehr effektiv, aber ihre Anpassung an benutzerdefinierte Computer-Vision-Datensätze konnte mühsam sein.

Im Gegensatz dazu YOLO11 zu einem moderneren, ankerfreien Erkennungsparadigma. Dadurch entfällt die Notwendigkeit der manuellen Anpassung von Ankerboxen, was den Trainingsprozess rationalisiert und die Generalisierung über verschiedene Datensätze wie den COCO verbessert. Darüber hinaus YOLO11 einen entkoppelten Kopf, was bedeutet, dass Klassifizierungs- und Begrenzungsrahmen-Regressionsaufgaben in separaten Zweigen verarbeitet werden. Diese Trennung verbessert die Konvergenzgeschwindigkeit und die mittlere durchschnittliche Präzision (mAP) erheblich, insbesondere bei komplexen Objekterkennungsszenarien.

Leistungsmetriken und Benchmarks

Die folgende Tabelle vergleicht wichtige Kennzahlen für verschiedene Modellgrößen. Ultralytics sind bekannt für ihren geringen Speicherbedarf. Im Vergleich zu leistungsstarken transformatorbasierten Alternativen verbrauchen sie während des Trainings in der Regel weniger CUDA , was die Hardware-Einstiegshürde drastisch senkt.

Modell	Größe ^(Pixel)	mAP^val 50-95	Geschwindigkeit ^{CPU ONNX (ms)}	Geschwindigkeit ^{T4 TensorRT10 (ms)}	Parameter ^(M)	FLOPs ^(B)
YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

YOLOv5n	640	28.0	73.6	1.12	2.6	7.7
YOLOv5s	640	37.4	120.7	1.92	9.1	24.0
YOLOv5m	640	45.4	233.9	4.03	25.1	64.2
YOLOv5l	640	49.0	408.4	6.61	53.2	135.0
YOLOv5x	640	50.7	763.2	11.89	97.2	246.4

Wie beobachtet, erreicht YOLO11 eine äußerst günstige Leistungsbilanz, indem es durchweg höhere mAP-Werte bei vergleichbaren Parameterzahlen im Vergleich zu seinen YOLOv5-Pendants liefert.

Trainingsmethoden und Benutzerfreundlichkeit

Ein Kernprinzip der Ultralytics-Philosophie ist die außergewöhnliche Benutzerfreundlichkeit, unterstützt durch ein gut gepflegtes Ökosystem und umfassenden Community-Support.

YOLOv5 stützte sich YOLOv5 auf robuste Skripte für die Befehlszeilenschnittstelle (CLI) (train.py, detect.py) zur Ausführung. Obwohl leistungsstark, erforderte die direkte Integration dieser Skripte in benutzerdefinierte python-Anwendungen oft Umgehungslösungen.

YOLO11 dies durch die Einführung des optimierten ultralytics Python . Diese einheitliche API übernimmt alles vom Training bis zur Exportieren von Modellen Formate wie ONNX, OpenVINOund TensorRT nativ.

Optimierte Bereitstellung mit Ultralytics

Für eine vollständig codefreie Erfahrung können Entwickler die Ultralytics nutzen, um Daten zu annotieren, Modelle in der Cloud zu trainieren und sie nahtlos auf Edge-Geräten bereitzustellen.

Code-Vergleich

Das Trainieren eines Ultralytics ist heute unglaublich effizient. So können Sie YOLO11 seiner nativen Python trainieren:

from ultralytics import YOLO

# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model on custom data
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Export the model to ONNX for deployment
model.export(format="onnx")

Bei Legacy-Systemen, die YOLOv5 verwenden, CLI das Training über CLI wie folgt CLI :

# Clone the repository and run the training script
git clone https://github.com/ultralytics/yolov5
cd yolov5
pip install -r requirements.txt

python train.py --img 640 --batch 16 --epochs 50 --data coco128.yaml --weights yolov5s.pt

Ideale Anwendungsfälle und reale Anwendungen

Beide Modelle besitzen unterschiedliche Stärken, die auf verschiedene Betriebsumgebungen zugeschnitten sind.

Wann sollte YOLOv5 verwendet werden?

Trotz der neueren Generation bleibt YOLOv5 ein Kraftpaket. Es wird dringend empfohlen für:

Integration älterer Systeme: Umgebungen, die tief in die spezifischen tensor-Strukturen von YOLOv5 oder Bereitstellungspipelines integriert sind, die nicht einfach refaktoriert werden können.
Academic Baselines: Forscher, die etablierte, langjährige Baselines für reproduzierbare akademische Studien in der medizinischen Bildanalyse benötigen.

Wann sollte YOLO11 verwendet werden?

YOLO11 aufgrund seiner unglaublichen Vielseitigkeit die ideale Wahl für moderne Produktionspipelines:

Multi-Task-Umgebungen: Im Gegensatz zu YOLOv5, das primär ein detector ist (mit späteren segment-Ergänzungen), unterstützt YOLO11 nativ Instanz-segment, Bildklassifizierung, Pose Estimation und Oriented Bounding Box (OBB) detection sofort einsatzbereit.
Hochdichte Videoanalyse: Ideal für intelligente Verkehrssysteme oder Bestandsmanagement im Einzelhandel, wo die Gewinnung maximaler Präzision aus komplexen Szenen entscheidend ist.

Ausblick: Die YOLO26-Architektur

Während YOLO11 einen außergewöhnlichen Standard YOLO11 , schreitet die Entwicklung im Bereich Computer Vision weiterhin rasant voran. Entwickler, die nach absoluter Effizienz streben, sollten auch das neueste Ultralytics (veröffentlicht im Januar 2026) in Betracht ziehen.

YOLO26 stellt einen enormen Fortschritt dar und wurde speziell für die Optimierung am Netzwerkrand und für den Einsatz in Unternehmen entwickelt. Zu den wichtigsten Neuerungen zählen:

End-to-End NMS-freies Design: YOLO26 ist nativ End-to-End, wodurch die Non-Maximum Suppression (NMS)-Nachbearbeitung für eine schnellere, einfachere Bereitstellung entfällt.
DFL-Entfernung: Distribution Focal Loss wurde für einen vereinfachten Modell-Export und eine verbesserte Kompatibilität mit stromsparenden Geräten entfernt.
MuSGD-Optimierer: Ein bahnbrechender Hybrid aus SGD und Muon, der die LLM-Trainingsstabilität in die Computer Vision bringt, um eine schnellere Konvergenz zu ermöglichen.
Bis zu 43 % schnellere CPU-Inferenz: Stark optimiert für IoT-Implementierungen und Geräte ohne dedizierte GPUs.
ProgLoss + STAL: Drastisch verbesserte Verlustfunktionen, die bemerkenswerte Verbesserungen bei der Kleinstobjekterkennung erzielen, was für Luftbildaufnahmen von Drohnen entscheidend ist.

Erfahren Sie mehr über YOLO26

Zusammenfassung

Die Wahl zwischen YOLO11 und YOLOv5 hängt letztendlich von der Lebenszyklusphase Ihres Projekts ab. Das Erbe von YOLOv5 ist unbestreitbar und bietet extreme Stabilität sowie eine massive Unterstützung durch die Community. Für jedes neue Projekt wird jedoch YOLO11 gegenüber älteren Generationen dringend empfohlen. Es kombiniert modernste Genauigkeit, eine außergewöhnlich elegante Python-API und einen geringeren Trainingsspeicherbedarf, was die Position von Ultralytics an der Spitze der KI-Innovation festigt. Für diejenigen, die die Grenzen noch weiter verschieben möchten, liefert die Erkundung des hochmodernen YOLO26 auf der Ultralytics Platform unvergleichliche Ergebnisse.