YOLO11 YOLOv5: Ein umfassender technischer Vergleich der Ultralytics
Die Auswahl der richtigen neuronalen Netzwerkarchitektur ist eine entscheidende Entscheidung für jedes Computer-Vision-Projekt. Mit der Weiterentwicklung der künstlichen Intelligenz entwickeln sich auch die Tools weiter, die Entwicklern und Forschern zur Verfügung stehen. Dieser umfassende Leitfaden bietet einen detaillierten technischen Vergleich zwischen zwei wegweisenden Modellen aus dem Ultralytics -Ökosystems: dem viel gepriesenen YOLOv5 dem fortschrittlichen YOLO11.
Unabhängig davon, ob Sie leichtgewichtige Modelle für Edge-KI-Anwendungen einsetzen oder hochauflösende Videostreams auf Cloud-GPUs verarbeiten, können Sie durch das Verständnis der architektonischen Nuancen, Leistungskennzahlen und idealen Anwendungsfälle für diese Modelle eine datengestützte Entscheidung für Ihre spezifischen Einsatzbedingungen treffen.
Modellreihe und technische Details
Beide Modelle spiegeln das Engagement Ultralytics für Open-Source-Zusammenarbeit, robuste Leistung und beispiellose Benutzerfreundlichkeit wider, wodurch sie bei der globalen Machine-Learning-Community sehr beliebt sind.
YOLO11
- Autoren: Glenn Jocher und Jing Qiu
- Organisation: Ultralytics
- Datum: 27.09.2024
- GitHub: ultralytics
- Dokumente: YOLO11
YOLOv5
- Autoren: Glenn Jocher
- Organisation: Ultralytics
- Datum: 26.06.2020
- GitHub: yolov5
- Dokumente: YOLOv5
Architektonische Unterschiede
Die Weiterentwicklung von YOLOv5 YOLO11 mehrere tiefgreifende architektonische Veränderungen YOLO11 , die darauf abzielen, die Genauigkeit und Parametereffizienz zu optimieren.
YOLOv5 ein Vorreiter im Bereich PyTorch Ökosystem und führte ein hochoptimiertes CSPNet (Cross Stage Partial Network) Backbone und ein PANet (Path Aggregation Network) Neck ein. Es basierte auf einer ankerbasierten Erkennung, die vordefinierte Ankerboxen erforderte, um Objektgrenzen vorherzusagen. Diese Anker waren zwar sehr effektiv, aber ihre Anpassung an benutzerdefinierte Computer-Vision-Datensätze konnte mühsam sein.
Im Gegensatz dazu YOLO11 zu einem moderneren, ankerfreien Erkennungsparadigma. Dadurch entfällt die Notwendigkeit der manuellen Anpassung von Ankerboxen, was den Trainingsprozess rationalisiert und die Generalisierung über verschiedene Datensätze wie den COCO verbessert. Darüber hinaus YOLO11 einen entkoppelten Kopf, was bedeutet, dass Klassifizierungs- und Begrenzungsrahmen-Regressionsaufgaben in separaten Zweigen verarbeitet werden. Diese Trennung verbessert die Konvergenzgeschwindigkeit und die mittlere durchschnittliche Präzision (mAP) erheblich, insbesondere bei komplexen Objekterkennungsszenarien.
Leistungsmetriken und Benchmarks
Die folgende Tabelle vergleicht wichtige Kennzahlen für verschiedene Modellgrößen. Ultralytics sind bekannt für ihren geringen Speicherbedarf. Im Vergleich zu leistungsstarken transformatorbasierten Alternativen verbrauchen sie während des Trainings in der Regel weniger CUDA , was die Hardware-Einstiegshürde drastisch senkt.
| Modell | Größe (Pixel) | mAPval 50-95 | Geschwindigkeit CPU ONNX (ms) | Geschwindigkeit T4 TensorRT10 (ms) | Parameter (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Wie beobachtet, YOLO11 eine äußerst günstige Leistungsbilanz und liefert bei vergleichbarer Parameteranzahl durchweg höhere mAP als seine YOLOv5 .
Trainingsmethoden und Benutzerfreundlichkeit
Ein zentraler Grundsatz der Ultralytics ist außergewöhnliche Benutzerfreundlichkeit, unterstützt durch ein gut gepflegtes Ökosystem und umfangreiche Community-Unterstützung.
YOLOv5 stützte sich YOLOv5 auf robuste Skripte für die Befehlszeilenschnittstelle (CLI) (train.py, detect.py) zur Ausführung. Obwohl diese Skripte sehr leistungsfähig sind, erforderte ihre direkte Integration in benutzerdefinierte Python oft Umgehungslösungen.
YOLO11 dies durch die Einführung des optimierten ultralytics Python . Diese einheitliche API übernimmt alles vom Training bis zur Exportieren von Modellen Formate wie ONNX, OpenVINOund TensorRT nativ.
Optimierte Bereitstellung mit Ultralytics
Für eine vollständig codefreie Erfahrung können Entwickler die Ultralytics nutzen, um Daten zu annotieren, Modelle in der Cloud zu trainieren und sie nahtlos auf Edge-Geräten bereitzustellen.
Code-Vergleich
Das Trainieren eines Ultralytics ist heute unglaublich effizient. So können Sie YOLO11 seiner nativen Python trainieren:
from ultralytics import YOLO
# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model on custom data
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Export the model to ONNX for deployment
model.export(format="onnx")
Bei Legacy-Systemen, die YOLOv5 verwenden, CLI das Training über CLI wie folgt CLI :
# Clone the repository and run the training script
git clone https://github.com/ultralytics/yolov5
cd yolov5
pip install -r requirements.txt
python train.py --img 640 --batch 16 --epochs 50 --data coco128.yaml --weights yolov5s.pt
Ideale Anwendungsfälle und reale Anwendungen
Beide Modelle verfügen über unterschiedliche Stärken, die auf verschiedene Einsatzumgebungen zugeschnitten sind.
Wann sollte YOLOv5 verwendet werden?
Trotz der neueren Generation YOLOv5 ein Kraftpaket. Es wird besonders empfohlen für:
- Integration von Altsystemen: Umgebungen, die tief in tensor spezifischen tensor oder Bereitstellungspipelines YOLOv5 integriert sind und nicht ohne Weiteres umgestaltet werden können.
- Akademische Basiswerte: Forscher, die etablierte, langjährige Basiswerte für reproduzierbare akademische Studien in der medizinischen Bildanalyse benötigen.
Wann sollte YOLO11 verwendet werden?
YOLO11 aufgrund seiner unglaublichen Vielseitigkeit die ideale Wahl für moderne Produktionspipelines:
- Multitasking-Umgebungen: Im Gegensatz zu YOLOv5, das in erster Linie ein Detektor ist (mit späteren Segmentierungserweiterungen), unterstützt YOLO11 Instanzsegmentierung, Bildklassifizierung, Posenschätzung und Oriented Bounding Box (OBB) -Erkennung.
- Hochauflösende Videoanalyse: Ideal für intelligente Verkehrssysteme oder die Bestandsverwaltung im Einzelhandel, wo es entscheidend ist, aus komplexen Szenen maximale Präzision herauszuholen.
Ausblick: Die YOLO26-Architektur
Während YOLO11 einen außergewöhnlichen Standard YOLO11 , schreitet die Entwicklung im Bereich Computer Vision weiterhin rasant voran. Entwickler, die nach absoluter Effizienz streben, sollten auch das neueste Ultralytics (veröffentlicht im Januar 2026) in Betracht ziehen.
YOLO26 stellt einen enormen Fortschritt dar und wurde speziell für die Optimierung am Netzwerkrand und für den Einsatz in Unternehmen entwickelt. Zu den wichtigsten Neuerungen zählen:
- End-to-End-Design NMS: YOLO26 ist von Haus aus End-to-End-fähig, wodurch die Nachbearbeitung mit Non-Maximum Suppression (NMS) entfällt und eine schnellere, einfachere Bereitstellung ermöglicht wird.
- DFL-Entfernung: Distribution Focal Loss wurde entfernt, um den Modellexport zu vereinfachen und die Kompatibilität mit Geräten mit geringem Stromverbrauch zu verbessern.
- MuSGD Optimizer: Eine bahnbrechende Kombination aus SGD Muon, die LLM-Trainingsstabilität in die Computer Vision bringt und so eine schnellere Konvergenz ermöglicht.
- Bis zu 43 % schnellere CPU : Stark optimiert für IoT-Bereitstellungen und Geräte ohne dedizierte GPUs.
- ProgLoss + STAL: Drastisch verbesserte Verlustfunktionen, die zu bemerkenswerten Verbesserungen bei der Erkennung kleiner Objekte führen, was für Luftaufnahmen mit Drohnen von entscheidender Bedeutung ist.
Zusammenfassung
Die Wahl zwischen YOLO11 YOLOv5 hängt YOLOv5 von der Lebenszyklusphase Ihres Projekts ab. Die Vorzüge YOLOv5 sind unbestreitbar, da es extreme Stabilität und massive Unterstützung durch die Community bietet. Für jedes neue Projekt gilt jedoch: YOLO11 gegenüber älteren Generationen. Es kombiniert modernste Genauigkeit, eine außergewöhnlich elegante Python und einen geringeren Speicherbedarf für das Training und festigt damit die Position Ultralytics an der Spitze der KI-Innovation. Für diejenigen, die die Grenzen noch weiter verschieben möchten, wird die Erkundung des hochmodernen YOLO26 auf der Ultralytics zu beispiellosen Ergebnissen führen.