YOLOv5 vs YOLO11: Ein technischer Vergleich
Die Wahl des richtigen Objekterkennungsmodells ist eine wichtige Entscheidung, bei der ein Gleichgewicht zwischen dem Bedarf an Genauigkeit, Geschwindigkeit und Ressourceneffizienz gefunden werden muss. Diese Seite bietet einen detaillierten technischen Vergleich zwischen zwei wegweisenden Modellen von Ultralytics: dem weit verbreiteten Ultralytics YOLOv5 und dem hochmodernen Ultralytics YOLO11. Während YOLOv5 einen Industriestandard für Leistung und Benutzerfreundlichkeit setzte, stellt YOLO11 die nächste Evolution dar und bietet überlegene Genauigkeit, größere Vielseitigkeit und verbesserte Effizienz innerhalb desselben leistungsstarken Ultralytics-Ökosystems.
Ultralytics YOLOv5: Der etablierte Industriestandard
YOLOv5 wurde 2020 veröffentlicht und entwickelte sich schnell zu einem der beliebtesten Objekterkennungsmodelle der Welt. Sein Ruf basiert auf einer außergewöhnlichen Kombination aus Geschwindigkeit, Zuverlässigkeit und Benutzerfreundlichkeit, was es zu einer Go-to-Wahl für unzählige Entwickler und Forscher macht.
Technische Details:
- Autoren: Glenn Jocher
- Organisation: Ultralytics
- Datum: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- Docs: https://docs.ultralytics.com/models/yolov5/
Architektur und Hauptmerkmale
YOLOv5 basiert auf PyTorch und verfügt über ein CSPDarknet53-Backbone in Kombination mit einem PANet-Neck für eine effektive Feature-Aggregation. Seine Architektur ist hoch skalierbar und bietet eine Reihe von Modellen, vom kleinen und schnellen YOLOv5n bis zum großen und genauen YOLOv5x. Ein Hauptmerkmal von YOLOv5 ist sein ankerbasierter Erkennungskopf, der zum Zeitpunkt seiner Veröffentlichung sehr effektiv war.
Stärken
- Außergewöhnliche Inferenzgeschwindigkeit: YOLOv5 ist hochgradig für schnelle Inferenz optimiert und somit eine robuste Wahl für Echtzeitanwendungen, insbesondere auf GPU-Hardware.
- Ausgereiftes Ökosystem: Als etabliertes Modell profitiert YOLOv5 von einer riesigen Community, umfangreichen Tutorials und breiter Unterstützung durch Dritte. Es ist in zahlreichen Produktionsumgebungen praxiserprobt.
- Benutzerfreundlichkeit: Bekannt für seine einfache API und umfassende Dokumentation, ermöglicht YOLOv5 eine schnelle Prototypentwicklung und Bereitstellung. Das Modell ist nahtlos in das Ultralytics-Ökosystem integriert, einschließlich Ultralytics HUB für No-Code-Training.
- Trainingseffizienz: YOLOv5 bietet einen effizienten Trainingsprozess mit leicht verfügbaren vortrainierten Gewichten, was effektives Transferlernen und schnellere Entwicklungszyklen ermöglicht.
Schwächen
- Anchor-Based Detection: Seine Abhängigkeit von vordefinierten Anchor-Boxen kann manchmal eine sorgfältige Abstimmung für Datensätze mit ungewöhnlich geformten Objekten erfordern, eine Einschränkung, die durch neuere ankerfreie Detektoren behoben wird.
- Genauigkeitsgrenze: Obwohl es immer noch sehr genau ist, wurde seine Leistung auf Benchmarks wie COCO von neueren Architekturen wie YOLO11 übertroffen.
Ideale Anwendungsfälle
YOLOv5 bleibt eine ausgezeichnete Wahl für Anwendungen, bei denen Geschwindigkeit und Stabilität von größter Bedeutung sind:
- Edge Computing: Seine kleineren Varianten eignen sich perfekt für den Einsatz auf ressourcenbeschränkten Geräten wie Raspberry Pi und NVIDIA Jetson.
- Echtzeitüberwachung: Unterstützung von Sicherheitssystemen und Überwachungsanwendungen, die eine hohe FPS erfordern.
- Industrielle Automatisierung: Wird für die Qualitätskontrolle und die Prozessautomatisierung in Fertigungsumgebungen eingesetzt.
Ultralytics YOLO11: Die nächste Evolutionsstufe in der Vision AI
YOLO11 ist das neueste State-of-the-Art-Modell von Ultralytics, das entwickelt wurde, um die Grenzen des Möglichen im Bereich Computer Vision zu erweitern. Es baut auf den Erfolgen seiner Vorgänger, einschließlich YOLOv8, auf, um signifikante Verbesserungen in Bezug auf Genauigkeit, Geschwindigkeit und Vielseitigkeit zu erzielen.
Technische Details:
- Autoren: Glenn Jocher, Jing Qiu
- Organisation: Ultralytics
- Datum: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Doku: https://docs.ultralytics.com/models/yolo11/
Architektur und Hauptmerkmale
YOLO11 führt eine verfeinerte Netzwerkarchitektur mit fortschrittlichen Merkmalsextraktionsfunktionen und einem optimierten Design ein. Eine wichtige Neuerung ist sein ankerfreier Detektionskopf, der die Generalisierung verbessert und den Trainingsprozess vereinfacht. Dieses moderne Design ermöglicht es YOLO11, eine höhere Genauigkeit mit einer effizienteren Nutzung der Parameter zu erzielen, was zu schnelleren Inferenzgeschwindigkeiten und geringeren Rechenanforderungen führt.
Stärken
- Modernste Leistung: YOLO11 setzt einen neuen Standard für die Genauigkeit und erzielt höhere mAP-Werte als YOLOv5 über alle Modellgrößen hinweg.
- Verbesserte Vielseitigkeit: YOLO11 ist ein echtes Multi-Tasking-Framework, das Objekterkennung, Instanzsegmentierung, Bildklassifizierung, Pose-Schätzung und orientierte Begrenzungsrahmen (OBB) innerhalb eines einzigen, einheitlichen Modells unterstützt.
- Überlegene Effizienz: Das Modell ist hocheffizient und bietet ein besseres Verhältnis von Geschwindigkeit zu Genauigkeit. Insbesondere zeigt es eine deutlich schnellere Inferenz auf CPUs im Vergleich zu YOLOv5, wodurch es für eine größere Bandbreite an Hardware zugänglich ist. Es benötigt auch weniger Speicher für Training und Inferenz als viele andere Architekturen.
- Optimierte Benutzererfahrung: Als Teil des Ultralytics-Ökosystems setzt YOLO11 das gleiche Engagement für Benutzerfreundlichkeit mit einer einfachen Python API, einer leistungsstarken CLI und einer umfangreichen Dokumentation fort.
Schwächen
- Rechenbedarf für große Modelle: Obwohl die größten YOLO11-Modelle (z. B. YOLO11x) hocheffizient sind, benötigen sie dennoch erhebliche Rechenressourcen, um maximale Genauigkeit zu erzielen.
- Sich entwickelnde Integrationen: Als neueres Modell wächst das Ökosystem von Drittanbieter-Tools und Integrationen schnell, ist aber möglicherweise noch nicht so umfangreich wie das des seit langem etablierten YOLOv5.
Ideale Anwendungsfälle
YOLO11 ist die ideale Wahl für neue Projekte, die höchste Genauigkeit und Flexibilität erfordern:
- Fortschrittliche Robotik: Ermöglicht präzise Objektinteraktion und Navigation in komplexen, dynamischen Umgebungen.
- Gesundheitswesen und medizinische Bildgebung: Unterstützung von Aufgaben wie der Tumorerkennung, bei denen hohe Präzision entscheidend ist.
- Smart Cities: Ermöglicht hochentwickeltes Verkehrsmanagement und Systeme für öffentliche Sicherheit.
- Einzelhandelsanalytik: Verbesserung des Bestandsmanagements und der Analyse des Kundenverhaltens mit höherer Genauigkeit.
Direkter Leistungsvergleich: YOLOv5 vs. YOLO11
Die Leistungsmetriken veranschaulichen deutlich die Fortschritte, die mit YOLO11 erzielt wurden. Durchweg liefern YOLO11-Modelle einen deutlichen Schub in der mAP, während sie die Inferenzgeschwindigkeit beibehalten oder sogar verbessern. Zum Beispiel erreicht YOLO11s einen mAP-Wert von 47,0, was mit YOLOv5l vergleichbar ist, aber mit weitaus weniger Parametern und deutlich schnellerer CPU-Inferenz. In ähnlicher Weise übertrifft YOLO11m YOLOv5x in der Genauigkeit (51,5 vs. 50,7 mAP), während es auf einer CPU über 4-mal schneller ist.
Modell | Größe (Pixel) |
mAPval 50-95 |
Geschwindigkeit CPU ONNX (ms) |
Geschwindigkeit T4 TensorRT10 (ms) |
Parameter (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Fazit: Welches Modell sollten Sie wählen?
Während YOLOv5 ein solides und zuverlässiges Modell bleibt, ist YOLO11 der klare Nachfolger und die empfohlene Wahl für fast alle neuen Projekte. Es bietet einen deutlichen Leistungssprung mit höherer Genauigkeit, größerer Aufgabenvielfalt und verbesserter Effizienz, ohne dabei die Benutzerfreundlichkeit zu beeinträchtigen, die seine Vorgänger so beliebt gemacht hat.
-
Wählen Sie YOLOv5, wenn Sie an einem Legacy-Projekt arbeiten, das es bereits verwendet, oder wenn Ihre primäre Einschränkung das Deployment auf Hardware ist, bei der seine spezifischen GPU-Geschwindigkeitsoptimierungen einen entscheidenden Vorteil bieten.
-
Wählen Sie YOLO11 für jede neue Anwendung. Seine überlegene Genauigkeit, das ankerfreie Design, die Multi-Task-Fähigkeiten und die hervorragende Leistung sowohl auf der CPU als auch auf der GPU machen es zur leistungsstärkeren, flexibleren und zukunftssicheren Lösung.
Beide Modelle werden durch das robuste Ultralytics-Ökosystem unterstützt, das eine reibungslose Entwicklungserfahrung mit exzellentem Support und Dokumentation gewährleistet.
Weitere Modellvergleiche entdecken
Wenn Sie daran interessiert sind, wie diese Modelle im Vergleich zu anderen führenden Architekturen abschneiden, sehen Sie sich unsere anderen Vergleichsseiten an: