YOLOv6-3.0 - YOLOv5: Nesne Tespiti için Teknik Bir Karşılaştırma
Bilgisayar görüşü projeniz için doğru mimariyi seçmek, performansı, dağıtım kolaylığını ve uzun vadeli bakımı etkileyen çok önemli bir karardır. Gerçek zamanlı nesne algılama alanındaki iki önemli yarışmacı, Meituan'ın YOLOv6-3.0'ı ve Ultralytics'in YOLOv5'idir. Bu kılavuz, geliştiricilerin ve araştırmacıların ham GPU verimliliğine mi yoksa çok yönlü, kullanımı kolay bir ekosisteme mi öncelik verdiklerine bakılmaksızın, kendi özel gereksinimleriyle en iyi şekilde örtüşen modeli seçmelerine yardımcı olmak için ayrıntılı bir teknik karşılaştırma sunar.
Performans Metrikleri Analizi
Aşağıdaki tablo, COCO veri kümesi üzerindeki performans metriklerinin doğrudan karşılaştırmasını sunmaktadır. YOLOv6-3.0, GPU cihazlarında en yüksek doğruluk sınırlarını zorlarken, Ultralytics YOLOv5 özellikle CPU'da olağanüstü verimlilik ve hafif varyantları için önemli ölçüde daha düşük model karmaşıklığı (parametreler ve FLOP'lar) konusundaki itibarını korumaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Analiz: Veriler, YOLOv5n (Nano) modelinin, en düşük parametre sayısına (2.6M) ve FLOP'lara (7.7B) sahip, kaynak kısıtlı ortamlar için öne çıkan bir model olduğunu ve bunun da üstün CPU çıkarım hızlarına dönüştüğünü vurgulamaktadır. Bu, bellek ve gücün kıt olduğu uç yapay zeka uygulamaları için oldukça uygundur. Tersine, YOLOv6-3.0, artan model boyutu pahasına daha yüksek mAPval'ı hedefler ve bu da onu özel GPU donanımına sahip endüstriyel kurulumlar için güçlü bir aday yapar.
Meituan YOLOv6-3.0: Endüstriyel Hassasiyet
Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Kuruluş: Meituan
Tarih: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
Belgeler: https://docs.ultralytics.com/models/yolov6/
Meituan tarafından geliştirilen YOLOv6-3.0, endüstriyel uygulamalar için uyarlanmış bir nesne algılama çerçevesidir. Özellikle GPU'larda donanım farkındalıklı performansı optimize ederek, çıkarım hızı ve doğruluk arasında uygun bir denge sağlamaya odaklanır.
Mimari ve Temel Özellikler
YOLOv6, verimli bir backbone tasarımı ve eğitim sırasında karmaşık özellik çıkarma yeteneklerini korurken çıkarım sırasında modeli basitleştiren yeniden parametrelendirilebilir bir yapı (RepVGG tarzı) içerir. Sürüm 3.0, performansı daha da artırmak için kendi kendine damıtma ve ankraj destekli bir eğitim stratejisi gibi teknikler sunmuştur.
Güçlü ve Zayıf Yönler
- Yüksek GPU Doğruluğu: COCO veri kümesinde rekabetçi mAP skorları sunarak üretimdeki kalite kontrol görevleri için uygun hale gelir.
- Kuantalama Desteği: Dağıtımı hızlandırmak için model kuantalaması için özel destek sunar.
- Sınırlı Çok Yönlülük: Öncelikli olarak nesne algılama için tasarlanmıştır ve diğer çerçevelerde bulunan örnek segmentasyonu veya poz tahmini gibi daha geniş görevler için yerel desteğe sahip değildir.
- Daha Yüksek Kaynak Yükü: Daha büyük varyantlar, eşdeğer hafif YOLOv5 modellerine kıyasla daha fazla bellek ve işlem gücü gerektirir.
YOLOv6 hakkında daha fazla bilgi edinin
Ultralytics YOLOv5: Ekosistem Standardı
Yazarlar: Glenn Jocher
Kuruluş: Ultralytics
Tarih: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Belgeler: https://docs.ultralytics.com/models/yolov5/
Ultralytics YOLOv5, kullanıcı odaklı tasarımı, güvenilirliği ve onu çevreleyen kapsamlı ekosistemi ile kutlanan, bilgisayarla görme alanında efsanevi bir modeldir. Hız, doğruluk ve kullanım kolaylığı dengesi nedeniyle dünya çapında en çok dağıtılan modellerden biri olmaya devam etmektedir.
Mimari ve Temel Özellikler
YOLOv5, sağlam özellik kaynaşması için bir PANet neck ile birleştirilmiş bir CSPDarknet backbone kullanır. Çeşitli veri kümelerinde oldukça kararlı olduğu kanıtlanmış, ankraj tabanlı bir algılama mekanizması kullanır. Mimari, gömülü cihazlardan bulut sunucularına kadar her şeye uyacak şekilde beş ölçek (n, s, m, l, x) sunarak oldukça modülerdir.
Neden YOLOv5'i Seçmelisiniz?
- Kullanım Kolaylığı: Ultralytics, basit bir Python API, otomatik ortam kurulumu ve kapsamlı belgeler ile geliştirici deneyimine öncelik verir.
- Çok Yönlülük: Birçok rakibin aksine, YOLOv5 kutudan çıkar çıkmaz görüntü sınıflandırmayı ve örnek segmentasyonunu destekler.
- Eğitim Verimliliği: Hızlı yakınsama ve eğitim sırasında düşük bellek kullanımı ile bilinir, böylece işlem kaynaklarından tasarruf sağlar.
- Dağıtım Esnekliği: Çeşitli donanım entegrasyonu için ONNX, TensorRT, CoreML ve TFLite gibi formatlara sorunsuz bir şekilde aktarılır.
Entegre Ekosistem
YOLOv5 kullanmanın en büyük avantajlarından biri Ultralytics ekosistemidir. Ultralytics HUB gibi araçlarla entegrasyon, kodsuz model eğitimi ve önizlemesine olanak tanırken, Comet ve MLflow aracılığıyla deney izleme için yerleşik destek, MLOps iş akışını kolaylaştırır.
YOLOv5 hakkında daha fazla bilgi edinin
Detaylı Karşılaştırma
Mimari ve Tasarım Felsefesi
YOLOv6-3.0, belirli GPU mimarilerindeki (Tesla T4 gibi) verimi en üst düzeye çıkarmak için donanım tabanlı sinir ağı mimarisi aramasına ve yeniden parametrelendirmeye büyük ölçüde dayanır. Buna karşılık, YOLOv5, CPU'lar, GPU'lar ve NPU'lar arasında güvenilir bir şekilde performans gösteren evrensel bir tasarıma odaklanır. YOLOv5'in anchor tabanlı dedektörünün, bazı anchor'suz yaklaşımlara kıyasla küçük nesneler içeren özel veri kümeleri için ayarlanması genellikle daha kolaydır.
Kullanılabilirlik ve Eğitim Metodolojisi
Ultralytics modelleri "eğitime hazır" olacak şekilde tasarlanmıştır. YOLOv5 ile AutoAnchor gibi özellikler, anchor kutularını veri kümesi etiketlerinize otomatik olarak ayarlar ve akıllı hiperparametre evrimi, optimum eğitim ayarlarını bulmaya yardımcı olur. YOLOv6, yeni kullanıcılar için daha dik bir öğrenme eğrisi sunabilecek geleneksel araştırma depolarının karakteristik özelliği olan daha manuel bir kurulum gerektirir.
Gerçek Dünya Kullanım Durumları
- Ultralytics YOLOv5: hızlı prototipleme ve çeşitli dağıtımlar için idealdir. Hafif 'Nano' modeli, CPU üzerinde drone tabanlı izleme veya gerçek zamanlı çıkarım gerektiren mobil uygulamalar için mükemmeldir. Segmentasyonu desteklemesi, hücre segmentasyonu gibi tıbbi görüntüleme görevleri için de değerli kılar.
- YOLOv6-3.0: Üst düzey GPU'ların mevcut olduğu ve birincil metriğin mAP olduğu sabit endüstriyel ortamlar için en uygunudur. Örnekler arasında elektronik üretiminde otomatik optik inceleme (AOI) bulunur.
Kod Örneği: YOLOv5 Çalıştırma
YOLOv5'in basitliği, PyTorch Hub kullanılarak yalnızca birkaç satır kodla çıkarım çalıştırma yeteneği ile en iyi şekilde gösterilir. Bu, karmaşık kurulum adımlarını ortadan kaldırır ve geliştiricilerin modeli hemen test etmelerine olanak tanır.
import torch
# Load the YOLOv5s model from the official Ultralytics Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)
# Define an image URL (or local path)
img = "https://ultralytics.com/images/zidane.jpg"
# Perform inference
results = model(img)
# Display results
results.show()
# Print detailed results regarding detected objects
results.print()
Bu erişim kolaylığı, bilgisayarlı görü uygulayıcılarının ortam sorunlarını ayıklamak yerine sorunları çözmeye odaklanmasını sağlayan Ultralytics felsefesinin bir özelliğidir.
Sonuç
Her iki mimari de modern görüş ortamında önemli roller üstlenmektedir. Meituan YOLOv6-3.0, kesinlikle GPU donanımında algılama doğruluğunu en üst düzeye çıkarmaya odaklanan kullanıcılar için cazip bir seçenek sunmaktadır.
Ancak, Ultralytics YOLOv5, benzersiz çok yönlülüğü, eğitim verimliliği ve sağlam ekosistemi nedeniyle çoğu geliştirici için üstün bir seçim olmaya devam etmektedir. Kenar cihazlara kolayca dağıtım yapabilme özelliği, segmentasyon ve sınıflandırma desteğiyle birleştiğinde, YOLOv5'i gerçek dünya yapay zeka zorlukları için kapsamlı bir çözüm haline getirir.
En son teknoloji performansını arayanlar için, Ultralytics YOLO11'i keşfetmenizi öneririz. YOLO11, YOLOv5'in mirası üzerine inşa edilmiş, daha da yüksek doğruluk, hız ve zengin özelliklere sahip yetenekleriyle vizyon yapay zekasının geleceğini temsil etmektedir. RT-DETR gibi diğer özel modeller de transformatör tabanlı uygulamalar için mevcuttur.
Ultralytics Model Belgeleri'ndeki tüm araç ve modelleri keşfedin.