Model Karşılaştırması: Nesne Algılama için YOLOv5 - YOLOv6-3.0
Optimum nesne algılama modelini seçmek, başarılı bilgisayarla görme uygulamaları için kritiktir. Hem Ultralytics YOLOv5 hem de Meituan YOLOv6-3.0, verimlilikleri ve doğruluklarıyla bilinen popüler seçeneklerdir. Bu sayfa, projenizin ihtiyaçlarına en uygun modelin hangisi olduğuna karar vermenize yardımcı olmak için teknik bir karşılaştırma sunmaktadır. Ultralytics ekosisteminin güçlü yönlerini vurgulayarak, mimari nüanslarını, performans kıyaslamalarını, eğitim yaklaşımlarını ve uygun uygulamalarını inceliyoruz.
Ultralytics YOLOv5: Yerleşik Endüstri Standardı
Yazarlar: Glenn Jocher
Kuruluş: Ultralytics
Tarih: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Belgeler: https://docs.ultralytics.com/models/yolov5/
Ultralytics YOLOv5 hızı, kullanım kolaylığı ve uyarlanabilirliği ile tanınan tek aşamalı bir nesne algılama modelidir. Ultralytics tarafından geliştirilen bu ürün, yüksek performanslı nesne algılamayı erişilebilir hale getirme konusunda önemli bir adımı temsil ediyor. Tamamıyla PyTorchYOLOv5 , verimli özellik çıkarma ve füzyon için bir CSPDarknet53 backbone ve bir PANet boynuna sahiptir. Mimarisi son derece modülerdir ve farklı performans gereksinimlerini karşılamak için farklı model boyutları (n, s, m, l, x) arasında kolay ölçeklendirmeye izin verir.
YOLOv5'in Güçlü Yönleri
- Hız ve Verimlilik: YOLOv5, çıkarım hızında mükemmeldir ve bu da onu gerçek zamanlı uygulamalar ve kaynak kısıtlı uç cihazlarda dağıtım için ideal kılar. Performans tablosunda görüldüğü gibi, YOLOv5n modeli daha küçük modeller arasında en hızlı CPU ve GPU çıkarım sürelerini sunar.
- Kullanım Kolaylığı: Basitliği ile bilinen YOLOv5, basit bir API, kapsamlı belgeler ve çok sayıda öğretici ile kolaylaştırılmış bir kullanıcı deneyimi sunar.
- İyi Yönetilen Ekosistem: Aktif geliştirme, Discord aracılığıyla güçlü topluluk desteği, sık güncellemeler ve MLOps için Ultralytics HUB ile sorunsuz entegrasyon dahil olmak üzere entegre Ultralytics ekosisteminden yararlanır.
- Çok Yönlülük: Tek görevli modellere göre daha kapsamlı bir çözüm sunarak nesne tespiti, örnek segmentasyonu ve görüntü sınıflandırması dahil olmak üzere birden fazla görevi destekler.
- Eğitim Verimliliği: Özellikle transformatör tabanlı modellere kıyasla, verimli eğitim süreçleri, kolayca erişilebilen önceden eğitilmiş ağırlıklar ve daha düşük bellek gereksinimleri sunar.
YOLOv5'in Zayıflıkları
- Doğruluk: Oldukça doğru ve verimli olmasına rağmen, YOLOv6-3.0 veya Ultralytics YOLOv8 gibi daha yeni modeller, özellikle daha büyük model varyantları olmak üzere belirli kıyaslamalarda biraz daha yüksek mAP sunabilir.
- Anchor Tabanlı Algılama: Anchor kutularına dayanır ve bu durum modern anchor'suz algılayıcılara kıyasla çeşitli veri kümelerinde optimum performans için ayarlama gerektirebilir.
YOLOv5 hakkında daha fazla bilgi edinin
Meituan YOLOv6-3.0: Endüstriyel Bir Rakip
Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Kuruluş: Meituan
Tarih: 2023-01-13
Arşiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
Belgeler: https://docs.ultralytics.com/models/yolov6/
Meituan tarafından geliştirilen YOLOv6-3.0, öncelikli olarak endüstriyel uygulamalar için tasarlanmış bir nesne algılama çerçevesidir. 2023'ün başlarında yayınlanan bu sürüm, gerçek dünya dağıtım senaryoları için uygun bir hız ve doğruluk dengesi sağlamayı amaçlamıştır. YOLOv6, verimli bir backbone ve neck tasarımı gibi mimari değişiklikler getirmiştir. 3.0 sürümü, bu unsurları daha da geliştirmiş ve performansı artırmak için eğitim sırasında kendi kendine damıtma gibi teknikler içermiştir. Ayrıca mobil dağıtım için optimize edilmiş belirli modeller (YOLOv6Lite) sunmaktadır.
YOLOv6-3.0'ın Güçlü Yönleri
- İyi Hız-Doğruluk Dengesi: Özellikle bir GPU üzerinde mAP'yi maksimize etmenin amaç olduğu endüstriyel nesne algılama görevleri için rekabetçi performans sunar.
- Kuantalama Desteği: Sınırlı kaynaklara sahip donanımlarda dağıtım için faydalı olan model kuantalaması için araçlar ve eğitimler sağlar.
- Mobil Optimizasyon: Özellikle mobil veya CPU tabanlı çıkarım için tasarlanmış YOLOv6Lite varyantlarını içerir.
YOLOv6-3.0'ın Zayıflıkları
- Sınırlı Görev Çok Yönlülüğü: Öncelikli olarak nesne tespitine odaklanır ve YOLOv5 ve YOLOv8 gibi Ultralytics modellerinde bulunan segmentasyon, sınıflandırma veya poz tahmini için yerel destekten yoksundur.
- Ekosistem ve Bakım: Açık kaynaklı olmasına rağmen, ekosistem Ultralytics platformu kadar kapsamlı veya aktif olarak sürdürülmemektedir, bu da potansiyel olarak daha yavaş güncellemelere ve daha az topluluk desteğine yol açabilir.
- Daha Yüksek Kaynak Kullanımı: Daha büyük YOLOv6 modelleri, benzer mAP için YOLOv5 muadillerine kıyasla önemli ölçüde daha fazla parametreye ve FLOP'a sahip olabilir ve bu da potansiyel olarak daha fazla işlem kaynağı gerektirebilir.
YOLOv6 hakkında daha fazla bilgi edinin
Performans Kafa Kafaya
Aşağıdaki tablo, COCO veri kümesi üzerinde YOLOv5 ve YOLOv6-3.0 modelleri arasındaki performans metriklerinin doğrudan bir karşılaştırmasını sunmaktadır. Ultralytics YOLOv5, daha küçük modeller için hem CPU hem de GPU'da üstün hız göstererek, gerçek zamanlı uç uygulamalar için mükemmel bir seçimdir. Daha büyük YOLOv6-3.0 modelleri daha yüksek bir tepe mAP'si elde edebilse de, YOLOv5, özellikle daha düşük parametre ve FLOP sayıları dikkate alındığında, genel olarak daha dengeli ve verimli bir performans sunmaktadır.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Eğitim Metodolojisi
Her iki model de COCO gibi büyük veri kümeleri üzerinde eğitim için standart derin öğrenme tekniklerinden yararlanır. Ancak, Ultralytics YOLOv5, akıcı eğitim iş akışları, kapsamlı rehberler, AutoAnchor optimizasyonu ve deney takibi için Weights & Biases ve ClearML gibi araçlarla entegrasyon sunan Ultralytics ekosisteminden önemli ölçüde faydalanır. Bu entegre yaklaşım, geliştirme döngüsünü basitleştirir ve dağıtım süresini hızlandırır. YOLOv6-3.0'ın eğitimi, resmi deposunda belirtilen prosedürleri izler.
İdeal Kullanım Senaryoları
- Ultralytics YOLOv5: Özellikle CPU veya uç cihazlarda gerçek zamanlı performans ve kolay dağıtım gerektiren uygulamalar için şiddetle tavsiye edilir. Çok yönlülüğü, kapsamlı desteği ve verimli kaynak kullanımı, onu hızlı prototipleme, mobil uygulamalar, video gözetimi (hırsızlığı önleme amaçlı bilgisayar görüşü) ve olgun, iyi belgelenmiş bir ekosistemden yararlanan projeler için ideal kılar.
- Meituan YOLOv6-3.0: GPU üzerinde doğruluğu en üst düzeye çıkarma öncelikli hedef olduğunda ve hızlı çıkarım gerektirirken güçlü bir rakiptir. YOLOv5'e göre hafif mAP iyileştirmelerinin potansiyel olarak artan karmaşıklığı veya daha az ekosistem desteğini haklı çıkardığı endüstriyel uygulamalar için uygundur.
Sonuç
Ultralytics YOLOv5, özellikle olağanüstü hızı, kullanım kolaylığı ve sağlam ekosistemi için değerli olan olağanüstü bir seçim olmaya devam ediyor. Kapsamlı belgeler ve topluluk desteğiyle desteklenen mükemmel bir performans ve verimlilik dengesi sağlayarak, geliştiriciler ve araştırmacılar için oldukça erişilebilir hale getirir.
YOLOv6-3.0, özellikle GPU üzerindeki daha büyük modeller için en yüksek mAP açısından rekabetçi performans sunar. Özelleşmiş endüstriyel görevler için bir YOLO çerçevesi içinde mümkün olan en yüksek doğruluğa öncelik veren kullanıcılar için uygun bir alternatiftir.
En son gelişmeleri arayanlar için, performans, çok yönlülük ve verimlilikte daha da iyileştirmeler sunan YOLOv8, YOLOv9, YOLOv10 ve YOLO11 gibi daha yeni Ultralytics modellerini keşfedin. RT-DETR gibi özel modeller de belirli kullanım durumları için benzersiz avantajlar sağlar.
Ultralytics Modelleri Dokümantasyonundaki tüm seçenekleri inceleyin.