YOLOv5 - EfficientDet Karşılaştırması: Detaylı Teknik Bir İnceleme
Bu sayfa, iki etkili nesne algılama modeli arasında kapsamlı bir teknik karşılaştırma sunmaktadır: Ultralytics YOLOv5 ve Google'ın EfficientDet'i. Her iki model de yüksek performans için tasarlanmış olsa da, farklı araştırma felsefelerinden ve mimari tasarımlardan kaynaklanmaktadır. Bilgisayarlı görü projeleriniz için en iyi modeli seçmenize yardımcı olmak amacıyla mimari, performans metrikleri ve ideal kullanım durumlarındaki temel farklılıklarını inceleyeceğiz.
Ultralytics YOLOv5: Çok Yönlü ve Yaygın Olarak Benimsenen Model
Yazar: Glenn Jocher
Kuruluş: Ultralytics
Tarih: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Belgeler: https://docs.ultralytics.com/models/yolov5/
Ultralytics YOLOv5, hızı, doğruluğu ve kullanım kolaylığının olağanüstü dengesi nedeniyle hızla bir endüstri standardı haline gelen tek aşamalı bir nesne dedektörüdür. Tamamen PyTorch ile oluşturulmuş olan mimarisi, etkili özellik toplama için bir CSPDarknet53 backbone, bir PANet boynu ve verimli bir anchor tabanlı algılama başlığı içerir. YOLOv5, nano (n)'dan ekstra büyük (x)'e kadar bir dizi model sunarak oldukça ölçeklenebilirdir ve geliştiricilerin özel hesaplama ve performans ihtiyaçları için mükemmel dengeyi seçmelerine olanak tanır.
Güçlü Yönler
- Olağanüstü Hız: YOLOv5 hızlı çıkarım için yüksek oranda optimize edilmiştir, bu da onu video gözetimi gibi düşük gecikmenin kritik olduğu gerçek zamanlı uygulamalar için tercih edilen bir seçenek haline getirir.
- Kullanım Kolaylığı: En büyük avantajı, kolaylaştırılmış kullanıcı deneyimidir. Basit bir Python API'si ve CLI, kapsamlı dokümantasyon ve basit eğitim iş akışları ile YOLOv5, özel nesne algılama için giriş engelini önemli ölçüde azaltır.
- İyi Yönetilen Ekosistem: YOLOv5, aktif geliştirme, büyük ve yardımsever bir topluluk, sık güncellemeler ve kodsuz model eğitimi ve yönetimi için Ultralytics HUB gibi güçlü araçları içeren sağlam Ultralytics ekosistemi tarafından desteklenmektedir.
- Eğitim Verimliliği: Model, COCO gibi veri kümelerinde kolayca erişilebilen önceden eğitilmiş ağırlıklardan ve daha hızlı yakınsama sürelerinden yararlanarak verimli eğitim için tasarlanmıştır. Ayrıca, Transformer'lar gibi daha karmaşık mimarilere kıyasla eğitim ve çıkarım sırasında daha düşük bellek gereksinimlerine sahiptir.
- Çok Yönlülük: Nesne tespitinin ötesinde, YOLOv5, tek bir çerçeve içinde esnek bir çözüm sunarak örnek segmentasyonu ve görüntü sınıflandırması gibi görevleri destekler.
Zayıflıklar
- Yüksek doğruluklu olmalarına rağmen, daha büyük EfficientDet modelleri, özellikle çok küçük nesneleri algılarken, akademik kıyaslamalarda bazen daha yüksek mAP puanları elde edebilir.
- Önceden tanımlanmış anchor kutularına olan bağımlılığı, optimum performans elde etmek için alışılmadık nesne şekil ve boyutlarına sahip veri kümeleri için ayarlama gerektirebilir.
İdeal Kullanım Senaryoları
- Güvenlik sistemleri ve trafik izleme için gerçek zamanlı video analizi.
- NVIDIA Jetson ve Raspberry Pi gibi kaynak kısıtlamalı uç cihazlarda dağıtım.
- Robotik ve otonom araçlar için düşük gecikmeli algılama.
- Hızlı cihaz üzerinde çıkarım gerektiren mobil uygulamalar.
YOLOv5 hakkında daha fazla bilgi edinin
EfficientDet: Ölçeklenebilir ve Verimli Mimari
Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
Kuruluş: Google
Tarih: 2019-11-20
Arşiv: https://arxiv.org/abs/1911.09070
GitHub: https://github.com/google/automl/tree/master/efficientdet
Belgeler: https://github.com/google/automl/tree/master/efficientdet#readme
Google Brain ekibi tarafından geliştirilen EfficientDet, ölçeklenebilir ve verimli nesne dedektörlerinden oluşan bir aile sunmuştur. Temel yenilikleri arasında, son derece verimli EfficientNet'i bir backbone olarak kullanmak, hızlı çok ölçekli özellik kaynaştırması için yeni bir Çift Yönlü Özellik Piramidi Ağı (BiFPN) ve bileşik bir ölçeklendirme yöntemi yer almaktadır. Bu yöntem, modelin derinliğini, genişliğini ve çözünürlüğünü eşit şekilde ölçeklendirerek, farklı hesaplama bütçeleri için optimize edilmiş bir dizi model (D0-D7) oluşturulmasına olanak tanır.
Güçlü Yönler
- Yüksek Doğruluk ve Verimlilik: EfficientDet modelleri, piyasaya sürüldükleri zamanki diğer modellere kıyasla daha az parametre ve FLOPs ile son teknoloji doğruluğu elde etmeleriyle bilinir.
- Ölçeklenebilirlik: Bileşik ölçekleme yaklaşımı, modeli yukarı veya aşağı ölçeklemek için net bir yol sağlayarak, mobil cihazlardan bulut sunucularına kadar çeşitli donanım kısıtlamalarına uyarlanabilir hale getirir.
- Etkili Özellik Birleştirme: BiFPN, ağırlıklı, çift yönlü bağlantılar içererek daha zengin özellik birleştirmesine olanak tanır ve bu da yüksek doğruluğuna katkıda bulunur.
Zayıflıklar
- Daha Yavaş Çıkarım Hızı: Parametre verimliliğine rağmen, EfficientDet genellikle YOLOv5'ten daha yavaştır, özellikle gerçek dünya dağıtım senaryolarında. Bu, onu gerçek zamanlı performans gerektiren uygulamalar için daha az uygun hale getirir.
- Karmaşıklık: Mimari, özellikle BiFPN, YOLOv5'in basit tasarımından daha karmaşıktır. Bu, geliştiricilerin anlamasını, özelleştirmesini ve hatalarını ayıklamasını daha zor hale getirebilir.
- Daha Az Entegre Ekosistem: Google tarafından desteklenmesine rağmen, açık kaynaklı depo Ultralytics ekosistemi kadar aktif olarak sürdürülmemekte veya kullanıcı dostu değildir. MLOps yaşam döngüsünü basitleştiren kapsamlı dokümantasyona, eğitimlere ve entegre araçlara sahip değildir.
İdeal Kullanım Senaryoları
- Maksimum doğruluğun çok önemli olduğu yüksek çözünürlüklü görüntülerin çevrimdışı analizi.
- Hafif anormallikleri tespit etmek için tıbbi görüntü analizi.
- Çıkarımın toplu olarak yapılabildiği üretimde yüksek hassasiyetli kalite kontrolü.
- Doğruluğun birincil metrik olduğu akademik araştırma ve kıyaslama.
EfficientDet hakkında daha fazla bilgi edinin
Performans ve Kıyaslamalar: Bire Bir Bakış
YOLOv5 ve EfficientDet arasındaki seçim genellikle hız ve doğruluk arasındaki ödünleşime bağlıdır. Aşağıdaki tablo ve analiz, COCO val2017 veri kümesi üzerindeki performanslarının net bir karşılaştırmasını sunmaktadır.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Tablo, iki modelin farklı tasarım önceliklerini açıkça göstermektedir. EfficientDet modelleri, özellikle D7 gibi daha büyük varyantlar, 53.7 mAP puanıyla en yüksek mAP skorunu elde etmektedir. Ayrıca, EfficientDet-d0'ın en düşük FLOP'a sahip olmasıyla hesaplama maliyeti açısından da yüksek verimlilik gösterirler. Ancak, gerçek zamanlı uygulamalar için dağıtıma gelindiğinde, çıkarım hızı çok önemlidir. Burada, Ultralytics YOLOv5, özellikle GPU donanımında belirleyici bir avantaj göstermektedir. YOLOv5n modeli, TensorRT ile bir T4 GPU'da 1,12 ms gibi çok hızlı bir çıkarım süresine ulaşarak, en hafif EfficientDet modelinden 3 kat daha hızlıdır. Ayrıca, YOLOv5 modelleri son derece hafiftir; YOLOv5n yalnızca 2,6M parametreye sahiptir ve bu da onu kaynak kısıtlı uç cihazlarda dağıtım için ideal hale getirir. Hız, doğruluk ve küçük model boyutunun bu performans dengesi, YOLOv5'i çok çeşitli üretim ortamları için oldukça pratik bir seçim haline getirmektedir.
Sonuç: Hangi Modeli Seçmelisiniz?
Hem EfficientDet hem de Ultralytics YOLOv5 güçlü nesne algılama modelleridir, ancak farklı önceliklere hitap ederler. EfficientDet, maksimum doğruluğun birincil hedef olduğu ve çıkarım gecikmesinin daha az önemli olduğu durumlarda mükemmeldir. Ölçeklenebilir mimarisi, onu akademik kıyaslamalar ve çevrimdışı işleme görevleri için güçlü bir aday yapar.
Ancak, gerçek dünya uygulamalarının büyük çoğunluğu için Ultralytics YOLOv5 üstün bir seçim olarak öne çıkıyor. Olağanüstü hız ve doğruluk dengesi, onu gerçek zamanlı sistemler için ideal hale getiriyor. YOLOv5'in temel avantajları Kullanım Kolaylığı, kapsamlı ve İyi Yönetilen Ekosistemi ve olağanüstü Eğitim Verimliliğinde yatmaktadır. Geliştiriciler hızla başlayabilir, minimum çabayla özel modeller eğitebilir ve bunları çok çeşitli donanımlara dağıtabilir. Aktif topluluk ve Ultralytics HUB gibi araçlar benzersiz destek sağlayarak onu son derece pratik ve geliştirici dostu bir çerçeve haline getiriyor.
En son gelişmeleri kullanmak isteyenler için, Ultralytics ekosistemindeki çok yönlü YOLOv8 veya en son teknolojiye sahip YOLO11 gibi daha yeni modelleri keşfetmek de faydalı olacaktır. Bu modeller, daha da iyi performans ve daha fazla özellik sunmak için YOLOv5'in güçlü temeli üzerine inşa edilmiştir. Daha fazla karşılaştırma için Ultralytics model karşılaştırma sayfasını ziyaret edin.