İçeriğe geç

YOLOv5 - EfficientDet Karşılaştırması: Detaylı Teknik Bir İnceleme

Bu sayfa, iki etkili nesne algılama modeli arasında kapsamlı bir teknik karşılaştırma sunmaktadır: Ultralytics YOLOv5 ve Google'ın EfficientDet'i. Her iki model de yüksek performans için tasarlanmış olsa da, farklı araştırma felsefelerinden ve mimari tasarımlardan kaynaklanmaktadır. Bilgisayarlı görü projeleriniz için en iyi modeli seçmenize yardımcı olmak amacıyla mimari, performans metrikleri ve ideal kullanım durumlarındaki temel farklılıklarını inceleyeceğiz.

Ultralytics YOLOv5: Çok Yönlü ve Yaygın Olarak Benimsenen Model

Yazar: Glenn Jocher
Kuruluş: Ultralytics
Tarih: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Belgeler: https://docs.ultralytics.com/models/yolov5/

Ultralytics YOLOv5, hızı, doğruluğu ve kullanım kolaylığının olağanüstü dengesi nedeniyle hızla bir endüstri standardı haline gelen tek aşamalı bir nesne dedektörüdür. Tamamen PyTorch ile oluşturulmuş olan mimarisi, etkili özellik toplama için bir CSPDarknet53 backbone, bir PANet boynu ve verimli bir anchor tabanlı algılama başlığı içerir. YOLOv5, nano (n)'dan ekstra büyük (x)'e kadar bir dizi model sunarak oldukça ölçeklenebilirdir ve geliştiricilerin özel hesaplama ve performans ihtiyaçları için mükemmel dengeyi seçmelerine olanak tanır.

Güçlü Yönler

  • Olağanüstü Hız: YOLOv5 hızlı çıkarım için yüksek oranda optimize edilmiştir, bu da onu video gözetimi gibi düşük gecikmenin kritik olduğu gerçek zamanlı uygulamalar için tercih edilen bir seçenek haline getirir.
  • Kullanım Kolaylığı: En büyük avantajı, kolaylaştırılmış kullanıcı deneyimidir. Basit bir Python API'si ve CLI, kapsamlı dokümantasyon ve basit eğitim iş akışları ile YOLOv5, özel nesne algılama için giriş engelini önemli ölçüde azaltır.
  • İyi Yönetilen Ekosistem: YOLOv5, aktif geliştirme, büyük ve yardımsever bir topluluk, sık güncellemeler ve kodsuz model eğitimi ve yönetimi için Ultralytics HUB gibi güçlü araçları içeren sağlam Ultralytics ekosistemi tarafından desteklenmektedir.
  • Eğitim Verimliliği: Model, COCO gibi veri kümelerinde kolayca erişilebilen önceden eğitilmiş ağırlıklardan ve daha hızlı yakınsama sürelerinden yararlanarak verimli eğitim için tasarlanmıştır. Ayrıca, Transformer'lar gibi daha karmaşık mimarilere kıyasla eğitim ve çıkarım sırasında daha düşük bellek gereksinimlerine sahiptir.
  • Çok Yönlülük: Nesne tespitinin ötesinde, YOLOv5, tek bir çerçeve içinde esnek bir çözüm sunarak örnek segmentasyonu ve görüntü sınıflandırması gibi görevleri destekler.

Zayıflıklar

  • Yüksek doğruluklu olmalarına rağmen, daha büyük EfficientDet modelleri, özellikle çok küçük nesneleri algılarken, akademik kıyaslamalarda bazen daha yüksek mAP puanları elde edebilir.
  • Önceden tanımlanmış anchor kutularına olan bağımlılığı, optimum performans elde etmek için alışılmadık nesne şekil ve boyutlarına sahip veri kümeleri için ayarlama gerektirebilir.

İdeal Kullanım Senaryoları

YOLOv5 hakkında daha fazla bilgi edinin

EfficientDet: Ölçeklenebilir ve Verimli Mimari

Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
Kuruluş: Google
Tarih: 2019-11-20
Arşiv: https://arxiv.org/abs/1911.09070
GitHub: https://github.com/google/automl/tree/master/efficientdet
Belgeler: https://github.com/google/automl/tree/master/efficientdet#readme

Google Brain ekibi tarafından geliştirilen EfficientDet, ölçeklenebilir ve verimli nesne dedektörlerinden oluşan bir aile sunmuştur. Temel yenilikleri arasında, son derece verimli EfficientNet'i bir backbone olarak kullanmak, hızlı çok ölçekli özellik kaynaştırması için yeni bir Çift Yönlü Özellik Piramidi Ağı (BiFPN) ve bileşik bir ölçeklendirme yöntemi yer almaktadır. Bu yöntem, modelin derinliğini, genişliğini ve çözünürlüğünü eşit şekilde ölçeklendirerek, farklı hesaplama bütçeleri için optimize edilmiş bir dizi model (D0-D7) oluşturulmasına olanak tanır.

Güçlü Yönler

  • Yüksek Doğruluk ve Verimlilik: EfficientDet modelleri, piyasaya sürüldükleri zamanki diğer modellere kıyasla daha az parametre ve FLOPs ile son teknoloji doğruluğu elde etmeleriyle bilinir.
  • Ölçeklenebilirlik: Bileşik ölçekleme yaklaşımı, modeli yukarı veya aşağı ölçeklemek için net bir yol sağlayarak, mobil cihazlardan bulut sunucularına kadar çeşitli donanım kısıtlamalarına uyarlanabilir hale getirir.
  • Etkili Özellik Birleştirme: BiFPN, ağırlıklı, çift yönlü bağlantılar içererek daha zengin özellik birleştirmesine olanak tanır ve bu da yüksek doğruluğuna katkıda bulunur.

Zayıflıklar

  • Daha Yavaş Çıkarım Hızı: Parametre verimliliğine rağmen, EfficientDet genellikle YOLOv5'ten daha yavaştır, özellikle gerçek dünya dağıtım senaryolarında. Bu, onu gerçek zamanlı performans gerektiren uygulamalar için daha az uygun hale getirir.
  • Karmaşıklık: Mimari, özellikle BiFPN, YOLOv5'in basit tasarımından daha karmaşıktır. Bu, geliştiricilerin anlamasını, özelleştirmesini ve hatalarını ayıklamasını daha zor hale getirebilir.
  • Daha Az Entegre Ekosistem: Google tarafından desteklenmesine rağmen, açık kaynaklı depo Ultralytics ekosistemi kadar aktif olarak sürdürülmemekte veya kullanıcı dostu değildir. MLOps yaşam döngüsünü basitleştiren kapsamlı dokümantasyona, eğitimlere ve entegre araçlara sahip değildir.

İdeal Kullanım Senaryoları

  • Maksimum doğruluğun çok önemli olduğu yüksek çözünürlüklü görüntülerin çevrimdışı analizi.
  • Hafif anormallikleri tespit etmek için tıbbi görüntü analizi.
  • Çıkarımın toplu olarak yapılabildiği üretimde yüksek hassasiyetli kalite kontrolü.
  • Doğruluğun birincil metrik olduğu akademik araştırma ve kıyaslama.

EfficientDet hakkında daha fazla bilgi edinin

Performans ve Kıyaslamalar: Bire Bir Bakış

YOLOv5 ve EfficientDet arasındaki seçim genellikle hız ve doğruluk arasındaki ödünleşime bağlıdır. Aşağıdaki tablo ve analiz, COCO val2017 veri kümesi üzerindeki performanslarının net bir karşılaştırmasını sunmaktadır.

Model boyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0

Tablo, iki modelin farklı tasarım önceliklerini açıkça göstermektedir. EfficientDet modelleri, özellikle D7 gibi daha büyük varyantlar, 53.7 mAP puanıyla en yüksek mAP skorunu elde etmektedir. Ayrıca, EfficientDet-d0'ın en düşük FLOP'a sahip olmasıyla hesaplama maliyeti açısından da yüksek verimlilik gösterirler. Ancak, gerçek zamanlı uygulamalar için dağıtıma gelindiğinde, çıkarım hızı çok önemlidir. Burada, Ultralytics YOLOv5, özellikle GPU donanımında belirleyici bir avantaj göstermektedir. YOLOv5n modeli, TensorRT ile bir T4 GPU'da 1,12 ms gibi çok hızlı bir çıkarım süresine ulaşarak, en hafif EfficientDet modelinden 3 kat daha hızlıdır. Ayrıca, YOLOv5 modelleri son derece hafiftir; YOLOv5n yalnızca 2,6M parametreye sahiptir ve bu da onu kaynak kısıtlı uç cihazlarda dağıtım için ideal hale getirir. Hız, doğruluk ve küçük model boyutunun bu performans dengesi, YOLOv5'i çok çeşitli üretim ortamları için oldukça pratik bir seçim haline getirmektedir.

Sonuç: Hangi Modeli Seçmelisiniz?

Hem EfficientDet hem de Ultralytics YOLOv5 güçlü nesne algılama modelleridir, ancak farklı önceliklere hitap ederler. EfficientDet, maksimum doğruluğun birincil hedef olduğu ve çıkarım gecikmesinin daha az önemli olduğu durumlarda mükemmeldir. Ölçeklenebilir mimarisi, onu akademik kıyaslamalar ve çevrimdışı işleme görevleri için güçlü bir aday yapar.

Ancak, gerçek dünya uygulamalarının büyük çoğunluğu için Ultralytics YOLOv5 üstün bir seçim olarak öne çıkıyor. Olağanüstü hız ve doğruluk dengesi, onu gerçek zamanlı sistemler için ideal hale getiriyor. YOLOv5'in temel avantajları Kullanım Kolaylığı, kapsamlı ve İyi Yönetilen Ekosistemi ve olağanüstü Eğitim Verimliliğinde yatmaktadır. Geliştiriciler hızla başlayabilir, minimum çabayla özel modeller eğitebilir ve bunları çok çeşitli donanımlara dağıtabilir. Aktif topluluk ve Ultralytics HUB gibi araçlar benzersiz destek sağlayarak onu son derece pratik ve geliştirici dostu bir çerçeve haline getiriyor.

En son gelişmeleri kullanmak isteyenler için, Ultralytics ekosistemindeki çok yönlü YOLOv8 veya en son teknolojiye sahip YOLO11 gibi daha yeni modelleri keşfetmek de faydalı olacaktır. Bu modeller, daha da iyi performans ve daha fazla özellik sunmak için YOLOv5'in güçlü temeli üzerine inşa edilmiştir. Daha fazla karşılaştırma için Ultralytics model karşılaştırma sayfasını ziyaret edin.



📅 1 yıl önce oluşturuldu ✏️ 1 ay önce güncellendi

Yorumlar