İçeriğe geç

EfficientDet - YOLOv7: Teknik Karşılaştırma

Doğru nesne algılama modelini seçmek, doğruluk, hız ve hesaplama maliyetini dengeleyen kritik bir karardır. Bu sayfa, bilgisayarla görme alanındaki iki etkili mimari olan EfficientDet ve YOLOv7 arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. EfficientDet, olağanüstü parametre verimliliği ve ölçeklenebilirliği ile bilinirken, YOLOv7 gerçek zamanlı algılama hızı ve doğruluğunun sınırlarını zorlamasıyla ünlüdür.

Temel mimari farklılıklarını, performans kıyaslamalarını ve ideal kullanım durumlarını inceleyeceğiz. Her iki modelin de güçlü yönleri olmasına rağmen, birçok modern uygulama için geliştiriciler, daha kapsamlı ve kullanıcı dostu bir çözüm sunan Ultralytics YOLOv8 ve YOLO11 gibi üstün alternatifler bulabilirler.

EfficientDet: Ölçeklenebilir ve Verimli Mimari

Google Brain ekibi tarafından tanıtılan EfficientDet, yüksek verimlilik ve doğruluk için tasarlanmış bir nesne algılama modelleri ailesidir. Temel yeniliği, model ölçeklendirmesine yönelik sistematik bir yaklaşım ve yeni bir özellik kaynaştırma ağında yatmaktadır.

Mimari ve Temel Özellikler

EfficientDet'in mimarisi üç ana bileşen üzerine kurulmuştur:

  • EfficientNet Backbone: Özellik çıkarımı için, üstün bir doğruluk ve hesaplama maliyeti dengesi için optimize edilmiş olan yüksek verimli EfficientNet'i backbone olarak kullanır.
  • BiFPN (Çift Yönlü Özellik Piramidi Ağı): Özellikleri tek yönlü olarak toplayan geleneksel FPN'lerin aksine, BiFPN, ağırlıklı bağlantılarla çok ölçekli özellik kaynaştırmasına olanak tanıyarak daha az parametreyle daha zengin özellik temsilleri sağlar.
  • Bileşik Ölçeklendirme: EfficientDet, backbone, özellik ağı ve tahmin başlığının derinliğini, genişliğini ve çözünürlüğünü eşit şekilde ölçeklendiren bileşik bir ölçeklendirme yöntemi sunar. Bu, modelin küçük EfficientDet-D0'dan büyük D7'ye ölçeklenmesini sağlayarak farklı kaynak kısıtlamalarına hitap eder.

Güçlü Yönler

  • Yüksek Parametre Verimliliği: EfficientDet modelleri, kendi zamanlarındaki diğer modellere kıyasla önemli ölçüde daha az parametre ve FLOP ile rekabetçi doğruluk elde eder.
  • Ölçeklenebilirlik: Bileşik ölçeklendirme yöntemi, modeli yukarı veya aşağı ölçeklendirmek için net bir yol sağlayarak, uç cihazlardan güçlü bulut sunucularına kadar çeşitli donanımlara uyarlanabilir hale getirir.
  • CPU'da Yüksek Performans: EfficientDet'in daha küçük varyantları CPU'larda iyi performans gösterir ve bu da onları GPU donanımının bulunmadığı uygulamalar için uygun hale getirir.

Zayıflıklar

  • Daha Yavaş GPU Çıkarımı: FLOP verimliliğine rağmen, EfficientDet, mimarisi paralel işleme için daha az optimize edildiğinden, GPU'larda YOLOv7 gibi modellerden daha yavaş olabilir.
  • Göreve Özgü: EfficientDet öncelikle nesne algılama için tasarlanmıştır ve daha modern çerçevelerde bulunan yerel çoklu görev çok yönlülüğüne sahip değildir.
  • Karmaşıklık: BiFPN ve bileşik ölçeklendirme kavramları, güçlü olmakla birlikte, modeli anlamayı ve özelleştirmeyi karmaşıklaştırabilir.

EfficientDet hakkında daha fazla bilgi edinin

YOLOv7: Gerçek Zamanlı Algılamada Yeni Bir Kriter

YOLOv7, YOLO serisinde önemli bir sıçrama olarak ortaya çıkarak gerçek zamanlı nesne dedektörleri için yeni bir son teknoloji belirlemiştir. Çıkarım hızından ödün vermeden doğruluğu artırmak için çeşitli mimari ve eğitim optimizasyonları sunmuştur.

Mimari ve Temel Özellikler

YOLOv7'nin performans kazanımları çeşitli temel yeniliklerden gelmektedir:

  • Genişletilmiş Verimli Katman Toplama Ağı (E-ELAN): Modelin backbone'unda kullanılan bu modül, gradyan yollarını kontrol ederek ağın etkili bir şekilde öğrenme ve yakınsama yeteneğini geliştirir.
  • Modelin Yeniden Parametreleştirilmesi: YOLOv7, hesaplama yükünü azaltmak ve hızı artırmak için çıkarım sırasında birden çok modülü tek bir modülde birleştiren bir teknik olan planlı yeniden parametrelendirilmiş evrişimi kullanır.
  • Eğitilebilir Ücretsiz Avantajlar Paketi: Denetimi derinleştiren yardımcı başlıklar ve kaba-ince kılavuzlu eğitim gibi nihai çıkarım maliyetine ekleme yapmadan doğruluğu artıran gelişmiş eğitim teknikleri sunar.

Güçlü Yönler

  • Olağanüstü Hız-Doğruluk Dengesi: YOLOv7, GPU'larda olağanüstü gerçek zamanlı çıkarım hızları sunarken çok yüksek doğruluğu korur ve diğer birçok modelden daha iyi performans gösterir.
  • Gelişmiş Eğitim Optimizasyonları: "Bedava hediyeler" yaklaşımı, dağıtılan modeli ağırlaştırmadan daha yüksek mAP puanları elde etmesini sağlar.
  • Kanıtlanmış Performans: MS COCO gibi standart veri kümelerinde kapsamlı bir şekilde kıyaslanmış ve yeteneklerini göstermiştir.

Zayıflıklar

  • Yoğun Kaynak Gerektiren Eğitim: Daha büyük YOLOv7 modelleri, hesaplama açısından zorlayıcı olabilir ve eğitim için önemli miktarda GPU belleği gerektirebilir.
  • Sınırlı Çok Yönlülük: Resmi depoda poz tahmini ve segmentasyon gibi görevler için uzantılar bulunsa da, daha yeni Ultralytics modelleri gibi entegre bir çoklu görev çerçevesi değildir.
  • Karmaşıklık: Mimari ve eğitim hattı karmaşıktır, bu da modeli özelleştirmek veya derinlemesine anlamak isteyen geliştiriciler için bir engel olabilir.

YOLOv7 hakkında daha fazla bilgi edinin

Performans Analizi: Hız ve Doğruluk

EfficientDet ve YOLOv7'yi karşılaştırırken, temel fark optimizasyon hedeflerinde yatmaktadır. EfficientDet, parametre ve FLOP verimliliğine öncelik verirken, YOLOv7 belirli bir doğruluk için GPU donanımında çıkarım hızını (FPS) maksimize etmeye odaklanır.

Model boyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0

Tablodan şu sonuçları çıkarabiliriz:

  • Doğruluk: En büyük EfficientDet modeli (d7) en yüksek mAP'yi elde eder, ancak YOLOv7x çok yakınındadır.
  • Verimlilik: EfficientDet modelleri, özellikle daha küçük varyantları olmak üzere, parametreler ve FLOP'lar açısından son derece hafiftir. EfficientDet-d0, kaynak kısıtlı ortamlar için açık bir kazanan.
  • Hız: YOLOv7 modelleri GPU'da (TensorRT) önemli ölçüde daha hızlıdır. Örneğin, YOLOv7l sadece 6,84 ms'de 51,4 mAP'ye ulaşırken, karşılaştırılabilir EfficientDet-d5 51,5 mAP'ye ulaşır ancak çok daha uzun 67,86 ms sürer. Bu, YOLOv7'yi yüksek verimlilik gerektiren gerçek zamanlı uygulamalar için çok daha uygun hale getirir.

Neden Ultralytics YOLO Modellerini Seçmelisiniz?

YOLOv7 mükemmel performans sunarken, YOLOv8 ve YOLO11 gibi daha yeni Ultralytics YOLO modelleri önemli avantajlar sağlar:

  • Kullanım Kolaylığı: Ultralytics modelleri, eğitim, doğrulama ve dağıtımı basitleştiren kolaylaştırılmış bir Python API'si, kapsamlı belgelendirme ve anlaşılır CLI komutları ile birlikte gelir.
  • İyi Yönetilen Ekosistem: Aktif geliştirmeden, güçlü bir açık kaynak topluluğundan, sık güncellemelerden ve sorunsuz MLOps için Ultralytics HUB gibi araçlarla entegrasyondan yararlanın.
  • Performans Dengesi: Ultralytics modelleri, kenar cihazlardan bulut sunucularına kadar çeşitli gerçek dünya senaryoları için uygun olan hız ve doğruluk arasında mükemmel bir denge sağlar.
  • Bellek Verimliliği: Ultralytics YOLO modelleri, eğitim ve çıkarım sırasında verimli bellek kullanımı için tasarlanmıştır ve genellikle transformer tabanlı modellerden ve hatta EfficientDet veya YOLOv7'nin bazı varyantlarından daha az CUDA belleği gerektirir.
  • Çok Yönlülük: YOLOv8 ve YOLO11 gibi modeller, nesne tespitinin ötesinde segmentasyon, sınıflandırma, poz tahmini ve yönlendirilmiş nesne tespiti (OBB) dahil olmak üzere birden fazla görevi destekleyerek birleşik bir çözüm sunar.
  • Eğitim Verimliliği: Verimli eğitim süreçlerinden, COCO gibi veri kümelerinde kullanıma hazır önceden eğitilmiş ağırlıklardan ve daha hızlı yakınsama sürelerinden yararlanın.

Sonuç

EfficientDet, parametre ve FLOP verimliliğinin en önemli olduğu senaryolarda öne çıkar ve farklı kaynak bütçeleri arasında ölçeklenebilirlik sunar. YOLOv7, özellikle GPU donanımında, gelişmiş eğitim tekniklerinden yararlanarak olağanüstü hız ve doğruluk sunarak gerçek zamanlı nesne algılamanın sınırlarını zorlar.

Ancak, güçlü performans, mükemmel belgelendirme ve birden fazla görme görevini destekleyen kapsamlı bir ekosistem ile modern, çok yönlü ve kullanıcı dostu bir çerçeve arayan geliştiriciler için, YOLOv8 ve YOLO11 gibi Ultralytics modelleri, araştırmadan üretim dağıtımına kadar çok çeşitli uygulamalar için genellikle daha cazip bir seçim sunar.

Diğer Model Karşılaştırmaları

Daha fazla keşif için, EfficientDet, YOLOv7 ve diğer ilgili modelleri içeren bu karşılaştırmaları göz önünde bulundurun:



📅 1 yıl önce oluşturuldu ✏️ 1 ay önce güncellendi

Yorumlar