İçeriğe geç

EfficientDet - YOLOv9 Karşılaştırması: Nesne Algılama Verimliliğinin Evrimi

Bilgisayarlı görü dünyasının hızlı temposunda, doğru model mimarisini seçmek performans, hız ve hesaplama kaynaklarını dengelemek için çok önemlidir. Bu kılavuz, Google Research tarafından geliştirilen çığır açan bir model olan EfficientDet ve Ultralytics ekosistemine entegre edilmiş son teknoloji detector olan YOLOv9 arasında kapsamlı bir teknik karşılaştırma sunmaktadır. Mimari yeniliklerini, kıyaslama performans metriklerini analiz edeceğiz ve hangi modelin modern gerçek zamanlı nesne algılama uygulamaları için en uygun olduğunu belirleyeceğiz.

EfficientDet: Ölçeklenebilir Verimlilikte Öncü

2019'un sonlarında yayınlanan EfficientDet, sonraki yıllardaki araştırmaları etkileyen sistematik bir model ölçeklendirme yaklaşımı tanıttı. Google Research'teki ekip tarafından geliştirilen bu çalışma, doğruluktan ödün vermeden verimliliği optimize etmeyi amaçladı.

Teknik Detaylar:

Mimari ve Temel Özellikler

EfficientDet, EfficientNet backbone üzerine inşa edilmiştir ve Çift Yönlü Özellik Piramidi Ağı (BiFPN)'ni sunar. Geleneksel FPN'lerden farklı olarak BiFPN, farklı girdi özelliklerinin önemini öğrenmek için öğrenilebilir ağırlıklar uygulayarak kolay ve hızlı çok ölçekli özellik birleştirmeye olanak tanır. Model, tüm backbone, özellik ağı ve kutu/sınıf tahmin ağları için çözünürlüğü, derinliği ve genişliği aynı anda ölçeklendiren bir bileşik ölçeklendirme yöntemi kullanır.

Güçlü ve Zayıf Yönler

EfficientDet, YOLOv3 gibi çağdaşlarına göre daha az parametreyle yüksek doğruluk elde etme yeteneği sayesinde devrim niteliğindeydi. Temel gücü ölçeklenebilirliğinde yatmaktadır; model ailesi (D0'dan D7'ye) kullanıcıların belirli bir kaynak ödünleşimi seçmesine olanak tanır.

Ancak, modern standartlara göre, EfficientDet özellikle GPU donanımında daha yavaş çıkarım hızlarından muzdariptir. Karmaşık özellik birleştirme katmanları, doğru olmasına rağmen, daha yeni mimariler kadar donanım dostu değildir. Ayrıca, orijinal uygulamada modern çerçevelerde bulunan kullanıcı dostu araçlar bulunmamaktadır, bu da eğitimi ve dağıtımı daha emek yoğun hale getirmektedir.

Kullanım Alanları

EfficientDet şunlar için hala geçerliliğini koruyor:

  • Akademik Araştırma: Bileşik ölçekleme ve özellik kaynaştırmanın prensiplerini anlamak.
  • Eski Sistemler: TensorFlow ekosistemi içinde oluşturulmuş mevcut işlem hatlarını korumak.
  • Yalnızca CPU Ortamları: Parametre verimliliği, düşük FPS uygulamaları için hala makul performans sunabilir.

EfficientDet hakkında daha fazla bilgi edinin

YOLOv9: Gerçek Zamanlı Performansı Yeniden Tanımlama

2024'ün başlarında tanıtılan YOLOv9, üstün verimlilik elde etmek için derin öğrenme bilgi darboğazlarını ele alarak YOLO serisinde bir sıçramayı temsil ediyor. Geliştiriciler için kusursuz bir deneyim sağlayarak Ultralytics python paketi içinde tamamen desteklenmektedir.

Teknik Detaylar:

Mimari ve Temel Özellikler

YOLOv9, iki çığır açan konsept sunar: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN).

  • PGI, verilerin bir sinir ağının derin katmanlarından geçerken meydana gelen bilgi kaybını ele alarak, model ağırlıklarını güncellemek için kullanılan gradyanların güvenilir olmasını sağlar.
  • GELAN, hesaplama verimliliğine öncelik veren hafif bir mimaridir. Derinlemesine evrişim tabanlı yöntemlere kıyasla, modelin daha az parametre ve hesaplama maliyeti (FLOP'lar) ile daha yüksek doğruluk elde etmesini sağlar.

Güçlü Yönler ve Avantajlar

  • Üstün Hız-Doğruluk Dengesi: Kıyaslamanın gösterdiği gibi, YOLOv9, doğruluğu korurken veya aşarken çıkarım gecikmesinde EfficientDet'i önemli ölçüde geride bırakır.
  • Ultralytics Ekosistemi: Ultralytics ile entegrasyon, basit bir Python API'sine, CLI araçlarına ve ONNX, TensorRT ve CoreML gibi formatlara kolay dışa aktarıma erişim anlamına gelir.
  • Eğitim Verimliliği: YOLOv9 modelleri genellikle eğitim sırasında daha az bellek gerektirir ve optimize edilmiş Ultralytics eğitim hattından yararlanarak eski mimarilerden daha hızlı yakınsar.
  • Çeşitlilik: Standart detect işleminin ötesinde, mimari karmaşık görevleri destekleyerek gelişmiş segmentasyonun ve çoklu görev öğreniminin önünü açar.

YOLOv9 hakkında daha fazla bilgi edinin

Biliyor muydunuz?

YOLOv9'un GELAN mimarisi, donanımdan bağımsız olacak şekilde tasarlanmıştır, yani uç TPU'lardan üst düzey NVIDIA GPU'lara kadar çok çeşitli çıkarım cihazlarında, bazı transformatör tabanlı modeller gibi belirli donanım optimizasyonları gerektirmeden verimli bir şekilde çalışır.

Performans Analizi

Aşağıdaki karşılaştırma, YOLOv9'un EfficientDet ailesine kıyasla çıkarım hızı ve verimliliğindeki çarpıcı iyileştirmeleri vurgulamaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Kritik Kıyaslama İçgörüleri

  1. Muazzam Hız Avantajı: YOLOv9c modeli, bir T4 GPU'da sadece 7,16 ms çıkarım hızıyla rekabetçi bir 53,0 mAP elde ediyor. Buna karşılık, karşılaştırılabilir EfficientDet-d6 (52,6 mAP) 89,29 ms hızında ilerliyor. Bu, YOLOv9'u benzer doğruluk için 12 kat daha hızlı hale getiriyor; bu da otonom araçlar veya trafik izleme gibi gerçek zamanlı uygulamalar için kritik bir faktör.
  2. Parametre Verimliliği: Spektrumun alt ucunda, YOLOv9t yalnızca 2.0 milyon parametre ile güçlü bir 38.3 mAP sunarak, neredeyse yarı yarıya daha az parametre kullanırken ve önemli ölçüde daha hızlı çalışırken EfficientDet-d0 temel çizgisini doğrulukta aşıyor.
  3. Üst Düzey Hassasiyet: Maksimum hassasiyet gerektiren görevler için YOLOv9e, en büyük EfficientDet-d7 modelini geride bırakarak 55.6 mAP ile sınırı zorlar ve D7'nin engelleyici 128 ms'sinin aksine, video işleme için hala uygun olan bir gecikmeyi (16.77 ms) korur.

Entegrasyon ve Kullanım Kolaylığı

Bu iki model arasındaki en önemli farklardan biri, onları çevreleyen ekosistemdir. EfficientDet eski TensorFlow depolarına dayanırken, YOLOv9, Ultralytics kütüphanesinde birinci sınıf bir vatandaştır.

Ultralytics'in Avantajı

YOLOv9 'u Ultralytics ile kullanmak, tüm makine öğrenimi yaşam döngüsünü basitleştiren bakımlı bir ekosistem sağlar. Veri kümelerine açıklama eklemekten uç cihazlara dağıtmaya kadar iş akışı kolaylaştırılmıştır.

  • Basit API: Sadece birkaç satır Python koduyla modelleri eğitebilir, doğrulayabilir ve dağıtabilirsiniz.
  • Geniş Uyumluluk: Dışa aktarma modunu kullanarak modellerinizi ONNX, TensorRT, OpenVINO ve CoreML'ye zahmetsizce aktarın.
  • Topluluk Desteği: Kapsamlı dokümantasyon ve aktif bir topluluk, yaygın sorunlara çözümlerin kolayca bulunmasını sağlar.

İşte Ultralytics Python API'sini kullanarak YOLOv9 ile çıkarım yapmanın ne kadar kolay olduğuna dair pratik bir örnek:

from ultralytics import YOLO

# Load a pre-trained YOLOv9 compact model
model = YOLO("yolov9c.pt")

# Run inference on an image
results = model("path/to/image.jpg")

# Process results
for result in results:
    result.show()  # Display predictions
    result.save()  # Save image to disk

Uygulamada Çok Yönlülük

EfficientDet kesinlikle bir nesne algılayıcı olsa da, YOLOv9'un arkasındaki mimari ilkeler ve Ultralytics çerçevesi daha geniş bir yelpazede görme görevlerini destekler. Kullanıcılar, karmaşık projeler için teknik borcu azaltarak aynı kod tabanı içinde nesne algılama, örnek segmentasyonu ve poz tahmini arasında kolayca geçiş yapabilir.

Sonuç

EfficientDet ve YOLOv9 karşılaştırıldığında, modern bilgisayar görüşü geliştirme için seçim açıktır. EfficientDet, model ölçekleme verimliliğini tanımlamada tarihi bir rol oynarken, YOLOv9 günümüz geliştiricileri için geçerli olan hemen hemen her metrikte onu geride bırakmaktadır.

YOLOv9, üstün parametre başına doğruluk, kat kat daha hızlı çıkarım hızları ve sağlam, geliştirici dostu bir ekosistem sunar. İster kısıtlı uç cihazlara dağıtım yapıyor olun, ister bulutta yüksek verimli video akışlarını işliyor olun, YOLOv9 başarı için gerekli performans dengesini sağlar.

Yeni projelere başlayanlar için, uygulamanızın derin öğrenme verimliliğindeki en son gelişmelerden yararlanmasını sağlamak amacıyla YOLOv9'u veya en son YOLO11'i kullanmanızı şiddetle tavsiye ederiz.

Diğer Modelleri İnceleyin

Ultralytics ailesinde daha fazla seçenek keşfetmekle ilgileniyorsanız, bu modelleri göz önünde bulundurun:

  • YOLO11: YOLO serisindeki en son evrim, detect, segmentasyon ve sınıflandırma görevlerinde en son teknoloji performansını sunar.
  • YOLOv10: Non-Maximum Suppression'a (NMS) ihtiyaç duymayan gerçek zamanlı bir uçtan uca algılayıcı.
  • RT-DETR: Doğrulukta öne çıkan, CNN tabanlı mimarilere modern bir alternatif sağlayan, dönüştürücü tabanlı bir dedektör.

Yorumlar