İçeriğe geç

EfficientDet vs. YOLOX: Kapsamlı Bir Teknik Karşılaştırma

Doğru nesne algılama mimarisini seçmek, bilgisayarla görü geliştirmede çok önemli bir karardır. Ortamı şekillendiren iki önemli model, Google tarafından optimum ölçeklenebilirlik için geliştirilen EfficientDet ve Megvii'nin yüksek performanslı çapasız dedektörü YOLOX'tur. EfficientDet, bileşik ölçeklendirme kullanarak katı hesaplama bütçeleri içinde doğruluğu en üst düzeye çıkarmaya odaklanırken, YOLOX çıkarım hızına ve basitleştirilmiş eğitim boru hatlarına öncelik verir.

Bu kılavuz, projenize en uygun olanı seçmenize yardımcı olmak için mimarilerinin, performans ölçümlerinin ve ideal dağıtım senaryolarının ayrıntılı bir analizini sunar. Ayrıca, aşağıdaki gibi modern alternatiflerin nasıl Ultralytics YOLO11 Bu öncüllerin güçlü yönlerini birleşik, kullanıcı dostu bir çerçeveye entegre eder.

EfficientDet: Ölçeklenebilir Verimlilik

EfficientDet, nesne algılama modellerini verimli bir şekilde ölçeklendirme zorluğunu ele almak için tanıtıldı. Boyutları keyfi olarak ölçeklendiren önceki mimarilerin aksine, EfficientDet çözünürlüğü, derinliği ve genişliği eşit olarak ölçeklendiren ilkeli bir bileşik ölçeklendirme yöntemi kullanır.

Mimari ve Temel Özellikler

EfficientDet'in temel yeniliği Çift Yönlü Özellik Piramidi Ağında (BiFPN) yatmaktadır. Geleneksel FPN'ler farklı ölçeklerdeki özellikleri ayrım yapmadan toplar, ancak BiFPN füzyon sırasında en önemli özellikleri vurgulamak için öğrenilebilir ağırlıklar sunar. EfficientNet backbone ile birlikte bu, modelin önemli ölçüde daha az parametre ve FLOP (Saniye Başına Kayan Nokta İşlemleri) ile son teknoloji ürünü doğruluğa ulaşmasını sağlar.

  • Bileşik Ölçeklendirme: Basit bir bileşik katsayı kullanarak ağ genişliğini, derinliği ve görüntü çözünürlüğünü aynı anda ölçeklendirir.
  • BiFPN: Kolay ve hızlı çok ölçekli özellik füzyonu sağlar.
  • Verimlilik: mAP 'yi (Ortalama Ortalama Hassasiyet) en üst düzeye çıkarırken kaynak kullanımını en aza indirecek şekilde optimize edilmiştir.

Model Meta Verileri

EfficientDet hakkında daha fazla bilgi edinin

YOLOX: Çapasız Evrim

YOLO serisinde çapasız tasarıma doğru bir geçişi temsil etmektedir. Önceden tanımlanmış bağlantı kutularına olan ihtiyacı ortadan kaldıran YOLOX, eğitim sürecini basitleştirir ve farklı veri kümeleri arasında genelleştirmeyi geliştirir.

Mimari ve Temel Özellikler

YOLOX, sınıflandırma ve regresyon görevlerini farklı dallara ayırarak algılama kafasını ayırır. Bu "ayrılmış kafa" tasarımı tipik olarak daha hızlı yakınsama ve daha iyi performans sağlar. Ayrıca, pozitif örnekleri dinamik olarak atayan, eğitim süresini azaltan ve doğruluğu artıran gelişmiş bir etiket atama stratejisi olan SimOTA'yı içerir.

  • Ankrajsız: Manuel ankraj kutusu ayarlama ihtiyacını ortadan kaldırarak tasarım karmaşıklığını azaltır.
  • Ayrılmış Kafa: Sınıflandırma ve yerelleştirme görevlerini ayırarak performansı artırır.
  • Gelişmiş Güçlendirme: Güçlü eğitim için Mosaic ve MixUp güçlendirmelerini kullanır.

Model Meta Verileri

YOLOX hakkında daha fazla bilgi edinin

Performans ve Kıyaslama Karşılaştırması

Bu iki model arasındaki değiş tokuşlar farklıdır. EfficientDet parametre verimliliği için tasarlanmıştır, bu da onu CPU uygulamalar veya model boyutunun (depolama) birincil kısıtlama olduğu senaryolar için güçlü bir rakip haline getirir. Buna karşılık YOLOX, NVIDIA T4 veya V100 gibi cihazlarda hızlı çıkarım hızları sunmak için donanım dostu işlemlerden yararlanarak GPU gecikmesi için optimize edilmiştir.

Aşağıdaki tablo COCO veri setindeki bu farklılıkları vurgulamaktadır. YOLOX modellerinin benzer doğruluktaki EfficientDet varyantlarına kıyasla GPU donanımında genellikle daha yüksek çıkarım hızları sunduğuna dikkat edin.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Temel Çıkarımlar

  • Gecikme ve Verim: YOLOX-s, daha fazla parametreye sahip olmasına rağmen EfficientDet-d0'dan (3,92 ms) önemli ölçüde daha hızlı olan T4 TensorRT'de 2,56 ms'lik şaşırtıcı bir sonuç elde eder. Bu, YOLOX'un GPU'larda gerçek zamanlı çıkarım için üstün optimizasyonunu göstermektedir.
  • Model Boyutu: EfficientDet-d0, 3,9 milyonluk kompakt parametre sayısıyla son derece sınırlı depolama alanına sahip uç cihazlar için son derece rekabetçi olmaya devam ediyor.
  • Ölçeklendirme: EfficientDet-d7, 53,7 gibi yüksek bir mAP değerine ulaşır, ancak yüksek gecikme süresi (128 ms) pahasına, daha hafif modellere kıyasla canlı video akışları için daha az uygun hale gelir.

Ultralytics Avantajı

EfficientDet ve YOLOX önemli tekniklere öncülük ederken, bilgisayarla görme alanı hızla ilerliyor. Ultralytics YOLO11 önceki nesillerden alınan en iyi mimari dersleri birleşik, yüksek performanslı bir pakete entegre ederek en son teknolojiyi temsil eder.

Geliştiriciler ve araştırmacılar için Ultralytics , eski modellere göre cazip avantajlar sunar:

  • Kullanım Kolaylığı: Ultralytics Python API basitlik için tasarlanmıştır. Bir model yükleyebilir, bir görüntü üzerinde tahmin yapabilir ve sonuçları yalnızca birkaç satır kodla görselleştirerek yapay zeka çözümlerine giriş engelini azaltabilirsiniz.
  • Kapsamlı Ekosistem: Bağımsız depoların aksine, Ultralytics modelleri sağlam bir ekosistem tarafından desteklenmektedir. Bu, aşağıdaki gibi MLOps araçlarıyla sorunsuz entegrasyonları içerir Weights & Biases ve ClearMLaktif toplum desteğinin yanı sıra.
  • Performans Dengesi: Ultralytics YOLO modelleri, hız ve doğruluk arasında en uygun dengeyi sağlamak üzere tasarlanmıştır. EfficientDet'in parametre verimliliğiyle eşleşirken genellikle gecikme süresinde YOLOX'tan daha iyi performans gösterirler.
  • Bellek Gereksinimleri: Ultralytics modelleri, birçok transformatör tabanlı veya eski CNN mimarisine kıyasla eğitim sırasında daha düşük CUDA bellek kullanımı için optimize edilmiştir ve standart donanımda daha büyük partileri eğitmenize olanak tanır.
  • Çok yönlülük: Tek bir Ultralytics çerçevesi Nesne Algılama, Örnek Segmentasyonu, Poz Tahmini, Sınıflandırma ve Yönlendirilmiş Sınırlama Kutularını (OBB) destekler. Bu çok yönlülük, farklı görevler için farklı kod tabanları öğrenme ihtiyacını ortadan kaldırır.

Basit Çıkarım Örneği

Karmaşık eski işlem hatlarına kıyasla Ultralytics YOLO11 ile çıkarım yapmanın ne kadar kolay olduğunu görün:

from ultralytics import YOLO

# Load a pre-trained YOLO11n model
model = YOLO("yolo11n.pt")

# Run inference on a local image
results = model("bus.jpg")

# Display the results
results[0].show()

Sonuç: İdeal Kullanım Örnekleri

EfficientDet, YOLOX ve Ultralytics YOLO arasında seçim yapmak, özel kısıtlamalarınıza bağlıdır.

  • Uygulamanız, çok küçük gömülü mikro denetleyiciler gibi depolama alanı ve FLOP 'ların mutlak darboğaz olduğu donanımlarda kullanılıyorsa EfficientDet'i seçin. İlkeli ölçeklendirmesi, model boyutu üzerinde ince taneli kontrol sağlar.
  • GPU 'larda dağıtım yapıyorsanız ve ham hıza ihtiyacınız varsa YOLOX'u seçin. Mimarisi, çapa tabanlı yöntemlerin bazı operasyonel ek yüklerinden kaçınır ve desteklenen donanımlarda gerçek zamanlı video analizi için oldukça etkili hale getirir.
  • Her yönüyle en iyi performans için Ultralytics YOLO11 'i seçin. YOLOX'un hızını modern mimari tasarımların verimliliği ile birleştirir. Ayrıca, ekosistemi, dokümantasyonu ve çoklu görev desteği, geliştirme süresini önemli ölçüde azaltarak hem hızlı prototipleme hem de ölçeklenebilir üretim dağıtımları için üstün bir seçim haline getirir.

Diğer Model Karşılaştırmaları

Önde gelen bilgisayarla görme modelleri arasındaki teknik farklılıkları daha derinlemesine keşfedin:


Yorumlar