İçeriğe geç

YOLOX - EfficientDet Karşılaştırması: Teknik Bir İnceleme

Doğru nesne algılama mimarisini seçmek, bilgisayar görüşü uygulamalarının geliştirilmesinde kritik bir karardır. Bu alanda önemli ölçüde etkili olmuş iki model YOLOX ve EfficientDet'tir. Her ikisi de görüntülerdeki nesneleri bulma ve sınıflandırma sorununu çözmeyi amaçlasa da, bu göreve temelde farklı tasarım felsefeleriyle yaklaşırlar.

Bu kılavuz, yüksek performanslı, ankraj içermeyen bir detectör olan YOLOX ve verimliliğe odaklanan ölçeklenebilir bir mimari olan EfficientDet'in derinlemesine bir teknik karşılaştırmasını sunar. Eski kısıtlamalarınıza hangi modelin uyduğuna karar vermenize yardımcı olmak için mimarilerini, kıyaslamalarını ve eğitim metodolojilerini analiz edeceğiz ve aynı zamanda Ultralytics YOLO11'i en son teknoloji performansı için modern, önerilen alternatif olarak tanıtacağız.

YOLOX: Bağlantısız Evrim

Megvii'deki araştırmacılar tarafından 2021'de yayınlanan YOLOX, önceki yinelemeleri tanımlayan ankraj tabanlı mekanizmayı terk ederek YOLO (You Only Look Once) soyunda bir değişimi temsil etti.

Mimari ve Temel Yenilikler

YOLOX, ayrılmış head yapısıyla kendini farklı kılar. Geleneksel detector'ler genellikle sınıflandırma ve yerelleştirme görevlerinin parametreleri paylaştığı birleşik bir head kullanırdı, bu da eğitim sırasında çakışmaya yol açabilirdi. YOLOX, bu görevleri farklı dallara ayırarak yakınsama hızını ve nihai doğruluğu önemli ölçüde artırır.

En dikkat çekici özelliği çapa içermeyen tasarımıdır. Önceden tanımlanmış çapa kutularına olan ihtiyacı ortadan kaldıran YOLOX, çapa oluşturma ile ilişkili sezgisel ayarlamayı ortadan kaldırır. Bu, pozitif örnekleri dinamik olarak temel gerçeklere atayan ve eğitim sürecini statik IoU eşiklerinden daha etkili bir şekilde dengeleyen gelişmiş bir etiket atama stratejisi olan SimOTA (Basitleştirilmiş Optimal Taşıma Ataması) ile eşleştirilmiştir.

Anchorsız Avantajları

Çapa kutularının kaldırılması, geliştiricilerin ayarlaması gereken tasarım parametrelerinin sayısını azaltır. Ayrıca, model önceden ayarlanmış bir kutu şeklini ayarlamak yerine doğrudan sınırlayıcı kutuları tahmin ettiğinden, alışılmadık en boy oranlarına sahip nesnelere daha iyi genelleme yapar.

YOLOX hakkında daha fazla bilgi edinin

EfficientDet: Ölçeklenebilir Verimlilik

Google Brain ekibi tarafından 2019'da geliştirilen EfficientDet, belirli hesaplama bütçeleri dahilinde mümkün olan en yüksek doğruluğu elde etmeye odaklanır. EfficientNet backbone üzerine inşa edilmiştir ve yeni bir özellik birleştirme tekniği sunar.

Mimari ve Temel Yenilikler

EfficientDet'in temel yeniliği, BiFPN (Ağırlıklı Çift Yönlü Özellik Piramidi Ağı)'dir. Farklı ölçeklerden gelen özellikleri eşit olarak toplayan geleneksel bir Özellik Piramidi Ağı (FPN)'nın aksine, BiFPN farklı girdi özelliklerinin önemini anlamak için öğrenilebilir ağırlıklar sunar. Ayrıca, bilginin hem yukarıdan aşağıya hem de aşağıdan yukarıya doğru tekrar tekrar akmasına izin verir.

EfficientDet ayrıca bileşik ölçeklendirme kullanır. Sadece backbone veya görüntü çözünürlüğünü ölçeklendirmek yerine, ağın çözünürlüğünü, derinliğini ve genişliğini eşit şekilde ölçeklendirir. Bu, mobil uygulamalardan üst düzey bulut işlemeye kadar değişen görevler için son derece uyarlanabilir hale getiren, verimlilik ve doğruluk arasında tutarlı bir eğri sağlayan bir model ailesi (D0'dan D7'ye) ile sonuçlanır.

EfficientDet hakkında daha fazla bilgi edinin

Performans Analizi: Hız - Verimlilik Karşılaştırması

Bu iki model arasındaki temel fark, optimizasyon hedeflerinde yatmaktadır. EfficientDet, genellikle uç cihazlardaki CPU performansına iyi yansıyan teorik verimlilik (FLOP'lar ve Parametreler) için optimize edilmiştir. YOLOX ise tersine, hızlandırıcıların iyi işlediği yoğun operatörlerden yararlanarak GPU'larda yüksek verimli çıkarım için optimize edilmiştir.

Aşağıdaki tablo bu ödünleşimi göstermektedir. EfficientDet-d0 parametreler açısından son derece hafif olmasına rağmen, YOLOX-s daha fazla parametreye sahip olmasına rağmen TensorRT optimize edilmiş donanımda önemli ölçüde daha hızlı çıkarım hızları sunmaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Kritik Gözlemler

  1. GPU Gecikme Süresi: YOLOX, hızlandırıcılarda üstün performans gösterir. YOLOX-l, EfficientDet-d4 ile aynı doğruluğu (49,7 mAP) elde eder, ancak bir T4 GPU'da yaklaşık 3,7 kat daha hızlı çalışır (9,04 ms'ye karşı 33,55 ms).
  2. Parametre Verimliliği: EfficientDet, depolama birincil kısıtlama olduğunda mükemmeldir. EfficientDet-d3, yalnızca 12 milyon parametre ile güçlü bir doğruluk (47.5 mAP) sağlarken, YOLOX ile benzer doğruluğu elde etmek, parametrelerin iki katından fazlasına sahip Orta modeli gerektirir.
  3. Eğitim Karmaşıklığı: YOLOX, sıfırdan sağlam modellerin eğitilmesine yardımcı olan Mosaic ve MixUp gibi güçlü veri artırma tekniklerini yerel olarak içerirken, EfficientDet büyük ölçüde EfficientNet backbone'ünün ve bileşik ölçekleme kurallarının belirli özelliklerine dayanır.

Ultralytics YOLO11: Üstün Alternatif

YOLOX ve EfficientDet kendi zamanlarında çığır açmış olsa da, bilgisayarla görme alanı hızla ilerliyor. 2024 ve sonrası modern uygulamalar için Ultralytics YOLO11, hız, doğruluk ve kullanılabilirlik açısından her iki eski mimariden de daha iyi performans gösteren kapsamlı bir çözüm sunar.

Neden Ultralytics YOLO11'i Seçmelisiniz?

  • Performans Dengesi: YOLO11, hız ve doğruluk arasında mümkün olan en iyi dengeyi sağlamak için tasarlanmıştır. Genellikle en hızlı YOLOX varyantlarına daha yakın çıkarım hızlarını korurken EfficientDet-d7'nin en yüksek doğruluğuyla eşleşir veya onu aşar.
  • Kullanım Kolaylığı: EfficientDet veya YOLOX'un karmaşık araştırma depolarının aksine, Ultralytics üretime hazır bir Python API sunar. Bir modeli sadece birkaç satır kodla yükleyebilir, eğitebilir ve dağıtabilirsiniz.
  • İyi Yönetilen Ekosistem: Ultralytics modelleri, aktif geliştirme, sık güncellemeler ve canlı bir topluluk tarafından desteklenmektedir. Entegre ekosistem, sorunsuz veri kümesi yönetimi ve model eğitimi için Ultralytics HUB'ı içerir.
  • Çok Yönlülük: YOLOX ve EfficientDet öncelikli olarak nesne algılayıcıları olsa da, YOLO11 tek bir çerçeve içinde Örnek Segmentasyonu, Poz Tahmini, Yönlendirilmiş Sınırlayıcı Kutular (OBB) ve Sınıflandırma dahil olmak üzere çok çeşitli görevleri destekler.
  • Eğitim Verimliliği: YOLO11, eski transformatör veya karmaşık backbone mimarilerine kıyasla eğitim sırasında bellek gereksinimlerini azaltan gelişmiş mimari blokları kullanır. Bu, tüketici sınıfı donanımlarda son teknoloji modelleri eğitmeyi mümkün kılar.

YOLO11 ile Başlarken

YOLO11 ile tahmin yürütmek inanılmaz derecede basittir. Aşağıdaki kod parçacığı, önceden eğitilmiş bir modelin nasıl yükleneceğini ve bir görüntü üzerinde çıkarım yapmanın nasıl gerçekleştirileceğini gösterir.

from ultralytics import YOLO

# Load the YOLO11n model (nano version for speed)
model = YOLO("yolo11n.pt")

# Perform object detection on an image
results = model("path/to/image.jpg")

# Display the results
results[0].show()

İdeal Kullanım Senaryoları

  • EfficientDet'i Seçin; yalnızca FLOP sayısının mutlak sınırlayıcı faktör olduğu ve eski bağımlılıklarınızın olduğu son derece kısıtlı CPU'lu uç cihazlarda dağıtım yapıyorsanız.
  • YOLOX'u seçin: GPU'da ankrajsız dedektörlere yönelik akademik araştırmalar için güçlü bir temel çizginize ihtiyacınız varsa, ancak modern çerçevelere kıyasla daha karmaşık kurulumun farkında olun.
  • Ultralytics YOLO11'i neredeyse tüm yeni ticari ve araştırma projeleri için seçin. İster otonom araçlar, akıllı şehir analizleri veya üretim kalite kontrolü oluşturuyor olun, YOLO11 prototipten üretime verimli bir şekilde geçmek için gereken sağlamlığı, hızı ve araçları sağlar.

Sonuç

Hem YOLOX hem de EfficientDet, nesne algılamanın ilerlemesine önemli katkılarda bulunmuştur. EfficientDet, model ölçeklendirmenin bilimsel ve yapılandırılmış olabileceğini kanıtlarken, YOLOX tamamen ankrajsız (anchor-free) algılama boru hatlarını başarıyla popüler hale getirmiştir.

Ancak, Ultralytics YOLO11, bu mimarilerden en iyi dersleri (verimlilik, ankrajsız tasarım ve GPU optimizasyonu) birleşik, kullanıcı dostu bir pakette sentezler. Eğitim sırasında daha düşük bellek ayak izi, çeşitli bilgisayarla görme görevleri için destek ve ONNX ve CoreML gibi dağıtım formatlarıyla sorunsuz entegrasyonu ile Ultralytics YOLO11, günümüz geliştiricileri için önerilen seçimdir.

Daha Fazla Okuma

Nesne algılama modellerinin manzarasını anlamak için daha fazla karşılaştırma keşfedin:


Yorumlar