İçeriğe geç

EfficientDet ve YOLOX: Nesne Algılamada Mimari Değişiklikler

Bilgisayar görüşünün evrimi, yeni mimarilerin hız ve doğruluk arasındaki dengeyi yeniden tanımladığı önemli anlarla işaretlenmiştir. Bu dönüm noktalarından ikisi EfficientDet ve YOLOX'tur. EfficientDet, bileşik ölçeklendirme yoluyla ölçeklenebilir verimlilik kavramını getirirken, YOLOX, çapa içermeyen tasarımıyla akademik araştırma ve endüstriyel uygulama arasındaki boşluğu doldurmuştur.

Bu kılavuz, projeniz için doğru aracı seçmenize yardımcı olmak amacıyla, bu iki etkili modelin mimarilerini, performans ölçütlerini ve ideal kullanım örneklerini analiz ederek kapsamlı bir teknik karşılaştırma sunar. Ayrıca, Ultralytics gibi modern çözümlerin bu temeller üzerine nasıl inşa edildiğini ve yeni nesil performans sunduğunu inceliyoruz.

Performans Kıyaslama Analizi

Bu mimariler arasındaki farkları anlamak için, COCO gibi standart benchmarklarda performanslarını incelemek gerekir. Aşağıdaki tablo, farklı model boyutlarının CPU GPU doğruluk (mAP) ve çıkarım hızı ile nasıl ilişkili olduğunu göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

EfficientDet: Ölçeklenebilir Verimlilik

Google ekibi tarafından geliştirilen EfficientDet, model ölçeklendirmeye sistematik bir yaklaşım sunar. Mobil cihazlardan üst düzey hızlandırıcılara kadar çok çeşitli kaynak kısıtlamalarında verimliliği optimize etmek için tasarlanmıştır.

EfficientDet hakkında daha fazla bilgi edinin

Temel Mimari Özellikler

EfficientDet, ağ derinliğini, genişliğini ve çözünürlüğünü eşit şekilde ölçeklendirmek için bileşik ölçeklendirme kullanan EfficientNet backbone üzerine inşa edilmiştir. Önemli bir yenilik, kolay ve hızlı çok ölçekli özellik füzyonu sağlayan BiFPN (Çift Yönlü Özellik Piramit Ağı) idi. Geleneksel FPN'lerden farklı olarak, BiFPN farklı giriş özelliklerine öğrenilebilir ağırlıklar getirerek füzyon sırasında belirli özellik haritalarının önemini vurgulamaktadır.

İdeal Kullanım Senaryoları

EfficientDet, mobil uygulamalar veya pille çalışan cihazlar gibi model boyutu ve FLOP'ların birincil kısıtlamalar olduğu senaryolarda mükemmeldir. Mimarisi, gecikmenin parametre verimliliğinden daha az önemli olduğu statik görüntü işleme için özellikle uygundur. Ancak, karmaşık özellik füzyon katmanları bazen YOLO gibi daha basit mimarilere kıyasla GPU'larda daha yavaş çıkarım hızlarına neden olabilir.

Bileşik Ölçeklendirme

EfficientDet'in temel felsefesi, bir modelin ölçeklendirilmesinin keyfi olmaması gerektiğidir. Derinlik, genişlik ve çözünürlüğü aynı anda dengeleyerek, EfficientDet tek bir boyutta ölçeklendirilen modellere göre daha az parametre ile daha iyi doğruluk elde eder.

YOLOX: Anchor-Free İnovasyonu

YOLOX, öncüllerinin (YOLOv4 ve YOLOv5 gibi) çapa tabanlı tasarımlarından önemli bir ayrılık gösterdi. Megvii tarafından geliştirilen bu tasarım, YOLO çapa içermeyen mekanizmayı yeniden getirerek eğitim sürecini basitleştirdi ve performansı artırdı.

YOLOX hakkında daha fazla bilgi edinin

Temel Mimari Özellikler

YOLOX, sınıflandırma ve regresyon görevlerini farklı dallara ayıran Decoupled Head özelliğini içerir. Bu tasarım seçimi, sınıflandırma güvenilirliği ve konumlandırma doğruluğu arasındaki çelişkiyi çözerek daha hızlı yakınsama sağlar. Ayrıca YOLOX, dinamik etiket ataması için SimOTA (Simplified Optimal Transport Assignment) kullanır. Bu özellik, çeşitli hiperparametrelere karşı dayanıklıdır ve algılama doğruluğunu artırır.

İdeal Kullanım Senaryoları

YOLOX, hız ve doğruluk dengesi gereken genel amaçlı nesne algılama görevlerinde oldukça etkilidir. Temiz kod yapısı ve çapa tabanlı algılayıcılara kıyasla daha basit tasarımı nedeniyle araştırma temelinde yaygın olarak kullanılmaktadır. Dinamik ortamlarda iyi performans gösterir, bu da onu video analizi ve temel otonom sistemler için uygun hale getirir.

Ultralytics : Eski Mimarilerin Ötesinde

EfficientDet ve YOLOX önemli referans noktaları olmaya devam etse de, bu alan hızla gelişmiştir. Modern geliştirme, yalnızca iyi performans gösteren değil, aynı zamanda entegrasyonu, eğitimi ve dağıtımı kolay araçlar gerektirir. Ultralytics işte bu noktada öne çıkmaktadır.

YOLO11 gibi modeller YOLO11 ve son teknoloji ürünü YOLO26 gibi modeller, bu eski mimarilere göre önemli avantajlar sunmaktadır:

  1. Kullanım Kolaylığı: Ultralytics , birleşik, "sıfırdan kahramana" Python Ultralytics . Sadece birkaç satır kodla bir modeli eğitebilir, doğrulayabilir ve dağıtım için dışa aktarabilirsiniz. Bu, eski araştırma modellerinin karmaşık yapılandırma dosyaları ve parçalanmış depolarıyla keskin bir tezat oluşturur.
  2. Performans Dengesi: Ultralytics , hız ve doğruluk arasında optimum dengeyi sağlayacak şekilde tasarlanmıştır. Standart ölçütlerde önceki modellerden sürekli olarak daha iyi performans gösterirken, daha düşük gecikme süresini korurlar.
  3. Bellek Verimliliği: Transformatör tabanlı modeller veya eski ağır mimarilerin aksine, Ultralytics YOLO eğitim sırasında önemli ölçüde daha az CUDA gerektirir. Bu, tüketici sınıfı GPU'larda daha büyük parti boyutlarına olanak tanıyarak yüksek performanslı yapay zekaya erişimi demokratikleştirir.
  4. İyi Bakımlı Ekosistem: Sık güncellemeler, aktif topluluk desteği ve kapsamlı belgelerle Ultralytics , projelerinizin geleceğe hazır olmasını Ultralytics . Ultralytics , veri kümesi yönetimini ve model eğitimini daha da basitleştirir.

Öne Çıkanlar: YOLO26

En son teknolojiyi arayan geliştiriciler için YOLO26, verimlilik ve performansın zirvesini temsil eder.

  • Uçtan uca NMS: Non-Maximum Suppression (NMS) özelliğini ortadan kaldırarak, YOLO26 dağıtım süreçlerini basitleştirir ve çıkarım gecikme değişkenliğini azaltır.
  • Kenar Optimizasyonu: Dağıtım Odak Kaybı (DFL) giderme gibi özellikler, YOLO26'yı CPU %43'e kadar daha hızlı hale getirir ve kenar AI uygulamaları için idealdir.
  • Çok yönlülük: Algılama ötesinde, YOLO26 segmentasyon, poz tahmini ve OBB'yi yerel olarak destekleyerek çeşitli görme görevleri için kapsamlı bir araç seti sunar.

YOLO26 hakkında daha fazla bilgi edinin

Karşılaştırma Özeti

ÖzellikEfficientDetYOLOXUltralytics YOLO26
MimariBiFPN + Verimli AğAnkarsız, Ayrılmış KafaUçtan uca, NMS
OdakParametre VerimliliğiAraştırma ve Genel AlgılamaGerçek Zamanlı Hız ve Kenar Dağıtımı
Kullanım KolaylığıOrta (TensorFlow )İyi (PyTorch)Mükemmel (Birleştirilmiş API)
DağıtımKarmaşık (NMS )Karmaşık (NMS )Basit (NMS)
GörevlerAlgılamaAlgılamaAlgılama, Seg, Poz, OBB, Sınıflandırma

Kod Örneği: Ultralytics ile Eğitim

Ultralytics ının basitliği, hızlı yinelemeyi mümkün kılar. Eski çerçevelerin karmaşık kurulumlarına kıyasla, en son teknolojiye sahip bir modeli ne kadar kolay bir şekilde eğitmeye başlayabileceğinizi aşağıda görebilirsiniz:

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (recommended for transfer learning)
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

Endüstriyel otomasyon veya akıllı şehir gözetimi üzerinde çalışıyor olsanız da, Ultralytics gibi modern ve desteklenen bir çerçeve seçmek, kodlarla uğraşmak için daha az zaman harcayıp gerçek dünyadaki sorunları çözmek için daha fazla zaman harcamanızı Ultralytics .

Daha Fazla Okuma

Nesne algılama alanına ilişkin anlayışınızı derinleştirmek için diğer karşılaştırmaları inceleyin:


Yorumlar