YOLOX - EfficientDet Karşılaştırması: Teknik Bir İnceleme
Doğru nesne algılama mimarisinin seçilmesi, bilgisayarla görme uygulamalarının geliştirilmesinde kritik bir karardır. Ortamı önemli ölçüde etkileyen iki model YOLOX ve EfficientDet'tir. Her ikisi de görüntülerdeki nesneleri bulma ve sınıflandırma sorununu çözmeyi amaçlasa da, bu göreve temelde farklı tasarım felsefeleriyle yaklaşmaktadır.
Bu kılavuz, yüksek performanslı bir çapasız dedektör olan YOLOX ile verimliliğe odaklanan ölçeklenebilir bir mimari olan EfficientDet'in derinlemesine bir teknik karşılaştırmasını sunmaktadır. Hangi modelin eski kısıtlamalarınıza uyduğuna karar vermenize yardımcı olmak için mimarilerini, kıyaslamalarını ve eğitim metodolojilerini analiz edeceğiz ve aynı zamanda Ultralytics YOLO11 son teknoloji performans için modern, önerilen alternatif olarak.
YOLOX: Çapasız Evrim
2021 yılında Megvii'den araştırmacılar tarafından piyasaya sürülen YOLOX, önceki yinelemeleri tanımlayan çapa tabanlı mekanizmayı terk ederek YOLO (You Only Look Once) serisinde bir değişimi temsil ediyordu.
- Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
- Organizasyon:Megvii
- Tarih: 2021-07-18
- Arxiv:YOLOX: 2021'de YOLO Serisinin Aşılması
- GitHub:Megvii-BaseDetection/YOLOX
Mimari ve Temel Yenilikler
YOLOX, ayrıştırılmış kafa yapısıyla farklılaşmaktadır. Geleneksel dedektörler genellikle sınıflandırma ve yerelleştirme görevlerinin eğitim sırasında çatışmaya yol açabilecek parametreleri paylaştığı birleşik bir kafa kullanırdı. YOLOX bu görevleri farklı dallara ayırarak yakınsama hızını ve nihai doğruluğu önemli ölçüde artırır.
En dikkat çekici özelliği çapa içermeyen tasarımıdır. Önceden tanımlanmış çapa kutularına olan ihtiyacı ortadan kaldıran YOLOX, çapa oluşturma ile ilişkili sezgisel ayarlamayı ortadan kaldırır. Bu, pozitif örnekleri dinamik olarak temel gerçeklere atayan ve eğitim sürecini statik IoU eşiklerinden daha etkili bir şekilde dengeleyen gelişmiş bir etiket atama stratejisi olan SimOTA (Basitleştirilmiş Optimal Taşıma Ataması) ile eşleştirilmiştir.
Ankrajsız Faydalar
Bağlantı kutularının kaldırılması, geliştiricilerin ayarlaması gereken tasarım parametrelerinin sayısını azaltır. Ayrıca, model önceden ayarlanmış bir kutu şeklini ayarlamak yerine sınırlayıcı kutuları doğrudan tahmin ettiğinden, alışılmadık en boy oranlarına sahip nesnelere daha iyi genelleme yapar.
YOLOX hakkında daha fazla bilgi edinin
EfficientDet: Ölçeklenebilir Verimlilik
Google Brain ekibi tarafından 2019 yılında geliştirilen EfficientDet, belirli hesaplama bütçeleri dahilinde mümkün olan en yüksek doğruluğu elde etmeye odaklanmaktadır. EfficientNet backbone üzerine inşa edilmiştir ve yeni bir özellik füzyon tekniği sunmaktadır.
- Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
- Kuruluş: Google
- Tarih: 2019-11-20
- Arxiv:EfficientDet: Ölçeklenebilir ve Verimli Nesne Algılama
- GitHub:google
Mimari ve Temel Yenilikler
EfficientDet'in temel yeniliği BiFPN 'dir (Ağırlıklı Çift Yönlü Özellik Piramidi Ağı). Farklı ölçeklerdeki özellikleri eşit olarak toplayan geleneksel Özellik Piramidi Ağının (FPN) aksine BiFPN, farklı girdi özelliklerinin önemini anlamak için öğrenilebilir ağırlıklar sunar. Ayrıca bilginin hem yukarıdan aşağıya hem de aşağıdan yukarıya tekrar tekrar akmasını sağlar.
EfficientDet ayrıca bileşik ölçeklendirme kullanır. Sadece backbone veya görüntü çözünürlüğünü ölçeklendirmek yerine, ağın çözünürlüğünü, derinliğini ve genişliğini eşit olarak ölçeklendirir. Bu, mobil uygulamalardan üst düzey bulut işlemeye kadar çeşitli görevler için son derece uyarlanabilir hale getiren, tutarlı bir verimlilik ve doğruluk eğrisi sağlayan bir model ailesi (D0 - D7) ile sonuçlanır.
EfficientDet hakkında daha fazla bilgi edinin
Performans Analizi: Hız ve Verimlilik
Bu iki model arasındaki temel fark optimizasyon hedeflerinde yatmaktadır. EfficientDet teorik verimlilik (FLOP'lar ve Parametreler) için optimize edilmiştir, bu da genellikle uç cihazlarda CPU performansına iyi bir şekilde dönüşür. YOLOX ise tersine, hızlandırıcıların iyi işlediği yoğun operatörlerden yararlanarak GPU'larda yüksek verimli çıkarım için optimize edilmiştir.
Aşağıdaki tablo bu değiş tokuşu göstermektedir. EfficientDet-d0 parametreler açısından son derece hafif olsa da, YOLOX-s önemli ölçüde daha yüksek çıkarım hızları sunar TensorRT daha fazla parametreye sahip olmasına rağmen optimize edilmiş donanım.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Kritik Gözlemler
- GPU Gecikmesi: YOLOX hızlandırıcılar üzerinde üstün performans göstermektedir. YOLOX-l, EfficientDet-d4 ile aynı doğruluğa (49,7 mAP) ulaşır ancak T4 GPU 'da yaklaşık 3,7 kat daha hızlı çalışır (9,04 ms'ye karşı 33,55 ms).
- Parametre Verimliliği: Depolama birincil kısıtlama olduğunda EfficientDet üstünlük sağlar. EfficientDet-d3 sadece 12 milyon parametre ile güçlü doğruluk (47,5 mAP) sağlarken, YOLOX ile benzer doğruluğa ulaşmak için iki kattan fazla parametreye sahip Orta model gerekir.
- Eğitim Karmaşıklığı: YOLOX, sağlam modellerin sıfırdan eğitilmesine yardımcı olan Mosaic ve MixUp gibi güçlü veri artırma tekniklerini yerel olarak içerirken, EfficientDet büyük ölçüde EfficientNet backbone belirli özelliklerine ve bileşik ölçeklendirme kurallarına dayanır.
Ultralytics YOLO11: Üstün Alternatif
YOLOX ve EfficientDet kendi dönemlerinde çığır açmış olsalar da, bilgisayarla görme alanı hızla ilerlemektedir. 2024 ve sonrasındaki modern uygulamalar için, Ultralytics YOLO11 hız, doğruluk ve kullanılabilirlik açısından her iki eski mimariden de daha iyi performans gösteren kapsamlı bir çözüm sunar.
Neden Ultralytics YOLO11'i Seçmelisiniz?
- Performans Dengesi: YOLO11 , hız ve doğruluk arasında mümkün olan en iyi dengeyi sağlamak üzere tasarlanmıştır. En hızlı YOLOX varyantlarına yakın çıkarım hızlarını korurken tipik olarak EfficientDet-d7'nin en yüksek doğruluğuyla eşleşir veya aşar.
- Kullanım Kolaylığı: EfficientDet veya YOLOX'un karmaşık araştırma depolarının aksine, Ultralytics üretime hazır bir Python API sunar. Sadece birkaç satır kodla bir modeli yükleyebilir, eğitebilir ve dağıtabilirsiniz.
- Bakımlı Ekosistem: Ultralytics modelleri aktif geliştirme, sık güncellemeler ve canlı bir topluluk tarafından desteklenmektedir. Entegre ekosistem, sorunsuz veri seti yönetimi ve model eğitimi için Ultralytics HUB 'ı içerir.
- Çok yönlülük: YOLOX ve EfficientDet öncelikle nesne algılayıcıları iken, YOLO11 Örnek Segmentasyonu, Poz Tahmini, Yönlendirilmiş Sınırlayıcı Kutular (OBB) ve Sınıflandırma dahil olmak üzere tek bir çerçeve içinde çok çeşitli görevleri destekler.
- Eğitim Verimliliği: YOLO11 , eski transformatör veya karmaşık backbone mimarilerine kıyasla eğitim sırasında bellek gereksinimlerini azaltan rafine mimari blokları kullanır. Bu, tüketici sınıfı donanımlarda son teknoloji modellerin eğitilmesini mümkün kılar.
YOLO11 ile Başlarken
YOLO11 ile tahminleri çalıştırmak inanılmaz derecede basittir. Aşağıdaki kod parçacığı, önceden eğitilmiş bir modelin nasıl yükleneceğini ve bir görüntü üzerinde çıkarımın nasıl çalıştırılacağını göstermektedir.
from ultralytics import YOLO
# Load the YOLO11n model (nano version for speed)
model = YOLO("yolo11n.pt")
# Perform object detection on an image
results = model("path/to/image.jpg")
# Display the results
results[0].show()
İdeal Kullanım Senaryoları
- EfficientDet 'i yalnızca FLOP sayısının mutlak sınırlayıcı faktör olduğu ve eski bağımlılıklara sahip olduğunuz son derece kısıtlı CPUya sahip uç cihazlara dağıtım yapıyorsanız seçin.
- GPU üzerinde çapasız dedektörlere yönelik akademik araştırmalar için güçlü bir temele ihtiyacınız varsa YOLOX'u seçin, ancak modern çerçevelere kıyasla daha karmaşık kurulumun farkında olun.
- Neredeyse tüm yeni ticari ve araştırma projeleri için Ultralytics YOLO11 'i seçin. İster otonom araçlar, ister akıllı şehir analitiği veya üretim kalite kontrolü yapıyor olun, YOLO11 prototipten üretime verimli bir şekilde geçmek için gerekli sağlamlığı, hızı ve araçları sağlar.
Sonuç
Hem YOLOX hem de EfficientDet nesne tespitinin ilerlemesine önemli katkılarda bulunmuştur. EfficientDet model ölçeklendirmenin bilimsel ve yapılandırılmış olabileceğini kanıtlarken, YOLOX tamamen çapasız algılama boru hatlarını başarıyla popüler hale getirdi.
Ancak, Ultralytics YOLO11 Bu mimarilerden alınan en iyi dersleri (verimlilik, çapasız tasarım ve GPU optimizasyonu) birleşik, kullanıcı dostu bir pakette sentezler. Eğitim sırasında daha düşük bellek ayak izi, çeşitli bilgisayarla görme görevlerini desteklemesi ve ONNX ve CoreML gibi dağıtım formatlarıyla sorunsuz entegrasyonuyla Ultralytics YOLO11 , bugün geliştiriciler için önerilen seçim olarak öne çıkıyor.
Daha Fazla Okuma
Nesne algılama modellerinin manzarasını anlamak için daha fazla karşılaştırma keşfedin:
- YOLO11 - YOLOv8 Karşılaştırması
- YOLO11 - RT-DETR Karşılaştırması
- YOLOv8 - EfficientDet
- YOLOv5 - YOLOX Karşılaştırması