YOLOX ve EfficientDet: Nesne Algılama Mimarilerinin Teknik Karşılaştırması
Nesne algılama için en uygun mimariyi seçmek, bilgisayar görüş sistemlerinin gecikmesini, doğruluğunu ve ölçeklenebilirliğini etkileyen kritik bir karardır. Bu karşılaştırma, Megvii'den yüksek performanslı anchor-free bir detectör olan YOLOX ile Google'ın verimliliğe odaklanan ölçeklenebilir mimarisi EfficientDet arasındaki teknik farklılıkları inceler.
Her iki model de bilgisayar görüşü alanını şekillendirmiş olsa da, modern uygulamalar giderek daha basitleştirilmiş dağıtım ve kenar yerel performansı sunan çözümler talep etmektedir. Ayrıca, son teknoloji YOLO26'nın üstün sonuçlar sunmak için bu miraslar üzerine nasıl inşa edildiğini de inceleyeceğiz.
Performans Metrikleri ve Kıyaslamalar
Aşağıdaki tablo, COCO veri kümesindeki çeşitli model ölçeklerinin performansını karşılaştırmaktadır. Temel metrikler arasında ortalama Duyarlılık (mAP) ve çıkarım gecikmesi yer almakta, hız ve doğruluk arasındaki ödünleşimleri vurgulamaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
YOLOX: Bağlantısız Evrim
YOLOX, anchor-free bir mekanizma benimseyerek ve algılama başlığını ayırarak YOLO serisinde önemli bir değişimi temsil etmektedir. Bu tasarım, eğitim sürecini basitleştirir ve çeşitli veri kümelerinde performansı artırır.
Yazar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
Kuruluş: Megvii
Tarih: 2021-07-18
Arxiv: https://arxiv.org/abs/2107.08430
GitHub: https://github.com/Megvii-BaseDetection/YOLOX
Temel Mimari Özellikler
- Ayrık Başlık: Sınıflandırma ve konumlandırma için birleşik bir başlık kullanan önceki YOLO iterasyonlarının aksine, YOLOX bu görevleri ayırır. Bu, daha hızlı yakınsama ve daha iyi doğruluk sağlar.
- Anchor-Free Tasarım: Anchor kutularını kaldırarak, YOLOX manuel anchor ayarlama ihtiyacını ortadan kaldırır ve modeli çeşitli nesne şekillerine karşı daha sağlam hale getirir.
- SimOTA Etiket Ataması: YOLOX, gerçek nesneleri tahminlerle dinamik olarak eşleştiren ve kayıp fonksiyonunu etkili bir şekilde dengeleyen SimOTA adında gelişmiş bir etiket atama stratejisi sunar.
Güçlü ve Zayıf Yönler
YOLOX, hız ve doğruluk dengesi gerektiren senaryolarda, özellikle eski anchor tabanlı sorunların (dengesizlik gibi) sorunlu olduğu durumlarda üstün performans gösterir. Ancak, yoğun veri artırma hatlarına bağımlılığı, bazen özel veri kümeleri için eğitim kurulumunu karmaşık hale getirebilir.
EfficientDet: Ölçeklenebilir Verimlilik
EfficientDet, backbone, özellik ağı ve kutu/sınıf tahmin ağlarının çözünürlüğünü, derinliğini ve genişliğini tekdüze bir şekilde ölçeklendiren bileşik bir ölçeklendirme yöntemi aracılığıyla verimliliği optimize etmeye odaklanır.
Yazar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
Kuruluş: Google Research
Tarih: 2019-11-20
Arxiv: https://arxiv.org/abs/1911.09070
GitHub: https://github.com/google/automl/tree/master/efficientdet
Temel Mimari Özellikler
- EfficientNet backbone: FLOPs ve parametre verimliliği için optimize edilmiş EfficientNet'i kullanır.
- BiFPN (Bidirectional Feature Pyramid Network): Kolay ve hızlı çok ölçekli özellik füzyonuna olanak tanıyan ağırlıklı bir özellik füzyon katmanı.
- Bileşik Ölçekleme: Ağın tüm boyutlarını eş zamanlı olarak ölçeklendiren, yalnızca derinliği veya genişliği ayrı ayrı artırmak yerine farklı bir yöntem.
Güçlü ve Zayıf Yönler
EfficientDet, mobil uygulamalar gibi model boyutunun (depolama) birincil kısıtlama olduğu uygulamalar için oldukça etkilidir. Yüksek mAP değerlerine ulaşsa da, BiFPN'in ve derinlemesine ayrılabilir evrişimlerin karmaşıklığı nedeniyle GPU'lardaki çıkarım hızı genellikle YOLO mimarilerinin gerisinde kalır, çünkü bunlar donanımda standart evrişimlere göre bazen daha az optimize edilmiştir.
Ultralytics Avantajı: YOLO26 Sahneye Çıkıyor
YOLOX ve EfficientDet 2019-2021 yıllarında önemli olsa da, alan hızla ilerlemiştir. Ultralytics tarafından Ocak 2026'da piyasaya sürülen YOLO26, çığır açan yeniliklerle önceki nesillerin sınırlamalarını gidererek vizyon yapay zekasının en son noktasını temsil etmektedir.
YOLO26 hakkında daha fazla bilgi edinin
Kullanım Kolaylığı ve Ekosistem
Ultralytics'i seçen geliştiriciler, birleşik, "sıfırdan kahramana" bir ekosistemden faydalanır. YOLOX veya EfficientDet'in parçalı araştırma depolarının aksine, Ultralytics Platformu ve API'si, modelleri sorunsuz bir şekilde eğitmenize, doğrulamanıza ve dağıtmanıza olanak tanır. Ekosistem, otomatik etiketleme ve ONNX ve OpenVINO gibi formatlara tek tıklamayla dışa aktarma gibi özelliklerle hızlı yinelemeyi destekler.
Yeni Nesil Performans Özellikleri
YOLO26, modern dağıtım için üstün kılan çeşitli mimari yenilikler sunar:
Uçtan Uca NMS-Free Tasarım: YOLO26, yerel olarak uçtan uca bir yapıya sahiptir ve Non-Maximum Suppression (NMS) sonrası işlemeye olan ihtiyacı ortadan kaldırır. Bu, gecikme varyansını azaltır ve dağıtım hatlarını basitleştirir; bu kavram YOLOv10'da öncülük edilmiş ve burada mükemmelleştirilmiştir.
MuSGD Optimize Edici: Büyük Dil Modeli (LLM) eğitiminden esinlenen MuSGD Optimize Edici, SGD'nin kararlılığını Muon'un momentum özellikleriyle birleştirir. Bu, eğitim sırasında daha hızlı yakınsama ve daha sağlam nihai ağırlıklar sağlar.
Önce Kenar Verimliliği: Distribution Focal Loss (DFL) kaldırılmasıyla YOLO26, çıktı katmanı yapısını basitleştirir. Bu değişiklik, mimari optimizasyonlarla birleştiğinde, önceki nesillere kıyasla %43'e kadar daha hızlı CPU çıkarımı sağlar ve bu da onu kenar donanımlarında EfficientDet'ten önemli ölçüde daha hızlı hale getirir.
ProgLoss + STAL: Yeni kayıp fonksiyonları, ProgLoss ve STAL, önceki anchor-free modellerdeki yaygın bir zayıflık olan küçük nesne algılamada önemli iyileştirmeler sağlar. Bu, hava görüntüleme ve robotik uygulamaları için kritik öneme sahiptir.
Eğitim İpucu
YOLO26'nın MuSGD optimize edicisi, daha agresif öğrenme oranlarına izin verir. Özel veri kümeleri üzerinde eğitim yaparken, performansı en üst düzeye çıkarmak için Ultralytics Hiperparametre Ayarlama kılavuzunu kullanmayı düşünebilirsiniz.
Çok Yönlülük ve Bellek
Öncelikli olarak detectör olan YOLOX ve EfficientDet'in aksine, YOLO26 çok görevli bir güç merkezidir. Yerel olarak şunları destekler:
Ayrıca, Ultralytics modelleri bellek verimliliği için optimize edilmiştir. Bir YOLO26 modelini eğitmek, RT-DETR gibi transformatör tabanlı alternatiflerden genellikle daha az CUDA belleği gerektirir ve tüketici sınıfı GPU'larda daha büyük toplu iş boyutlarına olanak tanır.
Kod Örneği: YOLO26 Eğitimi
Ultralytics python API'si ile YOLO26'ya geçiş zahmetsizdir.
from ultralytics import YOLO
# Load the state-of-the-art YOLO26n model
model = YOLO("yolo26n.pt")
# Train on the COCO8 dataset
# The MuSGD optimizer and ProgLoss are handled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
# NMS-free output is generated natively
results = model("https://ultralytics.com/images/bus.jpg")
Sonuç
YOLOX anchor-free araştırmalar için güçlü bir temel sunarken ve EfficientDet ölçekleme verimliliği üzerine bir çalışma sağlarken, YOLO26 2026 ve sonrası için pragmatik bir seçenek olarak öne çıkmaktadır. NMS-free çıkarım, üstün CPU hızı ve Ultralytics ekosisteminin sağlam desteği kombinasyonu, onu gerçek zamanlı çıkarım sınırlarını zorlamak isteyen geliştiriciler için ideal bir aday yapmaktadır.
Yükseltmeye hazır olanlar için, belgelerimizde YOLO26'nın tüm yeteneklerini keşfedebilir veya eski karşılaştırmalar için YOLO11 gibi diğer modern seçenekleri referans gösterebilirsiniz.