YOLOX ve EfficientDet: Nesne Algılama Mimarilerinin Teknik Karşılaştırması
Nesne algılama için en uygun mimariyi seçmek, bilgisayar görme sistemlerinin gecikme süresi, doğruluğu ve ölçeklenebilirliğini etkileyen kritik bir karardır. Bu karşılaştırma, Megvii'nin yüksek performanslı, ankrajsız algılayıcısı YOLOX ile Google verimliliğe odaklanan ölçeklenebilir mimarisi EfficientDet arasındaki teknik farkları incelemektedir.
Her iki model de bilgisayar görüşünün görünümünü şekillendirmiş olsa da, modern uygulamalar giderek daha fazla basitleştirilmiş dağıtım ve uçta yerel performans sunan çözümler talep etmektedir. Ayrıca, en son teknoloji olan YOLO26 'nin bu mirasları temel alarak nasıl üstün sonuçlar sağladığını da inceleyeceğiz.
Performans Metrikleri ve Kıyaslamalar
Aşağıdaki tablo, COCO çeşitli model ölçeklerinin performansını karşılaştırmaktadır. Önemli ölçütler arasında ortalama hassasiyet (mAP) ve çıkarım gecikmesi yer almakta olup, hız ve doğruluk arasındaki dengeleri vurgulamaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
YOLOX: Bağlantısız Evrim
YOLOX, çapa içermeyen bir mekanizma benimseyerek ve algılama kafasını ayırarak YOLO önemli bir değişimi temsil ediyor. Bu tasarım, eğitim sürecini basitleştiriyor ve çeşitli veri kümelerinde performansı artırıyor.
Yazar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
Kuruluş: Megvii
Tarih: 2021-07-18
Arxiv: https://arxiv.org/abs/2107.08430
GitHub: https://github.com/Megvii-BaseDetection/YOLOX
Temel Mimari Özellikler
- Ayrılmış Başlık: Sınıflandırma ve konum belirleme için birleştirilmiş başlık kullanan önceki YOLO farklı olarak, YOLOX bu görevleri birbirinden ayırır. Bu, daha hızlı yakınsama ve daha iyi doğruluk sağlar.
- Ankrajsız Tasarım: Ankraj kutularını ortadan kaldırarak, YOLOX manuel ankraj ayarlamasına olan ihtiyacı ortadan kaldırır ve modeli çeşitli nesne şekillerine karşı daha sağlam hale getirir.
- SimOTA Etiket Atama: YOLOX, kayıp fonksiyonunu etkili bir şekilde dengeleyerek, gerçek nesneleri tahminlerle dinamik olarak eşleştiren gelişmiş bir etiket atama stratejisi olan SimOTA'yı sunar.
Güçlü ve Zayıf Yönler
YOLOX, hız ve doğruluk arasında denge gerektiren senaryolarda, özellikle eski çapa tabanlı sorunların (dengesizlik gibi) sorun teşkil ettiği durumlarda üstün performans gösterir. Ancak, yoğun veri artırma süreçlerine bağımlı olması, bazen özel veri kümeleri için eğitim kurulumunu karmaşık hale getirebilir.
EfficientDet: Ölçeklenebilir Verimlilik
EfficientDet, backbone, özellik ağı ve kutu/sınıf tahmin ağlarının çözünürlüğünü, derinliğini ve genişliğini eşit şekilde ölçeklendiren bileşik ölçeklendirme yöntemi ile verimliliği optimize etmeye odaklanır.
Yazar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
Kuruluş: Google
Tarih: 2019-11-20
Arxiv: https://arxiv.org/abs/1911.09070
GitHub: google
Temel Mimari Özellikler
- EfficientNet Backbone: FLOP ve parametre verimliliği için optimize edilmiş EfficientNet'i kullanır.
- BiFPN (Çift Yönlü Özellik Piramit Ağı): Kolay ve hızlı çok ölçekli özellik birleştirme sağlayan ağırlıklı özellik birleştirme katmanı.
- Bileşik Ölçeklendirme: Ağın tüm boyutlarını aynı anda ölçeklendiren, yalnızca derinliği veya genişliği ayrı ayrı artıran farklı bir yöntemdir.
Güçlü ve Zayıf Yönler
EfficientDet, mobil uygulamalar gibi model boyutu (depolama) birincil kısıtlama olan uygulamalar için oldukça etkilidir. Yüksek mAP elde etmesine rağmen, BiFPN ve derinlik açısından ayrılabilir konvolüsyonların karmaşıklığı nedeniyle GPU'larda çıkarım hızı genellikle YOLO gerisinde kalır. Bu konvolüsyonlar, donanımda bazen standart konvolüsyonlara göre daha az optimize edilmiştir.
Ultralytics Avantajı: YOLO26 Sahneye Çıkıyor
YOLOX ve EfficientDet 2019-2021 yıllarında önemli bir rol oynarken, bu alan hızla ilerleme kaydetmiştir. Ultralytics tarafından Ocak 2026'da piyasaya sürülen YOLO26, Ultralytics tarafından Ocak Ultralytics piyasaya sürüldü ve görsel yapay zekanın en son teknolojisini temsil ederek, çığır açan yeniliklerle önceki nesillerin sınırlamalarını ortadan kaldırdı.
YOLO26 hakkında daha fazla bilgi edinin
Kullanım Kolaylığı ve Ekosistem
Ultralytics tercih eden geliştiriciler, birleşik, "sıfırdan kahramana" ekosisteminden Ultralytics . YOLOX veya EfficientDet'in parçalı araştırma depolarından farklı olarak, Ultralytics ve API, modelleri sorunsuz bir şekilde eğitmenize, doğrulamanıza ve dağıtmanıza olanak tanır. Ekosistem, otomatik açıklama ve tek tıklamayla ONNX ve OpenVINOgibi formatlara tek tıklamayla dışa aktarma gibi özelliklerle hızlı yinelemeyi destekler
Yeni Nesil Performans Özellikleri
YOLO26, modern dağıtım için üstün kılan birkaç mimari yenilik sunar:
Uçtan Uca NMS Tasarım: YOLO26, doğal olarak uçtan uca çalışır ve Non-Maximum Suppression (NMS) son işlemine gerek kalmaz. Bu, gecikme varyansını azaltır ve dağıtım süreçlerini basitleştirir. Bu kavram, YOLOv10 'de öncülüğünü yaptığı ve burada mükemmelleştirilen bir kavramdır.
MuSGD Optimizer: Büyük Dil Modeli (LLM) eğitiminden esinlenen MuSGD Optimizer, SGD kararlılığını Muon'un momentum SGD birleştirir. Bu, eğitim sırasında daha hızlı yakınsama ve daha sağlam nihai ağırlıklar sağlar.
Edge-First Verimlilik: Dağıtım Odak Kaybını (DFL) ortadan kaldırarak, YOLO26 çıktı katmanı yapısını basitleştirir. Bu değişiklik, mimari optimizasyonlarla birleştiğinde, önceki nesillere kıyasla %43'e kadar daha hızlı CPU yol açar ve bu da onu edge donanımında EfficientDet'ten önemli ölçüde daha hızlı hale getirir.
ProgLoss + STAL: Yeni kayıp fonksiyonları olan ProgLoss ve STAL, önceki çapa içermeyen modellerde yaygın bir zayıflık olan küçük nesne algılamada önemli iyileştirmeler sağlar. Bu, hava görüntüleme ve robotik uygulamaları için çok önemlidir.
Eğitim İpucu
YOLO26'nın MuSGD optimizörü, daha agresif öğrenme oranlarına olanak tanır. Özel veri kümeleri üzerinde eğitim yaparken, performansı en üst düzeye çıkarmak için Ultralytics Ayarlama kılavuzunu kullanmayı düşünün.
Çok yönlülük ve Bellek
YOLOX ve EfficientDet gibi öncelikle algılayıcılar olan sistemlerin aksine, YOLO26 çok görevli bir güç merkezidir. Yerel olarak şunları destekler:
Ayrıca, Ultralytics bellek verimliliği için optimize edilmiştir. YOLO26 modelini eğitmek, genellikle RT-DETR gibi dönüştürücü tabanlı alternatiflere göre daha az CUDA gerektirir. RT-DETRgibi dönüştürücü tabanlı alternatiflere göre daha az CUDA bellek gerektirir, bu da tüketici sınıfı GPU'larda daha büyük parti boyutlarına olanak tanır.
Kod Örneği: YOLO26 Eğitimi
Ultralytics Python ile YOLO26'ya geçiş yapmak çok kolaydır.
from ultralytics import YOLO
# Load the state-of-the-art YOLO26n model
model = YOLO("yolo26n.pt")
# Train on the COCO8 dataset
# The MuSGD optimizer and ProgLoss are handled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
# NMS-free output is generated natively
results = model("https://ultralytics.com/images/bus.jpg")
Sonuç
YOLOX, çapa içermeyen araştırmalar için güçlü bir temel sunarken, EfficientDet ölçeklendirme verimliliği konusunda bir çalışma sunuyor. YOLO26 ise 2026 ve sonrası için pragmatik bir seçim olarak öne çıkıyor. NMS çıkarım, üstün CPU ve Ultralytics sağlam desteği bir araya geldiğinde, gerçek zamanlı çıkarımın sınırlarını zorlamak isteyen geliştiriciler için ideal bir aday haline geliyor.
Yükseltmeye hazır olanlar için, belgelerimizde YOLO26'nın tüm özelliklerini keşfedebilir veya YOLO11 gibi diğer modern seçenekleri kullanın.