YOLOX ve YOLOv7: Kapsamlı Bir Teknik Karşılaştırma
Gerçek zamanlı nesne algılamanın evrimi, sürekli mimari atılımlarla desteklenmiştir. Bu yolculuktaki iki önemli dönüm noktası YOLOX ve YOLOv7'dir. Bir yıl arayla piyasaya sürülen her iki model de standart nesne algılama paradigmasına yeni yaklaşımlar getirerek hız ve doğruluk arasındaki dengeyi önemli ölçüde iyileştirdi.
Bu sayfa, geliştiricilerin bilgisayarlı görü projeleri için doğru aracı seçmelerine yardımcı olmak amacıyla YOLOX ve YOLOv7'nin mimarilerini, performans metriklerini ve ideal kullanım durumlarını karşılaştıran derinlemesine bir teknik analiz sunmaktadır.
YOLOX: Çapasız (Anchor-Free) Algılamada Öncü
Temmuz 2021'de Megvii araştırmacıları tarafından tanıtılan YOLOX, geleneksel çapa tabanlı (anchor-based) tasarımlardan uzaklaşarak büyük bir değişim yarattı. Akademik araştırma ile endüstriyel uygulama arasındaki boşluğu dolduran YOLOX, algılama başlığını basitleştirdi ve genel performansı artırdı.
Ana Model Detayları:
- Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
- Kuruluş: Megvii
- Tarih: 18-07-2021
- Araştırma Makalesi: arXiv:2107.08430
- Kaynak Kod: Megvii YOLOX GitHub
- Dokümantasyon: YOLOX ReadTheDocs
Mimari Yenilikler
YOLOX, özel veri setleri için gereken tasarım parametrelerini ve sezgisel ayarlamaları önemli ölçüde azaltan çapasız bir yaklaşım getirdi. Sınıflandırma ve regresyon görevlerini ayıran ayrıştırılmış bir başlık uygulayarak yakınsama hızını ve doğruluğu artırdı. Ayrıca YOLOX, model dayanıklılığını artırmak için MixUp ve Mosaic gibi gelişmiş veri artırma stratejilerinden yararlandı.
YOLOX hakkında daha fazla bilgi edin
Çapa kutularını ortadan kaldıran YOLOX, eğitim sırasında tahminler ile temel gerçekler (ground truths) arasındaki Kesişim Üzerinden Birleşim (IoU) hesaplama maliyetini düşürür, bu da daha düşük CUDA belleği gereksinimi ve daha hızlı eğitim süreleri sağlar.
YOLOv7: Eğitilebilir Bag-of-Freebies
Temmuz 2022'de Tayvan'daki Academia Sinica Bilgi Bilimleri Enstitüsü araştırmacıları tarafından yayınlanan YOLOv7, gerçek zamanlı nesne algılamanın sınırlarını daha da ileriye taşıdı. "Eğitilebilir bedava özellikler torbası" (trainable bag-of-freebies) kavramını getirerek, piyasaya sürüldüğünde MS COCO veri setinde yeni son teknoloji (SOTA) kriterleri belirledi.
Ana Model Detayları:
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Organizasyon: Institute of Information Science, Academia Sinica, Tayvan
- Tarih: 2022-07-06
- Araştırma Makalesi: arXiv:2207.02696
- Kaynak Kod: WongKinYiu YOLOv7 GitHub
- Dokümantasyon: Ultralytics YOLOv7 Docs
Mimari Yenilikler
YOLOv7'nin mimarisi, modelin gradyan yolunu bozmadan daha çeşitli özellikleri sürekli olarak öğrenmesini sağlayan Genişletilmiş Verimli Katman Birleştirme Ağı (E-ELAN) etrafında kuruludur. Ayrıca YOLOv7, karmaşık çok dallı eğitim ağlarının çıkarım (inference) sırasında daha hızlı, tek yollu ağlara basitleştirilmesini sağlayan model yeniden parametrelendirme tekniklerini kullandı.
YOLOv7 hakkında daha fazla bilgi edinin
Performans Karşılaştırması
Bu modelleri gerçek dünya uygulamaları için değerlendirirken, farklı ölçeklerdeki performanslarını anlamak çok önemlidir. Aşağıdaki tablo, YOLOX ve YOLOv7'nin çeşitli boyutları için standart metrikleri karşılaştırmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametre (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Analiz
- Doğruluk: YOLOv7, eşdeğer YOLOX modellerine kıyasla genellikle daha yüksek bir mAP değeri elde eder. Örneğin, YOLOv7x 53.1 mAP değerine ulaşırken, YOLOXx 51.1 değerindedir.
- Hız: Her iki model de TensorRT kullanılarak GPU üzerinde yürütülmek üzere oldukça optimize edilmiş olsa da, YOLOv7'nin E-ELAN mimarisi üst düzey uygulamalar için biraz daha iyi iş hacmi sağlar; bununla birlikte YOLOX, daha küçük uç cihazlarda mükemmel gecikme sürelerini korur.
- Çok Yönlülük: YOLOv7, örnek segmentasyonu ve poz tahmini için yerel olarak ağırlıklar sunarak sınır kutularının ötesine geçti ve temel YOLOX deposundan daha çok yönlü hale geldi.
Gerçek Dünya Uygulamaları
Bu modeller arasında seçim yapmak genellikle özel dağıtım ortamına bağlıdır.
Uç Bilişim ve IoT
Raspberry Pi veya eski mobil işlemciler gibi kısıtlı uç cihazlar için YOLOX-Nano ve YOLOX-Tiny oldukça çekicidir. Minimum parametre sayıları ve çapasız yapıları, onları temel hareket takibi veya akıllı kapı zili uygulamaları gibi düşük güç tüketen ortamlarda dağıtımı daha kolay hale getirir.
Yüksek Sadakatli Video Analitiği
Endüstriyel hata tespiti veya yoğun trafik izleme gibi yüksek çözünürlüklü akışların işlenmesi için YOLOv7 üstündür. Güçlü özellik birleştirme yeteneği, nesneler kısmen gizlendiğinde veya ölçekleri büyük ölçüde değiştiğinde bile yüksek doğruluğu korumasını sağlar.
Kullanım Durumları ve Öneriler
YOLOX ve YOLOv7 arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
YOLOX ne zaman seçilmeli?
YOLOX şunlar için güçlü bir seçimdir:
- Çapasız Algılama Araştırması: Yeni algılama başlıkları veya kayıp işlevleri denemek için YOLOX'un temiz, çapasız mimarisini temel olarak kullanan akademik araştırma.
- Ultra Hafif Uç Cihazlar: YOLOX-Nano varyantının son derece küçük ayak izinin (0.91M parametre) kritik olduğu mikrodenetleyicilerde veya eski mobil donanımlarda dağıtım yapılması.
- SimOTA Etiket Atama Çalışmaları: Optimum taşıma tabanlı etiket atama stratejilerini ve bunların eğitim yakınsaması üzerindeki etkisini araştıran araştırma projeleri.
Ne Zaman YOLOv7 Seçilmeli
YOLOv7 şunlar için önerilir:
- Akademik Kıyaslama: 2022 dönemi en iyi sonuçlarını yeniden üretmek veya E-ELAN ve trainable bag-of-freebies tekniklerinin etkilerini incelemek.
- Yeniden Parametrelendirme Araştırması: Planlanmış yeniden parametrelendirilmiş konvolüsyonları ve bileşik model ölçeklendirme stratejilerini araştırmak.
- Mevcut Özel Hatlar: Kolayca yeniden düzenlenemeyen, YOLOv7'nin özel mimarisi üzerine kurulu yoğun özelleştirilmiş hatlara sahip projeler.
Ne Zaman Ultralytics (YOLO26) Seçilmeli
Çoğu yeni proje için Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Ultralytics Avantajı
Hem YOLOX hem de YOLOv7 güçlü araştırma uygulamaları olsa da, bir araştırma deposundan ölçeklenebilir bir üretim ortamına geçiş göz korkutucu olabilir. İşte Ultralytics Platform tam bu noktada parlıyor.
Ultralytics modelleri, model eğitimi, doğrulama ve dağıtımı kolaylaştırılmış, standartlaştırılmış görevler olarak ele alan birleşik bir Python API sağlar. Eski mimarilerde yaygın olan karmaşık üçüncü taraf bağımlılıklarını veya özel C++ operatörlerini yönetme baş ağrısından kurtulursun.
Ayrıca Ultralytics YOLO modelleri, RT-DETR gibi transformer tabanlı dedektörlere kıyasla eğitim sırasında önemli ölçüde daha az CUDA belleği gerektirir. Bu, geliştiricilerin daha büyük yığın boyutları kullanmasına olanak tanıyarak eğitimi stabilize eder ve özel veri setlerinde yakınsamayı hızlandırır.
Ultralytics, modellerin basit bir boolean bayrağıyla ONNX, OpenVINO ve CoreML gibi endüstri standardı formatlara aktarılmasını yerel olarak destekler ve model dağıtım sürecini büyük ölçüde basitleştirir.
Kod Örneği: Ultralytics ile Eğitim
Ultralytics ekosistemi, sadece birkaç satır kodla YOLOv7 veya daha yeni mimarileri kolayca yüklemeni, eğitmeni ve çıkarım yapmanı sağlar.
from ultralytics import YOLO
# Load a pre-trained YOLOv7 model
model = YOLO("yolov7.pt")
# Train the model on a custom dataset (e.g., COCO8)
# The API handles data loading, augmentation, and memory management automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a test image
predictions = model("path/to/image.jpg")
predictions[0].show()Gelecek: Ultralytics YOLO26
YOLOv7 ve YOLOX önemli tarihi adımları temsil etse de, son teknoloji hızla ilerlemektedir. Ocak 2026'da piyasaya sürülen Ultralytics YOLO26, önceki modellerin yerini alan çığır açıcı paradigmalar sunuyor.
YOLO26 hakkında daha fazla bilgi edin
- End-to-End NMS-Free Design: YOLO26 natively eliminates Non-Maximum Suppression (NMS) post-processing. This drastically reduces latency bottlenecks and guarantees deterministic execution times across varied hardware setups.
- %43'e Varan Daha Hızlı CPU Çıkarımı: Distribution Focal Loss (DFL) kaldırılarak ve ağ derinliği optimize edilerek, YOLO26 özel GPU donanımından yoksun uç cihazlar için yoğun bir şekilde uyarlanmıştır.
- MuSGD İyileştirici: Gelişmiş LLM eğitim tekniklerinden esinlenen MuSGD iyileştirici (SGD ve Muon'un bir hibriti), olağanüstü eğitim kararlılığı ve daha hızlı yakınsama sunar.
- İyileştirilmiş Küçük Nesne Algılama: ProgLoss + STAL kayıp fonksiyonlarının entegrasyonu, drone haritalama ve güvenlik gözetimi için kritik olan küçük ve uzak nesneleri tanımada önemli iyileştirmeler sağlar.
- Yerel Görev Desteği: YOLO26, Yönlendirilmiş Sınır Kutuları (OBB), örnek segmentasyonu ve poz tahminini aynı kolaylaştırılmış API içinde yerel olarak kapsamlı bir şekilde destekler.
Bugün yeni bir bilgisayarlı görü projesine başlayan herhangi bir modern geliştirici için, Platform üzerinde Ultralytics YOLO26 değerlendirmek, hız, doğruluk ve dağıtım kolaylığı açısından mutlak en iyi dengeyi elde etmek için önerilen yoldur. YOLO11 veya YOLOv8 gibi önceki nesillerden yükseltme yapanlar için geçiş, sadece model dizesini değiştirmeyi gerektirir ve anında üstün yeteneklerin kilidini açar.