YOLOX ve YOLOv7: Kapsamlı Bir Teknik Karşılaştırma
Gerçek zamanlı nesne tespitinin evrimi, sürekli mimari atılımlarla ilerlemiştir. Bu yolculuktaki iki önemli kilometre taşı YOLOX ve YOLOv7'dir. Birbirlerinden bir yıl içinde yayınlanan her iki model de standart nesne tespiti paradigmasına yenilikçi yaklaşımlar getirerek hız ve doğruluk arasındaki dengeyi önemli ölçüde iyileştirmiştir.
Bu sayfa, YOLOX ve YOLOv7'nin mimarilerini, performans metriklerini ve ideal kullanım senaryolarını karşılaştırarak, geliştiricilerin bilgisayar görüşü dağıtımları için doğru aracı seçmelerine yardımcı olmak amacıyla derinlemesine bir teknik analiz sunar.
YOLOX: Anchor-Free Tespitinde Öncü
Megvii araştırmacıları tarafından Temmuz 2021'de tanıtılan YOLOX, geleneksel anchor tabanlı tasarımlardan uzaklaşarak önemli bir değişimi temsil etti. Akademik araştırma ile endüstriyel uygulama arasındaki boşluğu kapatarak, YOLOX tespit başlığını basitleştirdi ve genel performansı iyileştirdi.
Temel Model Detayları:
- Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
- Kuruluş:Megvii
- Tarih: 2021-07-18
- Araştırma Makalesi:arXiv:2107.08430
- Kaynak Kodu:Megvii YOLOX GitHub
- Dokümantasyon:YOLOX ReadTheDocs
Mimari Yenilikler
YOLOX, anchor-free bir yaklaşım tanıttı; bu da özel veri kümeleri için gereken tasarım parametrelerinin ve sezgisel ayarlamaların sayısını önemli ölçüde azalttı. Sınıflandırma ve regresyon görevlerini ayıran ayrık bir başlık uyguladı, bu da yakınsama hızını ve doğruluğu iyileştirdi. Ek olarak, YOLOX model sağlamlığını artırmak için MixUp ve Mosaic gibi gelişmiş veri artırma stratejilerini kullandı.
YOLOX hakkında daha fazla bilgi edinin
Çıpasız Avantajı
Anchor kutularını ortadan kaldırarak, YOLOX eğitim sırasında tahminler ve gerçek değerler arasındaki Intersection over Union (IoU) hesaplama yükünü azaltır, bu da daha düşük CUDA bellek gereksinimleri ve daha hızlı eğitim süreleri sağlar.
YOLOv7: Eğitilebilir Ücretsiz Avantajlar Paketi
Temmuz 2022'de Tayvan, Academia Sinica, Bilgi Bilimi Enstitüsü'ndeki araştırmacılar tarafından yayınlanan YOLOv7, gerçek zamanlı nesne tespitinin sınırlarını daha da ileriye taşıdı. Bir "eğitilebilir bedava çantası" (trainable bag-of-freebies) kavramını tanıttı ve yayınlandığında MS COCO veri kümesinde yeni son teknoloji standartlar belirledi.
Temel Model Detayları:
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
- Tarih: 2022-07-06
- Araştırma Makalesi:arXiv:2207.02696
- Kaynak Kodu:WongKinYiu YOLOv7 GitHub
- Dokümantasyon:Ultralytics YOLOv7 Docs
Mimari Yenilikler
YOLOv7'nin mimarisi, modelin gradyan yolunu bozmadan sürekli olarak daha çeşitli özellikler öğrenmesini sağlayan Genişletilmiş Verimli Katman Agregasyon Ağı (E-ELAN) etrafında inşa edilmiştir. Ayrıca, YOLOv7 model yeniden parametrelendirme tekniklerini kullanarak karmaşık çok dallı eğitim ağlarının çıkarım sırasında daha hızlı, tek yollu ağlara basitleştirilmesini sağladı.
YOLOv7 hakkında daha fazla bilgi edinin.
Performans Karşılaştırması
Bu modelleri gerçek dünya uygulamaları için değerlendirirken, farklı ölçeklerdeki performanslarını anlamak çok önemlidir. Aşağıdaki tablo, YOLOX ve YOLOv7'nin çeşitli boyutları için standart metrikleri karşılaştırmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Analiz
- Doğruluk: YOLOv7, genellikle eşdeğer YOLOX modellerine kıyasla daha yüksek bir mAP elde eder. Örneğin, YOLOv7x, YOLOXx'in 51.1 mAP'ine kıyasla 53.1 mAP elde eder.
- Hız: Her iki model de TensorRT kullanılarak GPU yürütmesi için yüksek düzeyde optimize edilmiş olsa da, YOLOv7'nin E-ELAN mimarisi üst düzey uygulamalar için biraz daha iyi verim sağlar; ancak YOLOX, daha küçük kenar cihazlarda mükemmel gecikme süresi sunar.
- Çok Yönlülük: YOLOv7, örnek segmentasyonu ve poz tahmini için yerel olarak ağırlıklar sağlayarak repertuvarını sınırlayıcı kutuların ötesine genişletti ve böylece temel YOLOX deposundan daha çok yönlü hale geldi.
Gerçek Dünya Uygulamaları
Bu modeller arasında seçim yapmak genellikle özel dağıtım ortamınıza bağlıdır.
Uç Bilişim ve IoT
Raspberry Pi gibi kısıtlı uç cihazlar veya eski mobil işlemciler için YOLOX-Nano ve YOLOX-Tiny oldukça caziptir. Minimal parametre sayıları ve çapa içermeyen yapıları, temel hareket takibi veya akıllı kapı zili uygulamaları gibi görevler için düşük güç tüketimli ortamlarda dağıtımlarını kolaylaştırır.
Yüksek Doğruluklu Video Analizi
Endüstriyel hata tespiti veya yoğun trafik izlemede yüksek çözünürlüklü beslemeleri işlemek için YOLOv7 üstündür. Sağlam özellik toplama yeteneği, nesneler kısmen gizlenmiş veya ölçek olarak büyük ölçüde farklılık gösterse bile yüksek doğruluk seviyesini korumasını sağlar.
Kullanım Durumları ve Öneriler
YOLOX ve YOLOv7 arasında seçim yapmak, özel proje gereksinimlerinize, dağıtım kısıtlamalarına ve ekosistem tercihlerinize bağlıdır.
Ne Zaman YOLOX Seçmeli
YOLOX, aşağıdakiler için güçlü bir seçenektir:
- Anchor-Free Algılama Araştırması: YOLOX'un temiz, anchor-free mimarisini yeni algılama başlıkları veya kayıp fonksiyonları denemek için bir temel olarak kullanan akademik araştırmalar.
- Ultra Hafif Kenar Cihazları: YOLOX-Nano varyantının son derece küçük ayak izinin (0.91M parametre) kritik olduğu mikrodenetleyicilerde veya eski mobil donanımlarda dağıtım.
- SimOTA Etiket Atama Çalışmaları: Optimal taşıma tabanlı etiket atama stratejilerini ve bunların eğitim yakınsaması üzerindeki etkilerini araştıran projeler.
YOLOv7 Ne Zaman Tercih Edilmeli?
YOLOv7 için önerilir:
- Akademik Kıyaslama: 2022 dönemi son teknoloji sonuçlarını yeniden üretmek veya E-ELAN ve eğitilebilir 'bag-of-freebies' tekniklerinin etkilerini incelemek.
- Yeniden Parametrelendirme Araştırması: Planlı yeniden parametrelendirilmiş evrişimleri ve bileşik model ölçekleme stratejilerini araştırmak.
- Mevcut Özel İşlem Hatları: YOLOv7'nin özel mimarisi etrafında inşa edilmiş, yoğun şekilde özelleştirilmiş ve kolayca yeniden düzenlenemeyen işlem hatlarına sahip projeler.
Ultralytics (YOLO26) Ne Zaman Seçilmeli
Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Ultralytics'in Avantajı
Hem YOLOX hem de YOLOv7 güçlü araştırma uygulamaları olsa da, bir araştırma deposundan ölçeklenebilir bir üretim ortamına geçiş göz korkutucu olabilir. İşte Ultralytics Platformu burada öne çıkar.
Ultralytics modelleri, model eğitimi, doğrulaması ve dağıtımını kolaylaştırılmış, standartlaştırılmış görevler olarak ele alan bir birleşik Python API'si sunar. Eski mimarilerde yaygın olan karmaşık üçüncü taraf bağımlılıklarını veya özel C++ operatörlerini yönetme zahmetinden kurtulursunuz.
Ayrıca, Ultralytics YOLO modelleri, RT-DETR gibi transformatör tabanlı dedektörlere kıyasla eğitim sırasında önemli ölçüde daha az CUDA belleği gerektirir. Bu, uygulayıcıların daha büyük toplu iş boyutları kullanmasına olanak tanıyarak eğitimi stabilize eder ve özel veri kümelerinde yakınsamayı hızlandırır.
Desteklenen Entegrasyonlar
Ultralytics, modelleri basit bir boolean bayrağı ile ONNX, OpenVINO ve CoreML gibi endüstri standardı formatlara yerel olarak dışa aktarmayı destekleyerek model dağıtım sürecini büyük ölçüde basitleştirir.
Kod Örneği: Ultralytics ile Eğitim
Ultralytics ekosistemi, yalnızca birkaç satır kodla YOLOv7 veya daha yeni mimarileri kullanarak kolayca yüklemenize, eğitmenize ve çıkarım yapmanıza olanak tanır.
from ultralytics import YOLO
# Load a pre-trained YOLOv7 model
model = YOLO("yolov7.pt")
# Train the model on a custom dataset (e.g., COCO8)
# The API handles data loading, augmentation, and memory management automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a test image
predictions = model("path/to/image.jpg")
predictions[0].show()
Gelecek: Ultralytics YOLO26
YOLOv7 ve YOLOX önemli tarihsel adımları temsil etse de, en son teknoloji hızla ilerlemektedir. Ocak 2026'da piyasaya sürülen Ultralytics YOLO26, önceki modelleri geride bırakan çığır açan paradigmalar sunmaktadır.
YOLO26 hakkında daha fazla bilgi edinin
- Uçtan Uca NMS İçermeyen Tasarım: YOLO26, Non-Maximum Suppression (NMS) (Maksimum Olmayan Bastırma) ön işleme sonrasını yerel olarak ortadan kaldırır. Bu, gecikme darboğazlarını önemli ölçüde azaltır ve farklı donanım kurulumlarında deterministik yürütme sürelerini garanti eder.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Distribution Focal Loss (DFL) kaldırarak ve ağ derinliğini optimize ederek, YOLO26 özel GPU donanımına sahip olmayan uç cihazlar için yoğun bir şekilde tasarlanmıştır.
- MuSGD Optimizatörü: Gelişmiş LLM eğitim tekniklerinden esinlenerek, MuSGD optimizatörü (SGD ve Muon'un bir hibriti) olağanüstü eğitim kararlılığı ve daha hızlı yakınsama sunar.
- Geliştirilmiş Küçük Nesne Tespiti: ProgLoss + STAL kayıp fonksiyonlarının entegrasyonu, küçük, uzaktaki nesneleri tanımada önemli iyileştirmeler sağlayarak drone haritalaması ve güvenlik gözetimi için kritik bir rol oynar.
- Yerel Görev Desteği: YOLO26, Oriented Bounding Boxes (OBB), örnek segmentasyonu ve poz tahminini aynı kolaylaştırılmış API içinde yerel olarak kapsamlı bir şekilde destekler.
Bugün yeni bir bilgisayar görüşü projesine başlayan herhangi bir modern geliştirici için, Ultralytics YOLO26'yı Platform üzerinde değerlendirmek, hız, doğruluk ve dağıtım basitliğinin mutlak en iyi dengesini elde etmek için önerilen yoldur. YOLO11 veya YOLOv8 gibi önceki nesillerden yükseltme yapanlar için ise geçiş yalnızca model dizesini değiştirmeyi gerektirir ve anında üstün yeteneklerin kilidini açar.