YOLOX - YOLOv7 Karşılaştırması: Detaylı Teknik Bir Karşılaştırma
Nesne algılama modelleri dünyasında gezinmek, mimari nüansları ve performans ödünleşimlerini derinlemesine anlamayı gerektirir. Bu kılavuz, bilgisayar görüşü alanını önemli ölçüde şekillendiren iki etkili mimari olan YOLOX ve YOLOv7 arasında kapsamlı bir teknik karşılaştırma sunar. Projeleriniz için en uygun olanı belirlemenize yardımcı olmak için yapısal yeniliklerini, kıyaslama metriklerini ve pratik uygulamalarını inceliyoruz. Her iki model de kendi lansmanlarında son teknoloji gelişmeleri temsil etse de, modern geliştiriciler genellikle birleşik iş akışları ve en son teknoloji performansı için Ultralytics ekosistemine bakarlar.
Performans Kafa Kafaya
Bir model seçerken, Ortalama Ortalama Hassasiyet (mAP) ve çıkarım gecikmesi arasındaki denge genellikle belirleyici faktördür. YOLOX, bağlantısız tasarımı aracılığıyla basitliği vurgulayarak Nano'dan X'e kadar uzanan son derece ölçeklenebilir bir model ailesi sunar. Tersine, YOLOv7, gelişmiş mimari optimizasyonları kullanarak gerçek zamanlı uygulamalar için hız-doğruluk dengesini en üst düzeye çıkarmaya odaklanır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Veriler farklı güçlü yönleri göstermektedir. YOLOXnano inanılmaz derecede hafiftir, bu da onu son derece kaynak kısıtlı ortamlar için ideal kılar. Bununla birlikte, yüksek performanslı senaryolar için YOLOv7x, daha az Kayan Nokta İşlemi (FLOPs) ve T4 GPU'larda daha hızlı çıkarım süreleri ile YOLOXx'den daha yüksek hassasiyet sunarak üstün doğruluk (%53,1 mAP) ve verimlilik gösterir.
YOLOX: Bağlantısız Tasarım Yoluyla Basitlik
YOLOX, anchor tabanlı mekanizmayı bir anchor'suz yaklaşım lehine bırakarak YOLO serisinde bir paradigma değişikliğine işaret etti. Bu tasarım seçimi, eğitim sürecini basitleştirir ve genellikle alana özgü sezgisel optimizasyon gerektiren manuel anchor kutusu ayarlama ihtiyacını ortadan kaldırır.
- Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
- Kuruluş:Megvii
- Tarih: 2021-07-18
- Arxiv:https://arxiv.org/abs/2107.08430
- GitHub:https://github.com/Megvii-BaseDetection/YOLOX
Mimari ve Temel Yenilikler
YOLOX, sınıflandırma ve regresyon görevlerini ayıran bir ayrık kafa yapısı entegre eder. Bu ayrım, modelin bir nesnenin ne olduğunu ve nerede bulunduğunu tanımak için farklı özellikleri öğrenmesini sağlayarak daha hızlı yakınsamaya ve daha iyi doğruluğa yol açar. Ek olarak, YOLOX, pozitif örnekleri temel doğruluk nesneleriyle dinamik olarak eşleştiren ve modelin kalabalık sahnelerdeki sağlamlığını artıran gelişmiş bir etiket atama stratejisi olan SimOTA'yı kullanır.
Anchorsız - Anchor Tabanlı Karşılaştırması
Geleneksel YOLO modelleri (YOLOX'tan önce) nesne boyutlarını tahmin etmek için önceden tanımlanmış "çapa kutuları" kullanıyordu. YOLOX'un çapasız yöntemi, sınırlayıcı kutuları doğrudan piksel konumlarından tahmin ederek hiperparametrelerin sayısını azaltır ve modeli çeşitli veri kümelerine daha genel hale getirir.
Kullanım Durumları ve Sınırlamalar
YOLOX, model dağıtımının kapsamlı hiperparametre ayarlaması olmadan çeşitli donanım platformlarında kolaylaştırılması gereken senaryolarda mükemmeldir. Hafif varyantları (Nano/Tiny) mobil uygulamalar için popülerdir. Ancak, daha büyük ölçeklerdeki en yüksek performansı, daha karmaşık özellik toplama ağlarını kullanan YOLOv7 ve YOLO11 gibi daha yeni mimariler tarafından aşılmıştır.
YOLOX hakkında daha fazla bilgi edinin
YOLOv7: "Ücretsiz Avantajlar Paketi" Güç Merkezi
YOLOX'tan bir yıl sonra piyasaya sürülen YOLOv7, çıkarım sonuçlarını tamamen "eğitilebilir bedava hediyeler" yoluyla artırmak için eğitim sürecini optimize etmeyi amaçlayan bir dizi mimari reform tanıttı.
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Kuruluş: Bilgi Bilimi Enstitüsü, Academia Sinica
- Tarih: 2022-07-06
- Arxiv:https://arxiv.org/abs/2207.02696
- GitHub:https://github.com/WongKinYiu/yolov7
Mimari ve Temel Yenilikler
YOLOv7'nin özünde Genişletilmiş Verimli Katman Toplama Ağı (E-ELAN) bulunur. Bu mimari, en kısa ve en uzun gradyan yollarını kontrol ederek ağın daha çeşitli özellikleri öğrenmesini sağlar ve çok derin ağlar için etkili yakınsamayı garanti eder. Ayrıca, YOLOv7, model derinliğini ve genişliğini artırmanın, azalan getiriler olmadan performansta doğrusal olarak artışa dönüşmesini sağlayan, özellikle birleştirme tabanlı modeller için tasarlanmış model ölçekleme tekniklerini kullanır.
YOLOv7 ayrıca, eğitim sırasında ana algılama başlığının doğruluğunu dağıtım sırasında hesaplama maliyeti eklemeden artıran bir teknik olan kaba-ince denetim sağlamak için yardımcı başlıkları etkili bir şekilde kullanır.
Kullanım Durumları ve Sınırlamalar
Yüksek hız-doğruluk oranıyla YOLOv7, her milisaniyenin önemli olduğu gerçek zamanlı video analitiği ve uç bilgi işlem görevleri için en iyi yarışmacılardan biridir. Standart GPU donanımında (V100 ve T4 gibi) mümkün olanın sınırlarını zorladı. Ancak, mimarisinin karmaşıklığı, standart nesne tespiti dışındaki özel görevler için değiştirilmesini veya ince ayar yapılmasını zorlaştırabilir.
YOLOv7 hakkında daha fazla bilgi edinin
Ultralytics'in Avantajı: Neden Modernize Etmeli?
YOLOX ve YOLOv7 yetenekli araçlar olmaya devam ederken, bilgisayarla görme alanı hızla ilerliyor. Modern geliştiriciler ve araştırmacılar, kapsamlı destekleri, birleşik tasarımları ve kullanım kolaylıkları nedeniyle YOLO11 ve YOLOv8 gibi modellere sahip Ultralytics ekosistemini giderek daha fazla tercih ediyor.
Kolaylaştırılmış Geliştirici Deneyimi
Eski modellerle ilgili en büyük engellerden biri, kod tabanlarının parçalanmış olmasıdır. Ultralytics, tüm model sürümlerinde tutarlı bir şekilde çalışan birleşik bir Python API'si ve CLI sağlayarak bu sorunu çözer. Tek bir kod satırıyla algılama, segmentasyon veya sınıflandırma arasında geçiş yapabilirsiniz.
from ultralytics import YOLO
# Load a model (YOLO11 or YOLOv8)
model = YOLO("yolo11n.pt") # or "yolov8n.pt"
# Run inference on an image
results = model("path/to/image.jpg")
# Export to ONNX for deployment
model.export(format="onnx")
Ultralytics Modellerinin Temel Faydaları
- Çok Yönlülük: Öncelikli olarak algılamaya odaklanan YOLOX ve YOLOv7'nin aksine, Ultralytics modelleri kutudan çıkar çıkmaz örnek segmentasyonu, poz tahmini, sınıflandırma ve yönlendirilmiş nesne algılama (OBB) özelliklerini destekler.
- İyi Yönetilen Ekosistem: Sık güncellemeler, PyTorch, CUDA ve Python'ın en son sürümleriyle uyumluluğu sağlar. Aktif topluluk ve ayrıntılı dokümantasyon, ortam sorunlarını gidermek için harcanan süreyi azaltır.
- Performans Dengesi: YOLO11 gibi modeller, YOLOX ve YOLOv7'den daha üstün doğruluk ve daha düşük gecikme süresi sunan en son teknolojiyi temsil eder. Uç cihazlardan bulut sunucularına kadar çeşitli donanımlarda gerçek zamanlı çıkarım için optimize edilmiştir.
- Eğitim Verimliliği: Ultralytics modelleri daha hızlı yakınsamak üzere tasarlanmıştır ve değerli GPU saatlerinden tasarruf sağlar. Önceden eğitilmiş ağırlıklar çeşitli görevler için kolayca kullanılabilir ve transfer öğrenimini kolaylaştırır.
- Bellek Gereksinimleri: Bu modeller verimlilik için tasarlanmıştır ve genellikle transformatör tabanlı alternatiflere (RT-DETR gibi) kıyasla eğitim ve çıkarım sırasında daha az VRAM gerektirir, bu da onları tüketici sınıfı donanımda erişilebilir kılar.
YOLO11 hakkında daha fazla bilgi edinin
Sonuç
Hem YOLOX hem de YOLOv7, bilgisayar görüşü tarihinde yerlerini almıştır. YOLOX, ankrajsız (anchor-free) yaklaşımı demokratikleştirerek, küçük cihazlarda anlaşılması ve dağıtılması kolay basitleştirilmiş bir boru hattı sunmuştur. YOLOv7, verimli mimari tasarımın hız ve doğrulukta büyük kazanımlar sağlayabileceğini kanıtlayarak performans sınırlarını zorlamıştır.
Ancak, günümüzde üretim sınıfı yapay zeka sistemleri kuranlar için, öneri büyük ölçüde Ultralytics YOLO ailesine yöneliktir. YOLO11 ile, MLOps'un karmaşıklıklarını ele alan çok yönlü, sağlam ve kullanıcı dostu bir platforma erişim elde edersiniz ve gerçek dünya sorunlarını çözmeye odaklanmanızı sağlar.
Diğer Karşılaştırmaları İnceleyin
Model seçiminizi daha da bilgilendirmek için, bu ilgili karşılaştırmaları keşfetmeyi düşünebilirsiniz:
- YOLOX - YOLOv8 Karşılaştırması
- YOLOv7 - YOLOv8 karşılaştırması
- RT-DETR vs. YOLOv7
- YOLOv5 - YOLOX Karşılaştırması
- YOLOv6 -e karşı YOLOv7