YOLOX vs. YOLOv7: Detaylı Teknik Karşılaştırma
Nesne algılama modelleri arasında gezinmek, mimari nüansları ve performans ödünleşimlerini derinlemesine anlamayı gerektirir. Bu kılavuz, YOLOX ile aşağıdaki ürünler arasında kapsamlı bir teknik karşılaştırma sağlar YOLOv7bilgisayarla görme alanını önemli ölçüde şekillendiren iki etkili mimaridir. Projeleriniz için en uygun olanı belirlemenize yardımcı olmak için yapısal yeniliklerini, kıyaslama ölçümlerini ve pratik uygulamalarını keşfediyoruz. Her iki model de kendi lansmanlarında en son gelişmeleri temsil ederken, modern geliştiriciler genellikle birleşik iş akışları ve üstün performans için Ultralytics ekosistemine bakarlar.
Performans Kafa Kafaya
Bir model seçerken, Ortalama Ortalama KesinlikmAP) ve çıkarım gecikmesi arasındaki denge genellikle karar verici faktördür. YOLOX, Nano'dan X'e kadar yüksek oranda ölçeklenebilir bir model ailesi sunar ve çapasız tasarımı sayesinde basitliği vurgular. Buna karşılık YOLOv7 , gelişmiş mimari optimizasyonlar kullanarak gerçek zamanlı uygulamalar için hız-doğruluk dengesini en üst düzeye çıkarmaya odaklanır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Veriler farklı güçlü yönleri ortaya koymaktadır. YOLOXnano inanılmaz derecede hafiftir, bu da onu son derece kısıtlı kaynaklara sahip ortamlar için ideal hale getirir. Bununla birlikte, yüksek performanslı senaryolar için YOLOv7x, T4 GPU'larda önemli ölçüde daha az Kayan Nokta İşlemi (FLOP) ve daha hızlı çıkarım süreleri ile YOLOXx'ten daha yüksek hassasiyet sunarak üstün doğruluk (%53,1 mAP) ve verimlilik göstermektedir.
YOLOX: Çapasız Tasarım ile Sadelik
YOLOX, çapa tabanlı mekanizmayı çapa içermeyen bir yaklaşım lehine bir kenara bırakarak YOLO serisinde bir paradigma değişikliğine işaret etmiştir. Bu tasarım tercihi eğitim sürecini basitleştirmekte ve genellikle alana özgü sezgisel optimizasyon gerektiren manuel çapa kutusu ayarlama ihtiyacını ortadan kaldırmaktadır.
- Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
- Organizasyon:Megvii
- Tarih: 2021-07-18
- Arxiv:https://arxiv.org/abs/2107.08430
- GitHub:https://github.com/Megvii-BaseDetection/YOLOX
Mimari ve Temel Yenilikler
YOLOX, sınıflandırma ve regresyon görevlerini ayıran ayrıştırılmış bir kafa yapısını entegre eder. Bu ayrım, modelin bir nesnenin ne olduğunu ve nerede bulunduğunu tanımak için farklı özellikler öğrenmesini sağlayarak daha hızlı yakınsama ve daha iyi doğruluk sağlar. Ayrıca YOLOX, pozitif örnekleri dinamik olarak temel gerçek nesnelerle eşleştiren ve modelin kalabalık sahnelerdeki sağlamlığını artıran gelişmiş bir etiket atama stratejisi olan SimOTA'yı kullanır.
Ankrajsız ve Ankraj Tabanlı
Geleneksel YOLO modelleri (YOLOX'tan önce) nesne boyutlarını tahmin etmek için önceden tanımlanmış "bağlantı kutuları" kullanmıştır. YOLOX'un çapasız yöntemi, sınırlayıcı kutuları doğrudan piksel konumlarından tahmin ederek hiperparametre sayısını azaltır ve modeli çeşitli veri kümelerine daha genelleştirilebilir hale getirir.
Kullanım Durumları ve Sınırlamalar
YOLOX, model dağıtımının kapsamlı hiperparametre ayarlaması olmadan çeşitli donanım platformlarında kolaylaştırılması gereken senaryolarda mükemmeldir. Hafif varyantları (Nano/Tiny) mobil uygulamalar için popülerdir. Bununla birlikte, daha büyük ölçeklerdeki en yüksek performansı YOLOv7 gibi daha yeni mimariler tarafından aşılmıştır ve YOLO11daha karmaşık özellik birleştirme ağları kullanmaktadır.
YOLOX hakkında daha fazla bilgi edinin
YOLOv7: "Bedava Çanta" Güç Merkezi
YOLOX'tan bir yıl sonra piyasaya sürülen YOLOv7 , çıkarım sonuçlarını yalnızca "eğitilebilir bedava çantalar" yoluyla artırmak için eğitim sürecini optimize etmeyi amaçlayan bir dizi mimari reform sundu.
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Organizasyon: Bilgi Bilimleri Enstitüsü, Academia Sinica
- Tarih: 2022-07-06
- Arxiv:https://arxiv.org/abs/2207.02696
- GitHub:https://github.com/WongKinYiu/yolov7
Mimari ve Temel Yenilikler
YOLOv7 'nin çekirdeğini Genişletilmiş Verimli Katman Toplama Ağı (E-ELAN) oluşturmaktadır. Bu mimari, en kısa ve en uzun gradyan yollarını kontrol ederek ağın daha çeşitli özellikleri öğrenmesini sağlar ve çok derin ağlar için etkili yakınsama sağlar. Ayrıca, YOLOv7 , birleştirme tabanlı modeller için özel olarak tasarlanmış model ölçeklendirme tekniklerini kullanarak, artan model derinliği ve genişliğinin, azalan getiriler olmadan doğrusal olarak performans kazanımlarına dönüşmesini sağlar.
YOLOv7 ayrıca eğitim sırasında kaba-ince denetim sağlamak için yardımcı kafaları etkili bir şekilde kullanır; bu, dağıtım sırasında hesaplama maliyeti eklemeden ana algılama kafasının doğruluğunu artıran bir tekniktir.
Kullanım Durumları ve Sınırlamalar
Olağanüstü hız/doğruluk oranıyla YOLOv7 , her milisaniyenin önemli olduğu gerçek zamanlı video analizi ve uç bilişim görevleri için en iyi rakiptir. Standart GPU donanımında (V100 ve T4 gibi) mümkün olanın sınırlarını zorladı. Bununla birlikte, mimarisinin karmaşıklığı, standart nesne algılama dışındaki özel görevler için değişiklik yapmayı veya ince ayar yapmayı zorlaştırabilir.
YOLOv7 hakkında daha fazla bilgi edinin
Ultralytics Avantajı: Neden Modernize Edilmeli?
YOLOX ve YOLOv7 yetenekli araçlar olmaya devam ederken, bilgisayarla görme alanı hızla ilerliyor. Modern geliştiriciler ve araştırmacılar, aşağıdaki gibi modellerle Ultralytics ekosistemini giderek daha fazla tercih ediyor YOLO11 ve YOLOv8 kapsamlı destekleri, birleşik tasarımları ve kullanım kolaylıkları nedeniyle.
Kolaylaştırılmış Geliştirici Deneyimi
Eski modellerle ilgili en büyük engellerden biri, kod tabanlarının parçalanmasıdır. Ultralytics , tüm model sürümlerinde tutarlı bir şekilde çalışan birleşik bir Python API ve CLI sağlayarak bunu çözer. Tek bir kod satırı ile algılama, bölümleme veya sınıflandırma arasında geçiş yapabilirsiniz.
from ultralytics import YOLO
# Load a model (YOLO11 or YOLOv8)
model = YOLO("yolo11n.pt") # or "yolov8n.pt"
# Run inference on an image
results = model("path/to/image.jpg")
# Export to ONNX for deployment
model.export(format="onnx")
Ultralytics Modellerin Temel Faydaları
- Çok yönlülük: Öncelikle algılamaya odaklanan YOLOX ve YOLOv7'nin aksine, Ultralytics modelleri örnek segmentasyonunu, poz tahminini, sınıflandırmayı ve yönlendirilmiş nesne algılamayı (OBB ) kutudan çıkar çıkmaz destekler.
- Bakımlı Ekosistem: Sık güncellemeler PyTorch, CUDA ve Python'un en son sürümleriyle uyumluluğu sağlar. Aktif topluluk ve ayrıntılı dokümantasyon, ortam sorunlarında hata ayıklamak için harcanan zamanı azaltır.
- Performans Dengesi: YOLO11 gibi modeller, hem YOLOX hem de YOLOv7'den daha üstün doğruluk ve daha düşük gecikme süresi sunan en son teknolojiyi temsil etmektedir. Uç cihazlardan bulut sunucularına kadar çeşitli donanımlarda gerçek zamanlı çıkarım için optimize edilmişlerdir.
- Eğitim Verimliliği: Ultralytics modelleri, değerli GPU saatlerinden tasarruf ederek daha hızlı yakınsayacak şekilde tasarlanmıştır. Önceden eğitilmiş ağırlıklar, çeşitli görevler için kolayca kullanılabilir ve transfer öğrenmeyi kolaylaştırır.
- Bellek Gereksinimleri: Bu modeller verimlilik için tasarlanmıştır, tipik olarak eğitim ve çıkarım sırasında transformatör tabanlı alternatiflere ( RT-DETR gibi) kıyasla daha az VRAM gerektirir, bu da onları tüketici sınıfı donanımlarda erişilebilir kılar.
YOLO11 hakkında daha fazla bilgi edinin
Sonuç
Hem YOLOX hem de YOLOv7 bilgisayarla görme tarihindeki yerlerini aldılar. YOLOX, çapasız yaklaşımı demokratikleştirerek anlaşılması ve küçük cihazlara dağıtılması kolay basitleştirilmiş bir boru hattı sunuyor. YOLOv7 performans sınırlarını zorlayarak, verimli mimari tasarımın hız ve doğrulukta büyük kazançlar sağlayabileceğini kanıtladı.
Bununla birlikte, bugün üretim sınıfı YZ sistemleri kuranlar için öneri büyük ölçüde Ultralytics YOLO Aile. ile YOLO11MLOps'un karmaşıklıklarını ele alan çok yönlü, sağlam ve kullanıcı dostu bir platforma erişim sağlayarak gerçek dünyadaki sorunları çözmeye odaklanmanıza olanak tanır.
Diğer Karşılaştırmaları İnceleyin
Model seçiminizi daha fazla bilgilendirmek için bu ilgili karşılaştırmaları incelemeyi düşünün:
- YOLOX - YOLOv8 Karşılaştırması
- YOLOv7 vs. YOLOv8
- RT-DETR vs. YOLOv7
- YOLOv5 - YOLOX Karşılaştırması
- YOLOv6 vs. YOLOv7