YOLOv7 vs. YOLOX: Detaylı Teknik Karşılaştırma
Bilgisayarla görmenin hızla gelişen ortamında, YOLO (You Only Look Once) model ailesi gerçek zamanlı nesne algılama standardını sürekli olarak belirlemiştir. Bu tarihin iki önemli dönüm noktası şunlardır YOLOv7 ve YOLOX. Her iki model de hız ve doğruluğu dengelemeyi amaçlasa da, mimari felsefelerinde -özellikle çapa tabanlı ve çapasız metodolojiler konusunda- önemli ölçüde farklılaşmaktadır.
Bu kılavuz, araştırmacıların ve mühendislerin kendi özel bilgisayarla görme uygulamaları için doğru aracı seçmelerine yardımcı olmak amacıyla derinlemesine bir teknik karşılaştırma sunmaktadır. Mimarilerini analiz edecek, performanslarını kıyaslayacak ve modern alternatiflerin neden Ultralytics YOLO11 genellikle üstün bir geliştirici deneyimi sağlar.
Performans Ölçütleri: Hız ve Doğruluk
Nesne dedektörlerini değerlendirirken, çıkarım gecikmesi ve Ortalama Ortalama HassasiyetmAP) arasındaki denge çok önemlidir. Aşağıdaki tabloda COCO veri kümesi üzerinde YOLOv7 ve YOLOX varyantları arasında doğrudan bir karşılaştırma sunulmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
Sonuçların Analizi
Veriler, dağıtım kısıtlamalarına bağlı olarak her model ailesi için farklı avantajları vurgulamaktadır. YOLOv7 yüksek performans aralığında olağanüstü verimlilik göstermektedir. Örneğin, YOLOv7l sadece 36,9 milyon parametre ile %51,4 mAP elde ederek YOLOXx 'ten (%51,1 mAP, 99,1 milyon parametre) daha iyi performans gösterirken önemli ölçüde daha az hesaplama kaynağı kullanmaktadır. Bu da YOLOv7 ' yiGPU verimliliğinin kritik olduğu ancak belleğin kısıtlı olduğu senaryolar için güçlü bir aday haline getirmektedir.
Buna karşılık, YOLOX hafiflik kategorisinde parlıyor. YOLOX-Nano modeli (0,91M parametre), en küçük standart YOLO modellerinin bile çok ağır olabileceği ultra düşük güçlü uç cihazlar için uygun bir çözüm sunar. Ölçeklenebilir derinlik-genişlik çarpanları, çok çeşitli donanım profillerinde ince ayar yapılmasına olanak tanır.
YOLOv7: Optimize Edilmiş Ücretsiz Çantalar
Temmuz 2022'de piyasaya sürülen YOLOv7 , çıkarım maliyetlerine neden olmadan eğitim sürecini optimize etmek için tasarlanmış çeşitli mimari yenilikler getirmiştir.
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
- Tarih: 2022-07-06
- Kağıt:Arxiv Bağlantısı
- GitHub:YOLOv7 Deposu
YOLOv7 hakkında daha fazla bilgi edinin
Mimari Öne Çıkanlar
YOLOv7 , eğitim sırasında doğruluğu artıran ancak çıkarım sırasında kaldırılan veya birleştirilen "eğitilebilir serbest torba"-optimizasyon yöntemlerine odaklanmaktadır. Temel özellikler şunlardır:
- E-ELAN (Genişletilmiş Verimli Katman Toplama Ağı): En kısa ve en uzun gradyan yollarını kontrol ederek modelin çeşitli özellikleri öğrenme yeteneğini artıran geliştirilmiş bir backbone yapısı.
- Model Ölçeklendirme: YOLOv7 , basitçe derinliği veya genişliği ölçeklendirmek yerine, birleştirme tabanlı modeller için bileşik bir ölçeklendirme yöntemi kullanır ve yukarı ölçeklendirme sırasında optimum yapıyı korur.
- Yardımcı Kafa Kaba-İnce: Eğitim sırasında denetime yardımcı olmak için yardımcı bir kayıp kafası kullanılır ve daha sonra çıkarım için ana kafaya yeniden parametrelendirilir.
Yeniden parametrelendirme
YOLOv7 , farklı eğitim modüllerinin çıkarım için matematiksel olarak tek bir konvolüsyonel katman halinde birleştirildiği planlı yeniden parametrelendirmeyi kullanır. Bu, eğitim sırasında kazanılan özellik öğrenme kabiliyetinden ödün vermeden çıkarım gecikmesini önemli ölçüde azaltır.
YOLOX: Çapasız Evrim
2021'de piyasaya sürülen YOLOX, anlamsal segmentasyon yaklaşımlarına benzer şekilde çapa kutularından çapasız bir mekanizmaya doğru hareket ederek YOLO paradigmasında bir değişimi temsil ediyordu.
- Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
- Kuruluş: Megvii
- Tarih: 2021-07-18
- Kağıt:Arxiv Bağlantısı
- GitHub:YOLOX Deposu
YOLOX Karşılaştırması hakkında daha fazla bilgi edinin
Mimari Öne Çıkanlar
YOLOX, YOLOv4 ve YOLOv5 gibi önceki sürümlerde yaygın bir sorun noktası olan manuel bağlantı kutusu ayarlama ihtiyacını ortadan kaldırarak algılama işlem hattını basitleştirdi.
- Çapasız Mekanizma: YOLOX, nesnelerin merkezini doğrudan tahmin ederek çapalarla ilişkili karmaşık hiperparametreleri ortadan kaldırır ve çeşitli veri kümelerinde genelleştirmeyi geliştirir.
- Ayrılmış Kafa: Sınıflandırma ve yerelleştirmeyi tek bir kafada birleştiren önceki YOLO sürümlerinin aksine, YOLOX bunları ayırır. Bu, daha hızlı yakınsama ve daha iyi doğruluk sağlar.
- SimOTA: Pozitif örnekleri dinamik olarak en düşük maliyetle temel gerçeğe atayan, sınıflandırma ve regresyon kayıplarını etkili bir şekilde dengeleyen gelişmiş bir etiket atama stratejisi.
Ultralytics Modeller Neden Tercih Ediliyor?
YOLOv7 ve YOLOX mimaride farklılık gösterirken, her ikisi de modern Ultralytics YOLO modelleri tarafından kullanılabilirlik ve ekosistem desteği açısından aşılmıştır. Sağlam ve geleceğe dönük bir çözüm arayan geliştiriciler için YOLO11 belirgin avantajlar sunmaktadır.
1. Birleşik Ekosistem ve Kullanım Kolaylığı
YOLOv7 ve YOLOX genellikle belirli GitHub depolarının klonlanmasını, karmaşık bağımlılık gereksinimlerinin yönetilmesini ve veriler için farklı formatların kullanılmasını gerektirir. Buna karşılık Ultralytics , tüm görevleri birleştiren pip ile kurulabilir bir paket sunar.
from ultralytics import YOLO
# Load a model (YOLO11n recommended for speed)
model = YOLO("yolo11n.pt")
# Train on a custom dataset with a single line
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
2. Üstün Performans Dengesi
Kıyaslamalarda gösterildiği gibi, modern Ultralytics modelleri hız ve doğruluk arasında daha iyi bir denge sağlar. YOLO11 hem YOLOX (çapasız tasarım) hem de YOLOv7 'nin (gradyan yolu optimizasyonu) ilerlemelerinden öğrenen optimize edilmiş çapasız bir mimari kullanır. Bu, yalnızca CPU çıkarımında daha hızlı olmakla kalmayıp aynı zamanda eğitim sırasında daha az CUDA belleği gerektiren modellerle sonuçlanır ve bu da onları daha geniş bir donanım yelpazesinde erişilebilir hale getirir.
3. Görevler Arasında Çok Yönlülük
YOLOv7 ve YOLOX öncelikle nesne algılama için tasarlanmıştır. Ultralytics modelleri, API'yi değiştirmeden bu yeteneği yerel olarak bir dizi bilgisayarla görme görevine genişletir:
- Örnek Segmentasyonu: Piksel düzeyinde nesne anlama.
- Poz Tahmini: İnsan vücudundaki anahtar noktaları tespit etme.
- Yönlendirilmiş Nesne Algılama (OBB): Döndürülmüş nesnelerin algılanması (örn. hava görüntüleri).
- Sınıflandırma: Bir görüntünün tamamına bir sınıf etiketi atama.
4. Sorunsuz Dağıtım ve MLOps
Bir modeli araştırmadan üretime taşımak eski çerçevelerle zordur. Ultralytics ekosistemi, model dağıtımını basitleştiren ONNX, TensorRT, CoreML ve OpenVINO için yerleşik dışa aktarma modları içerir. Ayrıca, Ultralytics HUB ile entegrasyonlar, web tabanlı veri seti yönetimi, uzaktan eğitim ve uç cihazlara tek tıklamayla dağıtım sağlar.
YOLO11 hakkında daha fazla bilgi edinin
Sonuç
Hem YOLOv7 hem de YOLOX bilgisayarla görme alanına önemli katkılarda bulunmuştur. YOLOv7GPU cihazlarında en yüksek performans için mimariyi optimize ederek "bag-of-freebies" yaklaşımının verimliliğini en üst düzeye çıkardı. YOLOX, boru hattını basitleştirerek ve genellemeyi geliştirerek çapasız algılamanın uygulanabilirliğini başarıyla göstermiştir.
Ancak, modern geliştirme iş akışları için, Ultralytics YOLO11 üstün bir seçim olarak öne çıkıyor. Öncüllerinin mimari güçlerini eşsiz bir Python API'si, daha düşük bellek gereksinimleri ve kapsamlı bir vizyon görevleri yelpazesi desteğiyle birleştirir. İster bir uç cihaza ister bir bulut sunucusuna dağıtıyor olun, Ultralytics ekosisteminin aktif topluluğu ve kapsamlı dokümantasyonu, üretime giden daha sorunsuz bir yol sağlar.
Diğer Modelleri İnceleyin
Daha fazla teknik karşılaştırmayla ilgileniyorsanız, bu kaynakları keşfedin:
- YOLOv7 vs. YOLOv8: Performanstaki nesilsel sıçramaya bir bakış.
- RT-DETR vs. YOLOv7: Transformatörlerin CNN'lerle Karşılaştırılması.
- YOLO11 vs. YOLOv10: Gerçek zamanlı algılamada en son gelişmeler.