YOLOv5 vs YOLOX: Mimari Değişimler ve Performans Ölçütleri
Nesne algılama ortamı, çıkarım hızı ve algılama doğruluğu arasındaki optimum denge için yarışan çeşitli mimarilerle hızla gelişmiştir. Bu yolculuktaki iki önemli kilometre taşı şunlardır YOLOv5Ultralytics tarafından geliştirilen YOLOX ve Megvii'nin araştırma odaklı bir modeli olan YOLOX. Her iki model de "You Only Look Once" (Sadece Bir Kez Bakarsın) soyundan gelmekle birlikte, mimari felsefelerinde -özellikle çapa tabanlı ve çapasız tespit mekanizmaları konusunda- önemli ölçüde farklılaşmaktadırlar.
Bu karşılaştırma, geliştiricilerin ve araştırmacıların bilgisayarla görme projeleri için doğru aracı seçmelerine yardımcı olmak amacıyla her iki modelin teknik özelliklerini, mimari farklılıklarını ve performans ölçümlerini incelemektedir.
Ultralytics YOLOv5: Mühendislik Standardı
2020 yılında piyasaya sürülen YOLOv5 , kısa sürede pratik nesne algılama için endüstri standardı haline geldi. Öncelikli olarak akademik araştırma projeleri olan öncüllerinin aksine, YOLOv5 kullanılabilirlik, dağıtım kolaylığı ve gerçek dünya performansına odaklanarak tasarlandı. Özel modellerin eğitimini ve dağıtımını daha geniş bir kitle için erişilebilir hale getiren modern PyTorch bir iş akışı sundu.
- Yazarlar: Glenn Jocher
- Organizasyon:Ultralytics
- Tarih: 2020-06-26
- GitHub:https://github.com/ultralytics/yolov5
- Dokümanlar:https://docs.ultralytics.com/models/yolov5/
YOLOv5 , nesne konumlarını tahmin etmek için önceden tanımlanmış çapa kutularını kullanan çapa tabanlı bir mimari kullanır. Eğitimden önce özel veri kümelerine uyacak şekilde çapa şekillerini geliştiren ve optimum yakınsama sağlayan bir "AutoAnchor" özelliğini entegre eder. Model, hızlı özellik çıkarma ve toplama için optimize edilmiş bir CSPNet backbone ve bir PANet boynuna sahiptir. Birincil gücü, olağanüstü çıkarım hızı ve düşük bellek ayak izinde yatmaktadır, bu da onu uç bilişim ve mobil uygulamalar için ideal hale getirmektedir.
YOLOv5 hakkında daha fazla bilgi edinin
YOLOX: Çapasız Yarışmacı
Megvii tarafından 2021 yılında piyasaya sürülen YOLOX, çapasız bir tasarım benimseyerek YOLO ailesinin sınırlarını zorlamaya çalıştı. Bu yaklaşım, nesne merkezlerini ve boyutlarını doğrudan tahmin etmek yerine önceden tanımlanmış çapa kutularına olan ihtiyacı ortadan kaldırıyor. Bu değişim, tasarım sürecini basitleştirmeyi ve çeşitli nesne şekilleri arasında genelleştirmeyi geliştirmeyi amaçlıyordu.
- Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
- Organizasyon:Megvii
- Tarih: 2021-07-18
- Arxiv:https://arxiv.org/abs/2107.08430
- GitHub:https://github.com/Megvii-BaseDetection/YOLOX
- Dokümanlar:https://yolox.readthedocs.io/en/latest/
YOLOX, sınıflandırma ve regresyon görevlerini farklı dallara ayırarak ayrıştırılmış bir kafa mimarisi sunar. Bu teorik olarak modelin bir nesnenin ne olduğunu ve nerede olduğunu tanımlamak için farklı özellik temsillerini öğrenmesine olanak tanır. Ayrıca, eğitim sırasında pozitif örnekleri dinamik olarak atamak için SimOTA (Basitleştirilmiş Optimal Taşıma Ataması) olarak bilinen gelişmiş bir etiket atama stratejisi kullanır. Bu yenilikler yüksek doğruluğa katkıda bulunurken, genellikle artan hesaplama karmaşıklığı ile birlikte gelir.
YOLOX hakkında daha fazla bilgi edinin
En Son Teknolojiyi mi Arıyorsunuz?
YOLOv5 ve YOLOX bilgisayarla görme tarihinde önemli adımları temsil ederken, alan hızla ilerliyor. YOLO11Ultralytics'in en yeni modeli, algılama, segmentasyon, poz tahmini ve daha fazlasını destekleyen rafine bir mimariye sahip olarak her ikisine kıyasla üstün doğruluk ve hız sunar.
Performans Analizi: Hız - Doğruluk Karşılaştırması
YOLOv5 ve YOLOX karşılaştırılırken, genellikle mutlak hassasiyete karşı çıkarım gecikmesi üzerinde durulur. YOLOv5 , özellikle donanım hızlandırıcılarında hız için titizlikle optimize edilmiştir. TensorRT ve ONNX Çalışma Zamanı. Aşağıdaki verilerde gösterildiği gibi, YOLOv5 modelleri eşdeğer model boyutlarında önemli ölçüde daha düşük gecikme süresi (daha yüksek hız) göstermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
Temel Çıkarımlar
- Çıkarım Hızı: YOLOv5 hız konusunda belirleyici bir avantaja sahiptir. Örneğin, YOLOv5n sadece 1,12 ms'lik bir TensorRT gecikmesi elde ederek NVIDIA Jetson gibi uç cihazlarda yüksek FPS video işleme için son derece uygun hale gelir. Buna karşılık, en küçük YOLOX modelleri CPU için karşılaştırılabilir kıyaslama verilerinden yoksundur ve GPU gecikmeleri genellikle benzer doğruluk seviyeleri için daha yüksektir.
- Doğruluk (mAP): YOLOX biraz daha yüksek doğruluk elde etme eğilimindedir mAPCOCO veri setinde, özellikle de daha büyük varyantlarında (51,1'de YOLOX-x ve 50,7'de YOLOv5x) puanlar. Bu, nesne varyasyonlarını daha iyi idare edebilen çapasız tasarımına ve ayrılmış kafasına bağlanmaktadır. Bununla birlikte, bu marjinal kazanç genellikle önemli ölçüde daha yüksek hesaplama ek yükü (FLOP'lar) pahasına gelir.
- Verimlilik: YOLOv5 modelleri, belirli bir çıkarım hızı için genellikle daha az FLOP gerektirir. YOLOv5 'in birleşik kafa tasarımı daha donanım dostudur ve hem CPU'larda hem de GPU'larda daha hızlı yürütmeye olanak tanır.
Mimari Derinlemesine İnceleme
Temel fark, her bir modelin tespit sorununa nasıl yaklaştığında yatmaktadır.
YOLOv5 (Çapa Tabanlı): YOLOv5 önceden tanımlanmış bir dizi çapa kutusu kullanır. Eğitim sırasında model bu kutuları nesnelere uyacak şekilde ayarlamayı öğrenir. Bu yöntem, nesnenin boyutu ile ızgara hücresi boyutu arasındaki korelasyona dayanır.
- Artıları İstikrarlı eğitim, yerleşik metodoloji, standart veri kümelerinde mükemmel performans.
- Eksileri: Egzotik veri kümelerinde çapalar için hiperparametre ayarı gerektirir (ancak YOLOv5'in AutoAnchor özelliği bunu hafifletir).
YOLOX (Çapasız): YOLOX nesne tespitini bir nokta regresyon problemi olarak ele alır. Izgara hücresinin merkezinden nesnenin sınırlarına olan mesafeyi tahmin eder.
- Artıları Tasarım parametrelerinin sayısını azaltır (ayarlanacak çapa yoktur), düzensiz en-boy oranlarında daha iyi genelleme potansiyeli.
- Eksileri: Eğitim sırasında yakınsama daha yavaş olabilir ve ayrıştırılmış kafa, çıkarım gecikmesini artıran katmanlar ekler.
Kullanıcı Deneyimi ve Ekosistem
Türkiye'nin en belirleyici özelliklerinden biri Ultralytics YOLOv5 sağlam ekosistemidir. YOLOX güçlü bir akademik temel sağlarken, YOLOv5 geliştiriciler için tasarlanmış ürüne hazır bir çerçeve sunuyor.
Kullanım Kolaylığı
YOLOv5 , "başlangıçtan bitişe" basitliği ile ünlüdür. Ultralytics ekosistemi, veri açıklamasından model eğitimine ve dağıtımına kadar her adımı kolaylaştırır. Model birkaç satır kodla yüklenebilir ve aşağıdaki gibi formatlara otomatik dışa aktarmayı destekler TFLite, CoreMLve ONNX.
import torch
# Load a pretrained YOLOv5s model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")
# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")
# Print results
results.print()
Çok Yönlülük ve Bakım
Ultralytics modelleri sadece algılama ile ilgili değildir. Çerçeve, görüntü sınıflandırma ve örnek segmentasyonunu destekleyerek birden fazla görev için birleşik bir API sunar. Bu çok yönlülük, öncelikle algılamaya odaklanan YOLOX gibi araştırmaya özel depolarda genellikle eksiktir. Ayrıca, Ultralytics 'in aktif bakımı PyTorch ve CUDA'nın en son sürümleriyle uyumluluk sağlayarak zaman içinde "kod çürümesini" azaltır.
İdeal Kullanım Senaryoları
Aşağıdaki durumlarda Ultralytics YOLOv5 'i seçin:
- Uç cihazlarda (Raspberry Pi, cep telefonları) gerçek zamanlı performansa ihtiyacınız var.
- Dağıtım kolaylığına öncelik veriyorsunuz ve TensorRT, CoreML veya TFLite'a dışa aktarma için yerleşik desteğe ihtiyacınız var.
- Aktif topluluk desteğine sahip kararlı, iyi belgelenmiş bir çerçeveyi tercih edersiniz.
- Uygulamanız, düşük gecikme süresinin kritik olduğu güvenlik gözetimi veya otonom navigasyon içerir.
Aşağıdaki durumlarda YOLOX'u seçin:
- Özellikle ankrajsız mimariler üzerine akademik araştırmalar yürütüyorsunuz.
- Çıkarım hızından bağımsız olarak, bir yarışma veya kıyaslama için mutlak maksimum mAP 'ye ihtiyacınız vardır.
- Çapa tabanlı yöntemlerin bariz bir şekilde başarısız olduğu (örneğin, aşırı en boy oranları) özel bir veri kümeniz var ve AutoAnchor sorunu çözmedi.
Sonuç
Hem YOLOv5 hem de YOLOX bilgisayarla görme tarihindeki yerlerini aldılar. YOLOX, YOLO ailesindeki çapasız dedektörlerin uygulanabilirliğini göstererek akademik araştırmalar için güçlü bir temel oluşturmuştur. Ancak, pratik uygulamaların büyük çoğunluğu için, Ultralytics YOLOv5 eşsiz hızı, verimliliği ve geliştirici dostu ekosistemi nedeniyle üstün bir seçim olmaya devam ediyor.
Bugün yeni projelere başlayanlar için şunları keşfetmenizi şiddetle tavsiye ederiz YOLO11. YOLOv5'in kullanım YOLOv5ve hız gibi güçlü yönlerini temel alırken, doğruluk ve çok yönlülük açısından hem YOLOv5 hem de YOLOX'u aşan modern mimari gelişmeleri entegre eder.
Diğer Model Karşılaştırmaları
Ultralytics modellerinin alandaki diğer mimarilerle nasıl karşılaştırıldığını keşfedin:
- YOLOv5 - YOLOv8 Karşılaştırması
- YOLO11 - YOLOX karşılaştırması
- RT-DETR - YOLOv5 Karşılaştırması
- YOLOv8 - YOLOX karşılaştırması
- YOLOv10 vs YOLOX