İçeriğe geç

YOLOX vs YOLOv5: Çapasız Yenilik ve Kanıtlanmış Verimliliği Keşfetmek

Nesne algılamanın hızla gelişen ortamında, doğru mimariyi seçmek proje başarısı için çok önemlidir. Bu karşılaştırma iki etkili modeli incelemektedir: Çapasız tasarımıyla tanınan akademik bir güç merkezi olan YOLOX ve YOLOv5hız ve dağıtım kolaylığı açısından endüstri standardıdır. Her iki model de bilgisayarla görme alanını şekillendirmiştir, ancak önceliğinizin araştırma sınıfı hassasiyet mi yoksa üretime hazır verimlilik mi olduğuna bağlı olarak farklı ihtiyaçlara hizmet ederler.

Performans Analizi: Hız, Doğruluk ve Verimlilik

YOLOX ve YOLOv5 değerlendirilirken, ayrım genellikle ham doğruluk ve operasyonel verimlilik arasındaki değiş tokuşa dayanır. YOLOX, piyasaya sürüldüğünde en gelişmiş mAP (ortalama Ortalama Hassasiyet) puanlarını elde etmesini sağlayan ayrılmış bir kafa ve çapasız bir mekanizma gibi önemli mimari değişiklikler getirmiştir. Özellikle COCO gibi zor kıyaslamalarda her yüzde puanlık doğruluğun önemli olduğu senaryolarda üstünlük sağlar.

Tersine, Ultralytics YOLOv5 "gerçek dünya" performansına odaklanarak tasarlanmıştır. Çıkarım hızına ve düşük gecikme süresine öncelik verir, bu da onu mobil uygulamalar, gömülü sistemler ve uç yapay zeka cihazları için son derece uygun hale getirir. YOLOX, belirli büyük modeller için mAP 'de hafif bir avantaja sahip olsa da, YOLOv5 , kapsamlı Ultralytics ekosisteminden yararlanarak verim (saniye başına kare) ve dağıtım esnekliğinde sürekli olarak daha iyi performans gösterir.

Aşağıdaki tablo, çeşitli boyutlardaki modellerin ayrıntılı bir yan yana karşılaştırmasını sunmaktadır. YOLOv5 'in rekabetçi doğruluğu nasıl koruduğuna dikkat edin, aynı zamanda özellikle aşağıdakilerle optimize edildiğinde önemli ölçüde daha hızlı çıkarım süreleri sunar TensorRT.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOX: Çapasız Yarışmacı

YOLO , Megvii'deki araştırmacılar tarafından YOLO serisi ile çapasız tespit alanındaki akademik gelişmeler arasındaki boşluğu doldurmak amacıyla geliştirilmiştir. Önceden tanımlanmış çapa kutuları kısıtlamasını ortadan kaldıran YOLOX, eğitim sürecini basitleştirir ve sezgisel ayarlama ihtiyacını azaltır.

Mimari ve Yenilikler

YOLOX, sınıflandırma ve regresyon görevlerini farklı dallara ayıran bir Ayrıştırılmış Başlık içerir. Bu tasarım, önceki YOLO sürümlerinin birleşik kafalarıyla tezat oluşturmakta ve yakınsama hızını ve doğruluğunu artırdığı bildirilmektedir. Ayrıca, pozitif örnekleri dinamik olarak atayan ve modelin yoğun sahnelerdeki sağlamlığını artıran gelişmiş bir etiket atama stratejisi olan SimOTA'yı kullanır.

Güçlü ve Zayıf Yönler

YOLOX'un birincil gücü, özellikle en büyük varyantlarında (YOLOX-x) yüksek doğruluk tavanı ve araştırmacılara hitap eden temiz, çapasız tasarımında yatmaktadır. Ancak bu avantajlar bazı ödünleri de beraberinde getirmektedir. Ayrıştırılmış kafa, hesaplama karmaşıklığı ekler ve genellikle YOLOv5'e kıyasla daha yavaş çıkarımla sonuçlanır. Ayrıca, araştırma odaklı bir model olarak, Ultralytics ekosisteminde bulunan uyumlu, kullanıcı dostu araçlardan yoksundur ve potansiyel olarak ticari boru hatlarına entegrasyonu zorlaştırır.

İdeal Kullanım Senaryoları

  • Akademik Araştırma: Yeni algılama mimarileri ve etiket atama stratejileri ile denemeler.
  • Yüksek Hassasiyetli Görevler: Çevrimdışı video analizi gibi, mAP 'de %1-2'lik bir kazancın daha yavaş çıkarım maliyetinden daha ağır bastığı senaryolar.
  • Yoğun Nesne Algılama: SimOTA'nın iyi performans gösterdiği çok karmaşık nesnelerin bulunduğu ortamlar.

YOLOX hakkında daha fazla bilgi edinin

YOLOv5: Üretim Standardı

2020'de piyasaya sürülmesinden bu yana Ultralytics YOLOv5 dünya çapında geliştiriciler için tercih edilen bir model haline gelmiştir. Makine öğrenimi operasyonlarının (MLOps) tüm yaşam döngüsünü kolaylaştırmak için tasarlanmış bir platform tarafından desteklenen bu model, performans ve pratiklik arasında olağanüstü bir denge kuruyor.

Mimari ve Ekosistem

YOLOv5 , verimli özellik çıkarımı için optimize edilmiş bir CSPNet backbone ve bir yol toplama ağı (PANet) boynu kullanır. Başlangıçta PyTorch'taki çapa tabanlı yaklaşımı popüler hale getirmiş olsa da, en büyük varlığı çevresindeki ekosistemdir. Kullanıcılar ONNX, CoreML ve TFLite gibi formatlara otomatik dışa aktarımın yanı sıra model eğitimi ve yönetimi için Ultralytics HUB ile sorunsuz entegrasyondan yararlanır.

Biliyor muydunuz?

YOLOv5 sınırlayıcı kutularla sınırlı değildir. Örnek segmentasyonu ve görüntü sınıflandırması gibi birden fazla görevi destekleyerek karmaşık görüntü işleme hatları için çok yönlü bir araç haline getirir.

Güçlü ve Zayıf Yönler

Kullanım kolaylığı YOLOv5'in ayırt edici özelliğidir. Basit bir Python API ile geliştiriciler önceden eğitilmiş ağırlıkları yükleyebilir ve sadece birkaç satır kodla çıkarım yapabilir. Model, hız için son derece optimize edilmiştir ve YOLOX'a kıyasla hem CPU'larda hem de GPU'larda sürekli olarak daha düşük gecikme süresi sunar. Ayrıca eğitim sırasında daha düşük bellek gereksinimi sunarak standart donanımda erişilebilir olmasını sağlar. Çapa tabanlı tasarımı, özel veri kümeleri için çapa evrimi gerektirse de ( YOLOv5 tarafından otomatik olarak işlenir), güvenilirliği ve bakımlı ekosistemi onu üretim için üstün kılar.

İdeal Kullanım Senaryoları

  • Gerçek Zamanlı Uygulamalar: Düşük gecikme süresinin kritik olduğu video gözetimi, otonom sürüş ve robotik.
  • Edge Dağıtımı: Verimli mimarisi sayesinde Raspberry Pi, NVIDIA Jetson veya mobil cihazlarda çalışır.
  • Ticari Ürünler: Uzun vadeli destek ve entegrasyon kolaylığının gerekli olduğu hızlı prototipleme ve dağıtım.
  • Çok Görevli Görme: Tek bir çerçeve içinde algılama, segmentasyon ve sınıflandırma gerektiren projeler.

YOLOv5 hakkında daha fazla bilgi edinin

Kod Örneği: YOLOv5 'i Ultralytics ile Çalıştırma

Ultralytics Python paketi, YOLOv5 modellerini kullanmayı inanılmaz derecede basit hale getirir. Aşağıda, önceden eğitilmiş bir model kullanarak çıkarımın nasıl çalıştırılacağına dair bir örnek verilmiştir.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model (Nano version for speed)
model = YOLO("yolov5nu.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Sonuç: Doğru Seçimi Yapmak

Her iki model de bilgisayarla görmede önemli başarıları temsil ediyor, ancak farklı kitlelere hitap ediyorlar. YOLOX, daha parçalı bir araç setinde rahatça gezinebilen ve çapasız algılamanın sınırlarını zorlayan araştırmacılar için zorlu bir seçimdir.

Ancak, geliştiricilerin, mühendislerin ve işletmelerin büyük çoğunluğu için, Ultralytics YOLOv5 üstün seçenek olmaya devam ediyor. Rakipsiz hız, çok yönlülük ve sağlam, aktif bir ekosistemin kazanan kombinasyonu, konseptten dağıtıma minimum sürtünme ile geçebilmenizi sağlar. Ayrıca, Ultralytics çerçevesinin benimsenmesi, aşağıdaki gibi yeni nesil modellere açık bir yükseltme yolu sağlar YOLO11Çapasız tasarımın en iyi özelliklerini Ultralytics'in kendine özgü verimliliği ile birleştirir.

Diğer Model Karşılaştırmaları

Özel ihtiyaçlarınıza en uygun modeli bulmak için bu modellerin diğer mimariler karşısında nasıl durduğunu keşfedin:


Yorumlar