İçeriğe geç

YOLOX vs. YOLOv9: Teknik Bir Karşılaştırma

Nesne algılama için doğru mimariyi seçmek, bilgisayarla görme projelerinin hızını, doğruluğunu ve dağıtım fizibilitesini etkileyen kritik bir karardır. Bu analiz, 2021'de piyasaya sürülen çok önemli bir ankrajsız model olan YOLOX ile YOLOv9Programlanabilir Gradyan Bilgisinden (PGI) yararlanan ve 2024 yılında tanıtılan son teknoloji ürünü bir mimaridir.

YOLOX, paradigmayı çapasız algılamaya doğru kaydırırken, YOLOv9 derin ağlardaki bilgileri korumak için yeni mekanizmalar sunarak üstün performans ölçümleri sunar. Bu kılavuz, ihtiyaçlarınıza en uygun modeli seçmenize yardımcı olmak için mimarilerini, kıyaslamalarını ve ideal kullanım durumlarını incelemektedir.

YOLOX: Çapasız Öncü

YOLOX, algılama kafasını basitleştirerek ve önceden tanımlanmış bağlantı kutularına olan bağımlılığı ortadan kaldırarak araştırma topluluğu ile endüstriyel uygulamalar arasındaki boşluğu kapatmak için piyasaya sürüldü.

Yazarlar Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
Organization:Megvii
Date: 2021-07-18
Arxiv:arXiv:2107.08430
GitHub:Megvii-BaseDetection/YOLOX
Docs:YOLOX Documentation

Mimaride Öne Çıkanlar

YOLOX, sınıflandırma ve regresyon görevlerini ayıran ayrıştırılmış bir kafa mimarisi sunmuştur. Bu ayrım, modelin daha hızlı yakınsamasını ve daha iyi doğruluk elde etmesini sağlar. Ayrıca, optimum çapa kutusu boyutlarını belirlemek için kümeleme analizi ihtiyacını ortadan kaldıran ve modeli çeşitli nesne şekillerine karşı daha sağlam hale getiren çapasız bir mekanizma kullanır. Ayrıca YOLOX, etiket ataması için SimOTA 'yı kullanır ve eğitim kararlılığını artırmak için süreci bir optimum taşıma problemi olarak ele alır.

Güçlü ve Zayıf Yönler

  • Güçlü yönler: Çapasız tasarım hiperparametre ayarlama sürecini basitleştirir. Ayrıştırılmış kafa, o dönemin birleştirilmiş kafalarına kıyasla yerelleştirme görevleri için genellikle daha yüksek hassasiyet sağlar.
  • Zayıf yönleri: Bir 2021 modeli olarak, daha yeni mimarilerde bulunan modern optimizasyonlardan yoksundur. Gelişmiş veri artırma ve katman birleştirme tekniklerini kullanan modellere kıyasla en yüksek performansa ulaşmak için daha fazla eğitim verisi gerektirebilir.

YOLOv9: Programlanabilir Gradyan Bilgileri

YOLOv9 , derin sinir ağlarının doğasında bulunan "bilgi darboğazı" sorununu ele alarak ileriye doğru önemli bir sıçramayı temsil etmektedir.

Yazarlar Chien-Yao Wang, Hong-Yuan Mark Liao
Organizasyon:Institute of Information Science, Academia Sinica
Tarih: 2024-02-21
Arxiv:arXiv:2402.13616
GitHub:WongKinYiu/yolov9
Docs:Ultralytics YOLOv9 Docs

Mimaride Öne Çıkanlar

YOLOv9 , Programlanabilir Gradyan Bilgisini (PGI ) ve Genelleştirilmiş Verimli Katman Toplama Ağını (GELAN) sunar. PGI, veriler derin katmanlardan geçerken önemli girdi bilgilerinin kaybolmasını önler ve model güncellemeleri için güvenilir gradyan üretimi sağlar. GELAN, parametre kullanımını optimize ederek modelin hafif ancak doğru olmasını sağlar. Bu yenilikler, YOLOv9 'un hem verimlilik hem de ortalama ortalama hassasiyet (mAP) açısından öncekilerden önemli ölçüde daha iyi performans göstermesini sağlar.

Güçlü ve Zayıf Yönler

  • Güçlü yönleri: Olağanüstü doğruluk-parametre oranı, gerçek zamanlı uygulamalar için son derece verimli olmasını sağlar. Mimari, bilgi akışını önceki yinelemelere göre daha iyi korur ve küçük nesnelerin daha iyi algılanmasını sağlar.
  • Zayıf Yönler: Daha yeni bir mimari olduğundan, eski modellere kıyasla güncellenmiş CUDA sürücüleri ve donanım desteği gerektirebilir.

YOLOv9 hakkında daha fazla bilgi edinin

Performans Karşılaştırması

Aşağıdaki tablo YOLOX ve YOLOv9 'un COCO veri kümesi üzerindeki performansını karşılaştırmaktadır. YOLOv9 daha az parametre ile sürekli olarak daha yüksek mAP skorları göstererek GELAN mimarisinin verimliliğini vurgulamaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Analiz: YOLOv9 performans yoğunluğunda önemli bir artış sağlamaktadır. Örneğin, YOLOv9c sadece 25,3 milyon parametre ile %53,0 mAP elde ederken, YOLOX-L %49,7 mAP gibi daha düşük bir skor elde etmek için 54,2 milyon parametre gerektirir. Bu, YOLOv9 'un bu doğruluk kademesi için parametre kullanımı açısından kabaca iki kat daha verimli olduğunu göstermektedir.

Verimlilik Önemlidir

Uç cihazlara dağıtım yaparken, FLOP'lara ve Parametrelere bakmak mAP kadar önemlidir. YOLOv9'un GELAN mimarisi, hesaplama yükünü önemli ölçüde azaltarak daha soğuk çalışan cihazlar ve mobil dağıtımlarda daha uzun pil ömrü sağlar.

Ultralytics Avantajı

YOLOX sağlam bir bağımsız depo olsa da, Ultralytics Ekosistemi içinde YOLOv9 'u kullanmak geliştiriciler ve araştırmacılar için belirgin avantajlar sunar.

Kullanım Kolaylığı ve Entegrasyon

Ultralytics çerçevesi model etkileşimini birleştirir. Basit, sezgisel bir Python API kullanarak YOLOv9 'u eğitebilir, doğrulayabilir ve dağıtabilirsiniz. Bu, genellikle ortam değişkenlerinin ve veri kümesi yollarının daha manuel yapılandırılmasını gerektiren YOLOX kod tabanı ile tezat oluşturur.

from ultralytics import YOLO

# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")

# Run inference on an image
results = model("path/to/image.jpg")

# Train the model on a custom dataset with a single line of code
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Bakımlı Ekosistem

Ultralytics modelleri sürekli güncellemelerden, hata düzeltmelerinden ve topluluk desteğinden yararlanır. Ultralytics HUB ile entegrasyon, ekiplerin karmaşık dışa aktarma komut dosyaları yazmadan veri kümelerini yönetmesine, deneyleri track ve modelleri çeşitli biçimlereONNX, TensorRT, CoreML) dağıtmasına olanak tanıyarak sorunsuz MLOps sağlar.

Performans Dengesi ve Bellek Verimliliği

Ultralytics YOLO modelleri, hız ve doğruluk arasında pratik bir denge için tasarlanmıştır. Ayrıca, eski mimarilere veya ağır transformatör tabanlı modellere kıyasla eğitim sırasında tipik olarak daha düşük bellek gereksinimleri sergilerler. Bu verimlilik, bulut işlem maliyetlerini azaltır ve tüketici sınıfı GPU'larda eğitimi erişilebilir hale getirir.

Çok Yönlülük

YOLOX öncelikle bir nesne algılayıcı olsa da, Ultralytics çerçevesi desteklenen modellerinin yeteneklerini genişletir. Kullanıcılar, benzer sözdizimi ve iş akışlarını kullanarak örnek segmentasyonu, poz tahmini ve yönlendirilmiş sınırlayıcı kutu (OBB) tespiti gibi görevler arasında kolayca geçiş yapabilir; bu, bağımsız araştırma havuzlarının genellikle sahip olmadığı bir çok yönlülüktür.

İdeal Kullanım Senaryoları

YOLOv9 Ne Zaman Seçilmeli

  • Otonom Sistemler: YOLOv9'nin yüksek doğruluğu, uzaktaki küçük engelleri tespit etmenin güvenlik açısından kritik olduğu otonom araçlar için idealdir.
  • Gerçek Zamanlı Analitik: Perakende veya trafik yönetimi için YOLOv9c, yüksek kare hızları ve hassas algılama için en uygun noktayı sunar.
  • Edge AI: GELAN'ın mimari verimliliği, YOLOv9t ve YOLOv9s'yi NVIDIA Jetson veya Raspberry Pi gibi cihazlarda dağıtım için mükemmel hale getirir.

YOLOX Ne Zaman Seçilmeli

  • Eski Entegrasyon: Mevcut bir üretim hattı zaten belirli YOLOX ankrajsız kafa formatı etrafında yoğun bir şekilde tasarlanmışsa.
  • Akademik Araştırma: Özellikle erken dönem çapasız dedektörlerde ayrılmış kafaların davranışını inceleyen araştırmacılar YOLOX'u karşılaştırma için değerli bir temel olarak bulabilirler.

Sonuç

Her iki mimari de bilgisayarla görme tarihindeki yerini almıştır. YOLOX, 2021'de çapaya dayalı statükoya başarıyla meydan okudu. Ancak, YOLOv9 gradyan akış optimizasyonu ve katman birleştirme alanlarında yıllarca süren gelişmeleri içeren modern standardı temsil etmektedir.

Çoğu yeni geliştirme için YOLOv9 önerilen seçimdir. Parametre başına üstün performansı, Ultralytics ekosistemi tarafından sağlanan kullanım kolaylığı, eğitim verimliliği ve sağlam dağıtım seçenekleri ile birleştiğinde, konseptten üretime daha hızlı bir yol sağlar.

Ekosistemdeki diğer modern seçenekleri keşfedin, örneğin YOLO11 ve YOLOv8özel uygulama kısıtlamalarınıza mükemmel uyumu bulmak için.


Yorumlar