İçeriğe geç

YOLOv9 vs YOLOX: Kapsamlı Bir Teknik Karşılaştırma

Doğru nesne algılama mimarisini seçmek, bilgisayarla görme uygulamalarının verimliliğini, doğruluğunu ve ölçeklenebilirliğini etkileyen kritik bir karardır. Bu kılavuz, aşağıdakiler arasında ayrıntılı bir teknik karşılaştırma sağlar YOLOv92024'te tanıtılan son teknoloji ürünü bir model ve 2021'de piyasaya sürülen yüksek performanslı çapasız bir dedektör olan YOLOX.

YOLOv9: Derin Ağlarda Bilgi Kaybının Üstesinden Gelmek

YOLOv9 , veriler derin sinir ağlarından geçerken bilgi kaybının temel zorluğunu ele almak için tasarlanmış gerçek zamanlı nesne algılamada önemli bir sıçramayı temsil eder.

Yazarlar Chien-Yao Wang, Hong-Yuan Mark Liao
Organizasyon: Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
Tarih: 2024-02-21
Arxiv:arXiv:2402.13616
GitHub:WongKinYiu/yolov9
Docs:docs.ultralytics.com/models/yolov9/

Mimarlık ve İnovasyon

YOLOv9 'un temel yeniliği iki temel bileşende yatmaktadır: Programlanabilir Gradyan Bilgisi (PGI ) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN).

  • Programlanabilir Gradyan Bilgisi (PGI): Derin ağlarda, bilgi darboğazı olarak bilinen bir olgu olan özellik çıkarma işlemi sırasında önemli girdi verileri genellikle kaybolur. PGI, güvenilir gradyan üretimi sağlayan yardımcı bir denetim sinyali sağlayarak modelin çıkarım maliyetini artırmadan daha etkili özellikler öğrenmesine olanak tanır.
  • GELAN: Bu mimari tasarım parametre kullanımını ve hesaplama verimliliğini optimize eder. Verimli Katman Toplama Ağları (ELAN) kavramını genelleştiren GELAN, hesaplama bloklarının esnek bir şekilde istiflenmesine olanak tanıyarak hem hafif hem de hızlı bir model ortaya çıkarır.

Bu yenilikler, YOLOv9 'un COCO veri setinde üst düzey performans elde etmesini sağlayarak hem doğruluk hem de parametre verimliliği açısından önceki yinelemeleri geride bırakmıştır.

YOLOv9 hakkında daha fazla bilgi edinin

YOLOX: Çapasız Standart

YOLOX, YOLO serisinde çapasız yaklaşımı yaygınlaştırarak akademik araştırma ve endüstriyel uygulama arasındaki boşluğu doldurmak için tanıtıldı.

Yazarlar Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
Organizasyon: Megvii
Tarih: 2021-07-18
Arxiv:arXiv:2107.08430
GitHub:Megvii-BaseDetection/YOLOX
Docs:yolox.readthedocs.io

Temel Mimari Özellikler

YOLOX, ankraj kutularını kaldırarak ve ayrılmış bir kafa yapısı kullanarak önceki YOLO versiyonlarından ayrılır.

  • Çapasız Tasarım: Geleneksel dedektörler, sezgisel ayarlama ve kümeleme gerektiren önceden tanımlanmış bağlantı kutularına dayanır. YOLOX, nesne algılamayı bir nokta tahmin problemi olarak ele alarak tasarımı basitleştirir ve farklı nesne şekilleri arasında genellemeyi geliştirir.
  • Ayrılmış Başlık: Sınıflandırma ve regresyon görevleri ayrı dallarda (başlıklar) işlenir. Bu ayrım, modelin her bir görev için bağımsız olarak optimizasyon yapmasını sağlayarak daha hızlı yakınsama ve daha iyi doğruluk sağlar.
  • SimOTA: Pozitif örnekleri dinamik olarak temel gerçek nesnelerine atayarak performansı daha da artıran gelişmiş bir etiket atama stratejisi.

Performans Analizi: Metrikler ve Kıyaslamalar

Performans analizi yapıldığında, YOLOv9 daha yeni bir mimari olmasıyla tutarlı olarak açık bir avantaj göstermektedir. PGI ve GELAN'dan yararlanan YOLOv9 , YOLOX'a kıyasla hesaplama yükünü (FLOP'lar) korurken veya azaltırken daha yüksek Ortalama Hassasiyet (mAP) elde eder.

Aşağıdaki tablo performans farklılıklarını vurgulamaktadır. Özellikle, YOLOv9, parametre sayısının yarısından daha azıyla (25,3M'ye karşı 54,2M) YOLOX-L 'den (%49,7) önemli ölçüde daha yüksek bir mAP (%53,0) elde etmektedir. Bu verimlilik, YOLOv9 'u donanım kaynaklarının kısıtlı olduğu ancak yüksek doğruluk gerektiren uygulamalar için üstün bir seçim haline getirmektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Hız ve Verimlilik

YOLOX 2021'de etkileyici hızlar sunarken, YOLOv9 sınırları daha da zorluyor. YOLOv9 (Tiny) modeli, sadece 2,0M parametre ile %38,3 mAP sağlayarak olağanüstü bir denge sunar, bu da onu mobil ve gömülü uygulamalar için son derece uygun hale getirir. Buna karşılık, YOLOX-Nano daha küçüktür ancak önemli ölçüde doğruluktan ödün verir (%25,8 mAP).

Eğitim Verimliliği

YOLOv9 , modern eğitim tariflerinden ve optimize edilmiş Ultralytics eğiticisinden yararlanarak, eski mimarilere kıyasla eğitim sırasında genellikle daha hızlı yakınsama ve daha düşük bellek kullanımı sağlar.

İdeal Kullanım Senaryoları

Bu modeller arasında seçim yapmak, özel proje gereksinimlerinize bağlıdır.

YOLOv9 Ne Zaman Seçilmeli

YOLOv9 , üstün doğruluk-verimlilik oranı nedeniyle çoğu modern bilgisayarla görme uygulaması için önerilen seçimdir.

  • Gerçek Zamanlı Uç Yapay Zeka: FLOP'ların önemli olduğu NVIDIA Jetson gibi cihazlara dağıtma. YOLOv9'un hafif mimarisi verimi en üst düzeye çıkarır.
  • Yüksek Hassasiyetli Denetim: Küçük kusurları tespit etmenin kritik olduğu endüstriyel kalite kontrolü. YOLOv9'nin yüksek mAP değeri, en küçük ayrıntıların bile yakalanmasını sağlar.
  • Otonom Sistemler: Robotik ve dronlar düşük gecikme süresi gerektirir. YOLOv9'un optimize edilmiş grafik yapısı, algılama yeteneklerinden ödün vermeden hızlı çıkarım sağlar.

YOLOX Ne Zaman Düşünülmeli

YOLOX, belirli eski iş akışları veya araştırma karşılaştırmaları için güçlü bir rakip olmaya devam ediyor.

  • Akademik Araştırma: Ayrılmış kafası ve çapasız tasarımı, onu nesne algılama temellerini incelemek için klasik bir temel haline getirir.
  • Eski Dağıtımlar: Mevcut bir altyapı belirli YOLOX mimarisi için büyük ölçüde optimize edilmişse (örneğin, YOLOX kafaları için özel olarak oluşturulmuş özel TensorRT eklentileri), eski modeli sürdürmek kısa vadede uygun maliyetli olabilir.

Ultralytics Avantajı

Ultralytics ekosistemi aracılığıyla YOLOv9 'u benimsemek, bağımsız uygulamalara göre belirgin avantajlar sağlar. Ultralytics çerçevesi, tüm Makine Öğrenimi Operasyonları (MLOps) yaşam döngüsünü kolaylaştırmak için tasarlanmıştır.

  • Kullanım Kolaylığı: Ultralytics Python API, modelleri yalnızca birkaç satır kodla yüklemenize, eğitmenize ve dağıtmanıza olanak tanır.
  • Bakımlı Ekosistem: Düzenli güncellemeler PyTorch, ONNX ve CUDA'nın en son sürümleriyle uyumluluğu sağlar.
  • Çok yönlülük: YOLOX öncelikle bir nesne algılayıcı olsa da, Ultralytics çerçevesi poz tahmini, segmentasyon ve sınıflandırma gibi çok çeşitli görevleri destekleyerek aynı kod tabanı içinde mimarileri veya görevleri kolayca değiştirmenize olanak tanır.
  • Bellek Verimliliği: Ultralytics modelleri bellek kullanımı için optimize edilmiştir ve karmaşık Transformatör tabanlı modelleri veya optimize edilmemiş eski dedektörleri eğitirken yaygın olan Bellek Dışı (OOM) hatalarını önler.

Kod Örneği: YOLOv9 Çalıştırma

Ultralytics paketi kullanılarak YOLOv9 ile çıkarım yapmak kolaydır.

from ultralytics import YOLO

# Load a pre-trained YOLOv9 compact model
model = YOLO("yolov9c.pt")

# Run inference on a local image
results = model("path/to/image.jpg")

# Display the results
results[0].show()

İhracat Esnekliği

Ultralytics ile eğitilen YOLOv9 modelleri aşağıdaki gibi formatlara kolayca aktarılabilir TensorRT, OpenVINOve CoreML maksimum dağıtım esnekliği için.

Sonuç ve Öneriler

YOLOX, çapasız tespitin geliştirilmesinde önemli bir rol oynamıştır, YOLOv9 mevcut geliştirme için üstün bir seçim olarak duruyor. Yenilikçi PGI ve GELAN mimarisi, daha az parametre ile daha yüksek doğruluk sağlayarak önceki derin ağları sınırlayan bilgi darboğazı sorununu çözüyor.

En son performans ve özellikleri arayan geliştiriciler için ayrıca şunları keşfetmenizi öneririz YOLO11birden fazla görüş görevinde daha da fazla hız ve çok yönlülük için bu kavramları daha da geliştirir. Bununla birlikte, YOLOX ile doğrudan karşılaştırma için YOLOv9 , algılama güvenilirliğini artırırken hesaplama ek yükünü azaltan cazip bir yükseltme yolu sunar.

Diğer Modelleri İnceleyin

Ultralytics ekosistemindeki diğer üst düzey modelleri karşılaştırarak bilginizi genişletin:


Yorumlar