İçeriğe geç

YOLOv9 YOLOX: Mimari Gelişim ve Teknik Karşılaştırma

Bu ayrıntılı analiz, YOLOv9ile öncü çapraz bağlantısız nesne algılayıcı YOLOX'u karşılaştırmaktadır. Bilgisayar görme projeleriniz için doğru modeli seçmenize yardımcı olmak amacıyla, bu modellerin mimari farklılıklarını, performans ölçütlerini ve ideal uygulama senaryolarını inceliyoruz.

Performans Metrikleri Karşılaştırması

Aşağıdaki tablo, temel performans göstergelerini karşılaştırmaktadır. YOLOv9 genel olarak üstün doğruluk-hesaplama oranları sergilemektedir, özellikle de kenar dağıtımı için çok önemli olan daha küçük varyantlarında.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

YOLOv9: Programlanabilir Gradyan Bilgisi

YOLOv9, Şubat 2024'te Academia Sinica araştırmacıları tarafından piyasaya sürüldü ve derin sinir ağlarındaki "bilgi darboğazı" sorununu çözmeyi amaçlayan önemli mimari yenilikler getiriyor.

YOLOv9 hakkında daha fazla bilgi edinin.

Temel Mimari Yenilikler

  • Programlanabilir Gradyan Bilgisi (PGI): PGI, ağ parametrelerini güncellemek için güvenilir gradyanlar üreten yardımcı bir denetim çerçevesidir. Hafif modellerde sıkça görülen bir sorun olan, verilerin derin katmanlardan geçerken kritik semantik bilgilerin kaybolmamasını sağlar.
  • GELAN Mimarisi: Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN), CSPNet ve ELAN'ın en iyi özelliklerini bir araya getirir. Parametre verimliliği ve çıkarım hızına öncelik vererek, YOLOv9 önceki sürümlerine kıyasla daha az FLOP ile daha yüksek doğruluk YOLOv9 sağlar.
  • Çok yönlülük: Algılama ile sınırlı olan önceki sürümlerin aksine, YOLOv9 , örnek segmentasyonu ve panoptik segmentasyonu YOLOv9 destekler, bu da onu karmaşık görme görevleri için çok yönlü bir seçim haline getirir.

Ultralytics ile Kolaylaştırılmış Eğitim

YOLOv9 , Ultralytics tamamen entegre YOLOv9 . Otomatik karışık hassasiyet veGPU gibi gelişmiş özelliklerden yararlanarak, minimum kurulumla özel veriler üzerinde bir model eğitebilirsiniz.

from ultralytics import YOLO

# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

YOLOX: Bağlantısız Öncü

Megvii tarafından 2021 yılında piyasaya sürülen YOLOX, YOLO çapa içermeyen bir tasarıma doğru kaydıran dönüştürücü bir modeldi. Algılama başlığını ayırarak eğitim sürecini basitleştirdi ve performansı artırdı.

YOLOX hakkında daha fazla bilgi edinin

Temel Mimari Özellikler

  • Ankrajsız Mekanizma: Önceden tanımlanmış ankraj kutularını kaldırarak, YOLOX manuel ankraj ayarlaması (kümeleme) ihtiyacını ortadan kaldırır ve algılama kafasının karmaşıklığını azaltır.
  • Ayrıştırılmış Başlık: YOLOX, sınıflandırma ve regresyon görevlerini farklı dallara ayırır. Bu ayrıştırma, bu iki görev arasındaki çelişkiyi gidererek daha hızlı yakınsama ve daha iyi doğruluk sağlar.
  • SimOTA Etiket Atama: YOLOX, küresel optimizasyon perspektifine dayalı olarak gerçek nesneleri tahminlerle otomatik olarak eşleştiren dinamik bir etiket atama stratejisi olan SimOTA'yı (Basitleştirilmiş Optimal Taşıma Atama) kullanır.

Karşılaştırma Analizi

Kullanım Kolaylığı ve Ekosistem

En önemli farklardan biri ekosistemdir. YOLOv9, Ultralytics bir parçası olarak, birleşik ve kullanıcı dostu bir deneyim sunar. Geliştiriciler şu avantajlardan yararlanır:

  • Tutarlı API: YOLOv9, YOLO11 veya YOLO26 kullanıyor olsanız da, eğitim, doğrulama ve çıkarım komutları aynı kalır.
  • Kapsamlı Belgeler: Ultralytics , hiperparametre ayarlama, model dışa aktarma ve dağıtım stratejileri hakkında kapsamlı kılavuzlar Ultralytics .
  • Aktif Bakım: Sık güncellemeler, en son sürümlerle uyumluluğu garanti eder PyTorch sürümleri ve CUDA ile uyumluluğu sağlar.

Buna karşılık, YOLOX genellikle depoyu klonlama ve belirli bağımlılıkları yönetme gibi daha manuel bir kurulum gerektirir ve bu da hızlı prototip oluşturma için bir engel oluşturabilir.

Performans ve Verimlilik

  • Doğruluk: YOLOv9 , karşılaştırılabilir model mAP YOLOv9 YOLOX'tan daha iyi performans gösterir. Örneğin, YOLOv9m, daha az parametreye sahip olmasına rağmen (20,0 milyon karşı 25,3 milyon), YOLOX-m'nin %46,9'una kıyasla %51,4 mAP elde eder.
  • Çıkarım Hızı: YOLOX, 2021 yılında hız konusunda bir çığır açarken, YOLOv9 GELAN gibi modern mimariler verimliliği daha da YOLOv9 . YOLOv9t, GPU 2,3 ms hız ında çalışır ve bu da onu gerçek zamanlı uygulamalar için son derece uygun hale getirir.
  • Bellek Verimliliği: Ultralytics , eğitim sırasında daha düşük GPU kullanımı için optimize edilmiştir. Bu, araştırmacıların eski mimarilere veya RT-DETR gibi dönüştürücü tabanlı modellere kıyasla, tüketici sınıfı donanımlarda daha büyük parti boyutları veya daha karmaşık modeller eğitmelerine olanak tanır. RT-DETRgibi transformatör tabanlı modellerle karşılaştırıldığında daha büyük parti boyutları veya daha karmaşık mod

Kullanım Alanları

  • YOLOv9 seçin YOLOv9 En son teknolojiye sahip doğruluk, segmentasyon desteği veya Ultralytics aracılığıyla mümkün olan en basit dağıtım boru hattı YOLOv9 . Endüstriyel denetim ve otonom sistemlerde mükemmeldir.
  • YOLOX'u seçin, eğer: YOLOX kod tabanında oluşturulmuş eski sistemleri sürdürüyorsanız veya araştırma karşılaştırmaları için çapa içermeyen başlığının özel davranışına ihtiyacınız varsa.

İleriye Bakış: YOLO26'nın Gücü

YOLOv9 mükemmel bir seçim YOLOv9 de, bilgisayar görme alanı hızla gelişmektedir. Yeni piyasaya sürülen YOLO26, önceki sürümlerin güçlü yönlerini temel alarak en üstün kenar öncelikli çözümü sunmaktadır.

YOLO26 hakkında daha fazla bilgi edinin

YOLO26, birkaç devrim niteliğinde özellik sunar:

  • Uçtan Uca NMS: Non-Maximum Suppression (NMS) özelliğini ortadan kaldırarak, YOLO26 dağıtımı basitleştirir ve gecikme değişkenliğini azaltır. Bu kavram, YOLOv10.
  • MuSGD Optimizer: LLM eğitiminden esinlenen bu hibrit optimizer, istikrarlı bir yakınsama sağlar ve çeşitli parti boyutlarında sağlamdır.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, küçük nesnelerin algılanmasını önemli ölçüde iyileştirerek YOLO26'yı hava görüntüleri ve drone uygulamaları için ideal hale getirir.
  • %43 Daha Hızlı CPU : Dağıtım Odak Kaybı (DFL) özelliğinin kaldırılmasıyla YOLO26, Raspberry Pi gibi CPU uç cihazlar için özel olarak optimize edilmiştir.

Python'da YOLO26'yı çalıştırma

Sadece birkaç satır kodla en yeni neslin hızını deneyimleyin:

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

Sonuç

Hem YOLOv9 YOLOX, nesne algılamaya önemli katkılar sağlamıştır. YOLOX, çapa içermeyen algılamayı yaygınlaştırarak gelecekteki modellerin tasarım alanını basitleştirmiştir. Ancak, YOLOv9 PGI ve GELAN gibi modern mimari gelişmelerden yararlanarak üstün doğruluk ve verimlilik sunmaktadır.

Performans, kullanım kolaylığı ve geleceğe dönük özelliklerin en iyi dengesini arayan geliştiriciler için, Ultralytics gibi YOLOv9 ve son teknoloji YOLO26 gibi Ultralytics modelleri önerilen seçeneklerdir. Bu modeller, tıbbi görüntülemeden akıllı şehir izlemeye kadar çeşitli zorlukların üstesinden gelmek için sağlam bir platform sunar.

İlgili Modeller

Nesne algılama mimarilerini araştırıyorsanız, şunlar da ilginizi çekebilir:

  • YOLO11: Sağlamlığıyla bilinen YOLO26'nın güçlü bir öncülü.
  • RT-DETR: Yüksek doğruluk sağlayan ancak daha fazla kaynak gerektiren transformatör tabanlı bir dedektör.
  • YOLOv8: Algılama, segmentasyon ve poz için birleşik bir çerçeve sunan oldukça popüler bir model.

Yorumlar