İçeriğe geç

YOLOv9 - YOLOv5 Karşılaştırması: Teknik Bir İnceleme

Bilgisayar görüşü alanındaki hızlı gelişmelerde, doğru nesne algılama modelini seçmek proje başarısı için kritik öneme sahiptir. Bu analiz, doğruluk sınırlarını zorlayan araştırma odaklı bir mimari olan YOLOv9 ile güvenilirliği, hızı ve çok yönlülüğü ile tanınan endüstri standardı model olan Ultralytics YOLOv5 arasındaki ayrıntılı bir teknik karşılaştırmayı sunmaktadır. Bilinçli bir karar vermenize yardımcı olmak için mimari farklılıklarını, performans kıyaslamalarını ve ideal kullanım durumlarını inceliyoruz.

YOLOv9: Maksimum Doğruluk için Mimari Yenilik

2024'ün başlarında piyasaya sürülen YOLOv9, derin öğrenme bilgi akışındaki temel sorunları ele alarak nesne algılamanın teorik sınırlarını hedeflemektedir. Hassasiyetin çok önemli olduğu senaryolar için tasarlanmıştır.

Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
Kuruluş:Institute of Information Science, Academia Sinica, Tayvan
Tarih: 2024-02-21
Arxiv:arXiv:2402.13616
GitHub:WongKinYiu/yolov9
Belgeler:YOLOv9 Belgeleri

Temel Mimari

YOLOv9, iki çığır açan konsept sunar: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN). PGI, kayıp fonksiyonu için eksiksiz girdi bilgisinin korunmasını sağlayarak derin sinir ağlarında doğal olan bilgi darboğazı sorunuyla mücadele ederek gradyan güvenilirliğini artırır. GELAN, parametre verimliliğini optimize ederek modelin derinlemesine evrişim kullanan önceki mimarilere kıyasla daha az hesaplama kaynağıyla daha yüksek doğruluk elde etmesini sağlar.

Güçlü ve Zayıf Yönler

YOLOv9'un temel gücü, COCO veri kümesi gibi kıyaslamalarda son teknoloji doğruluğudur. Diğer modellerin başarısız olabileceği küçük veya kapalı nesneleri algılamada mükemmeldir. Ancak, algılama doğruluğuna odaklanma, ödünleşimlerle birlikte gelir. Eğitim süreci daha fazla kaynak yoğun olabilir ve Ultralytics ekosistemine entegre olmasına rağmen, daha geniş topluluk desteği ve üçüncü taraf araçları, daha uzun süredir kurulmuş modellere kıyasla hala olgunlaşmaktadır. Ek olarak, temel odağı algılama olmaya devam ederken, diğer modeller daha geniş çoklu görev yerel desteği sunar.

YOLOv9 hakkında daha fazla bilgi edinin

Ultralytics YOLOv5: Çok Yönlü Endüstri Standardı

Ultralytics YOLOv5 , 2020'de piyasaya sürülmesinden bu yana pratik, gerçek dünya yapay zeka dağıtımı için standardı tanımladı. Performans ve kullanılabilirlik arasında hassas bir denge kurarak onu tarihin en yaygın kullanılan modellerinden biri haline getirdi.

Yazar: Glenn Jocher
Kuruluş:Ultralytics
Tarih: 2020-06-26
GitHub:ultralytics/yolov5
Belgeler:YOLOv5 Belgeleri

Temel Mimari

YOLOv5, sağlam özellik toplama için bir CSPDarknet53 omurgası ve bir PANet boynu içeren gelişmiş bir bağlantı tabanlı mimari kullanır. Tasarımı, çıkarım hızına ve mühendislik optimizasyonuna öncelik verir. Model, gömülü uç cihazlardan bulut GPU'larına kadar geliştiricilerin modeli donanım kısıtlamalarına mükemmel şekilde uydurmalarına olanak tanıyan çeşitli ölçeklerde (Nano'dan Ekstra Büyüğe) gelir.

Ultralytics'in Avantajı

YOLOv9 akademik sınırları zorlarken, YOLOv5 mühendislik pratikliğinde öne çıkar.

  • Kullanım Kolaylığı: YOLOv5, "kur ve çalıştır" deneyimiyle ünlüdür. Kolaylaştırılmış Python API ve kapsamlı dokümantasyon, geliştirme süresini önemli ölçüde azaltır.
  • İyi Yönetilen Ekosistem: Ultralytics tarafından desteklenen YOLOv5, aktif bakıma, GitHub'da büyük bir topluluğa ve MLOps araçlarıyla sorunsuz entegrasyona sahiptir.
  • Çeşitlilik: Detect işleminin ötesinde, YOLOv5 yerel olarak örnek segmentasyonunu ve görüntü sınıflandırmasını destekleyerek çeşitli görüntü işleme görevleri için birleşik bir çözüm sunar.
  • Bellek Verimliliği: Ultralytics modelleri, transformatör tabanlı alternatiflerin ağır gereksinimlerinin aksine, hem eğitim hem de çıkarım sırasında daha düşük bellek ayak izleri için optimize edilmiştir.

YOLOv5 hakkında daha fazla bilgi edinin

Performans Metrikleri: Hız - Doğruluk Karşılaştırması

Aşağıdaki karşılaştırma, bu modellerin belirgin rollerini vurgulamaktadır. YOLOv9 genellikle daha yüksek mAP (ortalama Ortalama Hassasiyet) elde eder, özellikle daha büyük model boyutlarında (c ve e). Bu, onu ayrıntılı detay gerektiren görevler için üstün kılar.

Aksine, YOLOv5, özellikle Nano (n) ve Küçük (s) varyantlarıyla rakipsiz çıkarım hızları sunar. NVIDIA Jetson veya Raspberry Pi gibi uç donanımlarda gerçek zamanlı uygulamalar için YOLOv5, hafif yapısı ve TensorRT optimizasyon olgunluğu nedeniyle en iyi yarışmacılardan biri olmaya devam ediyor.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Dağıtım İpucu

Maksimum dağıtım esnekliği için, her iki model de Ultralytics dışa aktarma modu kullanılarak ONNX, TensorRT ve CoreML gibi formatlara aktarılabilir. Bu, modellerinizin herhangi bir hedef donanımda verimli bir şekilde çalışmasını sağlar.

Eğitim ve Kullanılabilirlik

Eğitim metodolojileri, kullanıcı deneyiminde önemli ölçüde farklılık gösterir. Ultralytics YOLOv5, özel veri kümeleri için kutudan çıkar çıkmaz çalışan sağlam ön ayarlar sunarak eğitim verimliliği için tasarlanmıştır. Otomatik bağlantı hesaplaması, hiperparametre evrimi ve zengin günlük entegrasyonlarına sahiptir.

YOLOv9, güçlü olmasına rağmen, özellikle daha küçük veri kümelerinde kararlılık ve yakınsama elde etmek için hiperparametrelerin daha dikkatli ayarlanmasını gerektirebilir. Ancak, entegrasyonu sayesinde ultralytics Python paketi sayesinde, geliştiriciler artık YOLOv9'u YOLOv5 ile aynı basit sözdizimini kullanarak eğitebilir ve kullanılabilirlik farkını kapatabilir.

Kod Örneği

Ultralytics kütüphanesi ile bu mimariler arasında geçiş yapmak, model adını değiştirmek kadar basittir. Bu snippet, her iki modelle de çıkarımın nasıl yükleneceğini ve çalıştırılacağını gösterir:

from ultralytics import YOLO

# Load the established industry standard YOLOv5 (nano version)
model_v5 = YOLO("yolov5nu.pt")

# Run inference on an image
results_v5 = model_v5("path/to/image.jpg")

# Load the high-accuracy YOLOv9 (compact version)
model_v9 = YOLO("yolov9c.pt")

# Run inference on the same image for comparison
results_v9 = model_v9("path/to/image.jpg")

İdeal Kullanım Senaryoları

Ne Zaman YOLOv9 Seçmeli

  • Yüksek Hassasiyetli İnceleme: Her pikselin önemli olduğu üretim montaj hatlarında çok küçük kusurları detect etmek.
  • İleri Düzey Araştırma: Programlanabilir Gradyan Bilgisi gibi yeni derin öğrenme mimarilerini araştıran projeler.
  • Karmaşık Ortamlar: GELAN'ın gelişmiş özellik toplamasının belirleyici bir avantaj sağladığı yüksek tıkanıklık veya karmaşıklık içeren senaryolar.

Ne Zaman YOLOv5 Seçmeli

  • Uç Nokta Dağıtımı: Güç tüketimi ve bellek ayak izinin kritik olduğu pille çalışan cihazlarda veya mikrodenetleyicilerde çalıştırma.
  • Hızlı Prototipleme: Kapsamlı eğitimlerden ve topluluk kaynaklarından yararlanarak, günlerde değil, saatler içinde veri toplamadan çalışan bir demoya geçmeniz gerektiğinde.
  • Çoklu Görev Sistemleri: Tek bir kod tabanı içinde algılamanın yanı sıra poz tahmini veya sınıflandırma gerektiren uygulamalar.
  • Üretim Kararlılığı: Yıllarca kanıtlanmış güvenilirliğe sahip, savaşta test edilmiş bir çözüm gerektiren kurumsal ortamlar.

Sonuç

YOLOv9 ve YOLOv5 arasındaki seçim, özel kısıtlamalarınıza bağlıdır. YOLOv9, en son teknolojiye sahip mimari iyileştirmeler sunarak doğruluğu en üst düzeye çıkarmak için üstün bir seçimdir. YOLOv5 ise, tüm yapay zeka yaşam döngüsünü basitleştiren sağlam, iyi desteklenen bir ekosistem sağlayarak çok yönlülük ve kullanım kolaylığı şampiyonu olmaya devam ediyor.

Her iki dünyanın da mutlak en iyisini (YOLOv5'in kullanım kolaylığını YOLOv9'u aşan performansla birleştiren) arayan geliştiriciler için, YOLO11'i keşfetmenizi öneririz. Ultralytics'in en son yinelemesi olan YOLO11, tüm görme görevlerinde son teknoloji hız ve doğruluk sunarak YOLO ailesinin geleceğini temsil ediyor.

Diğer Modelleri İnceleyin

  • YOLO11: Ultralytics'in detect, segmentasyon ve poz için en son ve en güçlü modeli.
  • YOLOv8: Harika özellik dengesi sunan YOLO11'in güçlü bir selefi.
  • RT-DETR: Gerçek zamanlı performans için optimize edilmiş, dönüştürücü tabanlı bir dedektör.

Yorumlar