İçeriğe geç

YOLOv5 vs. YOLOv9: Kapsamlı Bir Teknik Karşılaştırma

Gerçek zamanlı nesne algılamanın evrimi, doğruluk ve verimlilikteki hızlı ilerlemelerle işaretlenmiştir. Bu yolculuktaki iki önemli kilometre taşı şunlardır Ultralytics YOLOv5kullanılabilirlik ve dağıtım için endüstri standardını belirleyen bir model ve YOLOv9derin öğrenme teorisinin sınırlarını zorlayan araştırma odaklı bir mimari.

Bu teknik karşılaştırma, geliştiricilerin ve araştırmacıların bilgisayarla görme projeleri için doğru aracı seçmelerine yardımcı olmak için mimarilerini, performans ölçümlerini ve ideal kullanım durumlarını analiz eder.

Ultralytics YOLOv5: Çok Yönlülük için Sektör Standardı

Yayınlandığından beri, YOLOv5 dünya çapında en popüler vizyon yapay zeka modellerinden biri haline gelmiştir. Ultralytics tarafından geliştirilen bu model, mühendislik mükemmelliğine, kullanım kolaylığına ve gerçek dünya performansına öncelik vermektedir. Sağlam bir ekosistem aracılığıyla sorunsuz bir kullanıcı deneyimi sunarken hız ve doğruluğu dengeler.

Teknik Detaylar:

Mimari ve Tasarım

YOLOv5 , verimli özellik çıkarma ve toplama için PANet boynu ile birleştirilmiş bir CSPDarknet backbone kullanır. Çapa tabanlı algılama kafası hız için son derece optimize edilmiştir, bu da onu geniş bir donanım yelpazesi için uygun hale getirir. Tamamen akademik modellerin aksine, YOLOv5 dağıtım göz önünde bulundurularak tasarlanmıştır ve aşağıdakiler için yerel destek sunar iOS, Androidve uç cihazlar.

Temel Güçlü Yönler

  • Bakımlı Ekosistem: YOLOv5 , kapsamlı dokümantasyon, topluluk desteği ve Ultralytics HUB gibi araçlarla entegrasyonlarla sonuçlanan yıllarca süren aktif geliştirmeden yararlanır.
  • Eğitim Verimliliği: Hızlı eğitim süreleri ve transformatör tabanlı mimarilere kıyasla daha düşük bellek gereksinimleri ile ünlüdür ve standart tüketici GPU'larında erişilebilir olmasını sağlar.
  • Çok yönlülük: YOLOv5 , algılamanın ötesinde, örnek segmentasyonunu ve görüntü sınıflandırmasını yerel olarak destekleyerek geliştiricilerin tek bir çerçeveyle birden fazla görüntü görevinin üstesinden gelmesine olanak tanır.
  • Dağıtıma Hazır: Yerleşik dışa aktarma özellikleri ile ONNX, TensorRT, CoreML ve TFLite ile araştırmadan üretime geçiş kolaylaştırılmıştır.

YOLOv5 hakkında daha fazla bilgi edinin

YOLOv9: Maksimum Doğruluk için Mimari Yenilik

2024'te yayınlanacak, YOLOv9 derin ağlardaki bilgi kaybı sorunlarını çözmeye odaklanmaktadır. Verilerin model boyunca nasıl yayıldığını iyileştirmek için yeni kavramlar sunar ve aşağıdaki gibi karşılaştırmalı testlerde en son teknolojiye sahip sonuçlar elde eder COCO.

Teknik Detaylar:

Mimari ve Yenilikler

YOLOv9 iki temel mimari gelişme sunuyor:

  1. Programlanabilir Gradyan Bilgisi (PGI): Bilgi darboğazı sorununu hafifletmek için tasarlanmış bir tekniktir ve kayıp fonksiyonu hesaplaması için eksiksiz girdi bilgilerinin mevcut olmasını sağlar.
  2. Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN): Parametre verimliliğini optimize eden hafif bir ağ mimarisi, modelin bazı öncekilerden daha az parametre ile daha yüksek doğruluk elde etmesini sağlar.

Temel Güçlü Yönler

  • Yüksek Doğruluk: YOLOv9 , özellikle daha büyük konfigürasyonlarındaYOLOv9) nesne algılama doğruluğu için etkileyici ölçütler belirler.
  • Parametre Verimliliği: GELAN mimarisi, modelin parametreleri etkin bir şekilde kullanmasını sağlayarak güçlü bir doğruluk-ağırlık oranı sağlar.
  • Teorik İlerleme: Derin katmanlarda bilginin korunmasına ilişkin derin öğrenmedeki temel sorunları ele alır.

YOLOv9 hakkında daha fazla bilgi edinin

Performans Karşılaştırması

Bu iki modeli karşılaştırırken, değiş tokuş genellikle hız ve mutlak doğruluk arasında yer alır. YOLOv9 , COCO veri kümesinde daha yüksek mAPval puanları elde ederek PGI ve GELAN'ın etkinliğini göstermektedir. Ancak, Ultralytics YOLOv5 özellikle optimize edilmiş mimarisinin parladığı CPU'larda ve uç cihazlarda çıkarım hızında zorlu bir rakip olmaya devam ediyor.

Performans Dengesi

YOLOv9 ise doğruluk listelerinin başında yer alıyor, YOLOv5 genellikle gerçek zamanlı uygulamalar için daha pratik bir denge sağlar ve sağlam algılama yeteneklerini korurken standart donanımda önemli ölçüde daha yüksek çıkarım hızları (ms) sunar.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Eğitim ve Kaynaklar

Geliştiriciler için, eğitim verimliliği genellikle çıkarım hızı kadar kritiktir. Ultralytics YOLOv5 , "eğit ve git" basitliği ile bilinir. Daha yeni, daha karmaşık mimarilere, özellikle transformatör tabanlı modellere kıyasla eğitim sırasında tipik olarak daha az bellek gerektirir (örneğin RT-DETR). Bu düşük giriş engeli, kullanıcıların mütevazı donanım kurulumlarında özel modelleri eğitmelerine olanak tanır.

YOLOv9, parametreler açısından verimli olsa da, PGI için kullanılan ve çıkarım sırasında kaldırılan ancak eğitim sırasında ek yük getiren yardımcı dalların karmaşıklığı nedeniyle eğitilmesi daha yoğun kaynak gerektirebilir.

Kod Örneği: Birleşik Arayüz

Ultralytics ekosisteminin en büyük avantajlarından biri birleşik Python API'sidir. YOLOv5 ve YOLOv9 arasında tek bir kod satırıyla geçiş yapabilirsiniz, bu da her ikisini de özel veri kümenizde karşılaştırmayı inanılmaz derecede kolaylaştırır.

from ultralytics import YOLO

# Load an Ultralytics YOLOv5 model (pre-trained on COCO)
model_v5 = YOLO("yolov5su.pt")

# Train the model on your custom data
results_v5 = model_v5.train(data="coco8.yaml", epochs=100, imgsz=640)

# Load a YOLOv9 model for comparison
model_v9 = YOLO("yolov9c.pt")

# Train YOLOv9 using the exact same API
results_v9 = model_v9.train(data="coco8.yaml", epochs=100, imgsz=640)

İdeal Kullanım Senaryoları

Bu modeller arasında seçim yapmak proje önceliklerinize bağlıdır:

Ultralytics YOLOv5 Ne Zaman Seçilmeli

  • Uç Dağıtım: Raspberry Pi, mobil uygulamalar ve her milisaniyelik gecikmenin önemli olduğu gömülü sistemler için idealdir.
  • Hızlı Prototipleme: Kullanım kolaylığı, kapsamlı eğitimler ve topluluk desteği inanılmaz hızlı geliştirme döngüleri sağlar.
  • Çoklu Görev Gereksinimleri: Projeniz algılamanın yanı sıra segmentasyon veya sınıflandırma gerektiriyorsa, YOLOv5 birleşik bir çözüm sunar.
  • Kaynak Kısıtlamaları: Eğitim için GPU belleği sınırlı olan projeler YOLOv5'in verimliliğinden faydalanacaktır.

YOLOv9 Ne Zaman Seçilmeli

  • Maksimum Doğruluk: Tıbbi görüntüleme veya yüksek hassasiyetli endüstriyel denetim gibi bir algılamayı kaçırmanın maliyetli olduğu uygulamalar için kritik öneme sahiptir.
  • Akademik Araştırma: Gradyan bilgi akışı ve ağ mimarisi tasarımındaki en son gelişmeleri araştıran araştırmacılar için mükemmeldir.
  • Güçlü Donanım: Tam potansiyelinden yararlanmak için eğitim ve çıkarım için geniş hesaplama kaynakları mevcut olduğunda en iyi şekilde kullanılır.

Sonuç

Her iki model de bilgisayarla görme alanında mükemmelliği temsil etmektedir. Ultralytics YOLOv5 hız, güvenilirlik ve ekosistem desteğinin rakipsiz bir kombinasyonunu sunarak çoğu geliştirici için pragmatik bir seçim olmaya devam ediyor. Gerçek dünyada kullanım için savaşta test edilmiş bir beygirdir. YOLOv9Öte yandan, mimari verimliliğin geleceğine bir bakış sunuyor ve ihtiyaç duyanlar için üst düzey doğruluk sağlıyor.

Performans ve çok yönlülükte mutlak en yeniyi arayanlar için ayrıca şunları keşfetmenizi öneririz YOLO11YOLOv5 ve YOLOv8 'in güçlü yönlerini temel alarak tüm ölçütlerde son teknoloji ürünü sonuçlar sunar.

Diğer Modelleri İnceleyin

Daha fazlasını keşfetmekle ilgileniyorsanız, Ultralytics ekosistemindeki bu ilgili modellere göz atın:

  • YOLO11: Üstün performans ve çok yönlülük sunan en yeni SOTA modeli.
  • YOLOv8: Algılama, segmentasyon, poz ve OBB'yi destekleyen güçlü bir çapasız model.
  • RT-DETR: Yüksek doğruluklu uygulamalar için gerçek zamanlı transformatör tabanlı bir dedektör.

Yorumlar