YOLOv9 vs. YOLOv5: Teknik Bir Karşılaştırma
Bilgisayarla görmenin hızla ilerleyen ortamında, doğru nesne algılama modelini seçmek proje başarısı için kritik önem taşır. Bu analiz, aşağıdakiler arasında ayrıntılı bir teknik karşılaştırma sağlar YOLOv9doğruluğun sınırlarını zorlayan araştırma odaklı bir mimari ve Ultralytics YOLOv5güvenilirliği, hızı ve çok yönlülüğü ile tanınan endüstri standardı model. Bilinçli bir karar vermenize yardımcı olmak için mimari farklılıklarını, performans kıyaslamalarını ve ideal kullanım durumlarını keşfediyoruz.
YOLOv9: Maksimum Doğruluk için Mimari Yenilik
2024 yılının başlarında piyasaya sürülen YOLOv9 , derin öğrenme bilgi akışındaki temel sorunları ele alarak nesne algılamanın teorik sınırlarını hedeflemektedir. Hassasiyetin çok önemli olduğu senaryolar için tasarlanmıştır.
Yazarlar Chien-Yao Wang, Hong-Yuan Mark Liao
Organizasyon:Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
Tarih: 2024-02-21
Arxiv:arXiv:2402.13616
GitHub:WongKinYiu/yolov9
Docs:YOLOv9 Documentation
Çekirdek Mimari
YOLOv9 çığır açan iki kavramı tanıtıyor: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN). PGI, kayıp fonksiyonu için eksiksiz girdi bilgisinin korunmasını sağlayarak derin sinir ağlarının doğasında bulunan bilgi darboğazı sorunuyla mücadele eder ve gradyan güvenilirliğini artırır. GELAN, parametre verimliliğini optimize ederek modelin derinlik bazlı konvolüsyon kullanan önceki mimarilere kıyasla daha az hesaplama kaynağıyla daha yüksek doğruluk elde etmesini sağlar.
Güçlü ve Zayıf Yönler
YOLOv9 'un birincil gücü, COCO veri seti gibi kıyaslama ölçütlerinde son teknoloji ürünü doğruluğudur. Diğer modellerin başarısız olabileceği küçük veya örtülü nesneleri tespit etmede üstündür. Ancak, algılama doğruluğuna bu şekilde odaklanılması bazı ödünleri de beraberinde getiriyor. Eğitim süreci daha yoğun kaynak gerektirebilir ve Ultralytics ekosistemine entegre edilmiş olsa da, daha geniş topluluk desteği ve üçüncü taraf araçları, daha uzun süredir kullanılan modellere kıyasla hala olgunlaşmaktadır. Ayrıca, diğer modeller daha geniş çoklu görev yerel desteği sunarken, birincil odak noktası tespit etmeye devam etmektedir.
YOLOv9 hakkında daha fazla bilgi edinin
Ultralytics YOLOv5: Çok Yönlü Endüstri Standardı
Ultralytics YOLOv5 , 2020'de piyasaya sürülmesinden bu yana pratik, gerçek dünya yapay zeka dağıtımı için standardı tanımladı. Performans ve kullanılabilirlik arasında hassas bir denge kurarak onu tarihin en yaygın kullanılan modellerinden biri haline getirdi.
Yazar Glenn Jocher
Organizasyon:Ultralytics
Tarih: 2020-06-26
GitHub:yolov5
Docs:YOLOv5 Documentation
Çekirdek Mimari
YOLOv5 , CSPDarknet53 backbone ve sağlam özellik toplama için bir PANet boynu içeren rafine edilmiş çapa tabanlı bir mimari kullanır. Tasarımı, çıkarım hızına ve mühendislik optimizasyonuna öncelik vermektedir. Model, geliştiricilerin modeli gömülü uç cihazlardan bulut GPU'larına kadar donanım kısıtlamalarına mükemmel şekilde uydurmalarına olanak tanıyan çeşitli ölçeklerde (Nano'dan Ekstra Büyük'e) gelir.
Ultralytics Avantajı
YOLOv9 akademik sınırları zorlarken, YOLOv5 mühendislik pratikliğinde öne çıkmaktadır.
- Kullanım Kolaylığı: YOLOv5 "kur ve çalıştır" deneyimi ile ünlüdür. Kolaylaştırılmış Python API ve kapsamlı dokümantasyon, geliştirme süresini önemli ölçüde azaltır.
- Bakımlı Ekosistem: Ultralytics tarafından desteklenen YOLOv5 , aktif bakıma, GitHub'da büyük bir topluluğa ve MLOps araçlarıyla sorunsuz entegrasyona sahiptir.
- Çok yönlülük: Algılamanın ötesinde YOLOv5 , örnek segmentasyonunu ve görüntü sınıflandırmasını yerel olarak destekleyerek çeşitli görme görevleri için birleşik bir çözüm sunar.
- Bellek Verimliliği: Ultralytics modelleri, transformatör tabanlı alternatiflerin ağır gereksinimlerinin aksine, hem eğitim hem de çıkarım sırasında daha düşük bellek ayak izleri için optimize edilmiştir.
YOLOv5 hakkında daha fazla bilgi edinin
Performans Ölçütleri: Hız ve Doğruluk
Aşağıdaki karşılaştırma bu modellerin farklı rollerini vurgulamaktadır. YOLOv9 , özellikle daha büyük model boyutlarında (c ve e) genellikle daha yüksek mAP (ortalama Ortalama Hassasiyet) elde eder. Bu da onu ayrıntılı detay gerektiren görevler için üstün kılmaktadır.
Buna karşılık YOLOv5 , özellikle Nano (n) ve Small (s) varyantlarıyla rakipsiz çıkarım hızları sunar. NVIDIA Jetson veya Raspberry Pi gibi uç donanımlarda gerçek zamanlı uygulamalar için YOLOv5 , hafif yapısı ve TensorRT optimizasyon olgunluğu nedeniyle en iyi rakip olmaya devam etmektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Dağıtım İpucu
Maksimum dağıtım esnekliği için, her iki model de aşağıdaki gibi formatlara aktarılabilir ONNXUltralytics dışa aktarma modunu kullanarak TensorRT ve CoreML . Bu, modellerinizin herhangi bir hedef donanımda verimli bir şekilde çalışmasını sağlar.
Eğitim ve Kullanılabilirlik
Eğitim metodolojileri, kullanıcı deneyiminde önemli ölçüde farklılık gösterir. Ultralytics YOLOv5 , eğitim verimliliği için tasarlanmıştır ve özel veri kümeleri için kutudan çıktığı gibi çalışan sağlam ön ayarlar sunar. Otomatik çapa hesaplama, hiperparametre gelişimi ve zengin günlük entegrasyonlarına sahiptir.
YOLOv9 güçlü olmakla birlikte, özellikle daha küçük veri kümelerinde kararlılık ve yakınsama elde etmek için hiperparametrelerin daha dikkatli ayarlanmasını gerektirebilir. Ancak, YOLOv9'a entegrasyonu sayesinde ultralytics Python paketi sayesinde geliştiriciler artık YOLOv9 'u YOLOv5 ile aynı basit sözdizimini kullanarak eğitebilir ve kullanılabilirlik açığını kapatabilir.
Kod Örneği
Ultralytics kütüphanesi ile bu mimariler arasında geçiş yapmak, model adını değiştirmek kadar basittir. Bu kod parçacığı, her iki modelle de çıkarımın nasıl yükleneceğini ve çalıştırılacağını gösterir:
from ultralytics import YOLO
# Load the established industry standard YOLOv5 (nano version)
model_v5 = YOLO("yolov5nu.pt")
# Run inference on an image
results_v5 = model_v5("path/to/image.jpg")
# Load the high-accuracy YOLOv9 (compact version)
model_v9 = YOLO("yolov9c.pt")
# Run inference on the same image for comparison
results_v9 = model_v9("path/to/image.jpg")
İdeal Kullanım Senaryoları
YOLOv9 Ne Zaman Seçilmeli
- Yüksek Hassasiyetli Denetim: Her pikselin önemli olduğu üretim montaj hatlarında en küçük kusurları tespit etme.
- İleri Araştırma: Programlanabilir Gradyan Bilgisi gibi yeni derin öğrenme mimarilerini araştıran projeler.
- Karmaşık Ortamlar: GELAN'ın gelişmiş özellik toplamasının belirleyici bir avantaj sağladığı yüksek oklüzyon veya karmaşa içeren senaryolar.
YOLOv5 Ne Zaman Seçilmeli
- Uç Dağıtım: Güç tüketiminin ve bellek ayak izinin kritik olduğu pille çalışan cihazlarda veya mikro denetleyicilerde çalışır.
- Hızlı Prototipleme: Veri toplamadan çalışan bir demoya günler değil saatler içinde geçmeniz gerektiğinde, kapsamlı eğitimlerden ve topluluk kaynaklarından yararlanın.
- Çok Görevli Sistemler: Tek bir kod tabanı içinde algılamanın yanı sıra poz tahmini veya sınıflandırma gerektiren uygulamalar.
- Üretim Kararlılığı: Yıllarca kanıtlanmış güvenilirliğe sahip, savaşta test edilmiş bir çözüm gerektiren kurumsal ortamlar.
Sonuç
YOLOv9 ve YOLOv5 arasındaki seçim, özel kısıtlamalarınıza bağlıdır. YOLOv9 doğruluğu en üst düzeye çıkarmak için üstün bir seçimdir ve son teknoloji mimari iyileştirmeler sunar. YOLOv5 tüm yapay zeka yaşam döngüsünü basitleştiren sağlam ve iyi desteklenen bir ekosistem sunarak çok yönlülük ve kullanım kolaylığı şampiyonu olmaya devam ediyor.
YOLOv5 'in kullanım kolaylığını YOLOv9'u aşan performansla birleştirerek her iki dünyanın da en iyisini arayan geliştiriciler için şunları keşfetmenizi öneririz YOLO11. Ultralytics'in en son yinelemesi olan YOLO11 , YOLO ailesinin geleceğini temsil eden tüm görüş görevlerinde son teknoloji hız ve doğruluk sunar.
Diğer Modelleri İnceleyin
- YOLO11: Algılama, segmentasyon ve pozlama için Ultralytics 'in en yeni ve en güçlü modeli.
- YOLOv8: YOLO11 'in güçlü selefi, harika bir özellik dengesi sunuyor.
- RT-DETR: Gerçek zamanlı performans için optimize edilmiş transformatör tabanlı bir dedektör.