İçeriğe geç

YOLOv9 - YOLOv5 Karşılaştırması: Detaylı Bir Karşılaştırma

Bu sayfa, iki önemli nesne algılama modeli arasında teknik bir karşılaştırma sunmaktadır: YOLOv9 ve Ultralytics YOLOv5. Her iki model de gerçek zamanlı nesne algılamada hız ve doğruluğu dengelemesiyle bilinen, etkili YOLO (You Only Look Once) serisinin bir parçasıdır. Bu karşılaştırma, bilgisayar görüşü projeleriniz için en uygun modeli seçmenize yardımcı olmak amacıyla mimari farklılıklarını, performans metriklerini ve ideal kullanım durumlarını incelemektedir.

YOLOv9: Yeni Mimari ile Doğruluğu Geliştirme

YOLOv9, Şubat 2024'te tanıtıldı ve nesne algılamanın ön saflarına önemli mimari yenilikler getirdi. Yüksek etkili modellerin eğitimi için kritik bir zorluk olan derin sinir ağlarındaki bilgi kaybı sorununu çözmeyi amaçlamaktadır.

Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
Kuruluş: Institute of Information Science, Academia Sinica, Tayvan
Tarih: 2024-02-21
Arxiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9
Belgeleme: https://docs.ultralytics.com/models/yolov9/

Mimari ve Yenilikler

YOLOv9, makalesinde ayrıntılı olarak açıklanan iki çığır açan konsept sunar: "YOLOv9: Programlanabilir Gradyan Bilgisi Kullanarak Ne Öğrenmek İstediğinizi Öğrenme":

  • Programlanabilir Gradyan Bilgisi (PGI): Bu yeni yaklaşım, verilerin derin ağ katmanlarından akışı sırasında meydana gelen bilgi darboğazı sorununu ele almak için tasarlanmıştır. PGI, kayıp fonksiyonunu hesaplamak için eksiksiz girdi bilgisinin kullanılabilir olmasını sağlayarak, daha doğru gradyan güncellemeleri ve daha etkili model eğitimi için önemli verileri korur.
  • Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN): YOLOv9 ayrıca, üstün parametre kullanımı ve hesaplama verimliliği için optimize edilmiş yeni bir ağ mimarisi olan GELAN'a sahiptir. Daha az parametre ve hesaplama maliyeti (FLOP'lar) ile daha yüksek doğruluk elde eden bir yapı oluşturmak için CSPNet ve ELAN prensiplerini temel alır.

Güçlü Yönler

  • Gelişmiş Doğruluk: YOLOv9, COCO veri kümesinde yeni bir son teknoloji sunarak, ortalama Hassasiyet (mAP) konusunda önceki birçok gerçek zamanlı nesne dedektörünü geride bırakıyor.
  • Gelişmiş Verimlilik: PGI ve GELAN'ın birleşimi, yalnızca son derece doğru olmakla kalmayıp aynı zamanda hesaplama açısından da verimli olan modellerle sonuçlanır ve bu da onları performansın kritik olduğu görevler için güçlü kılar.
  • Bilgi Koruma: PGI, bilgi darboğazını doğrudan ele alarak, tipik performans düşüşü olmadan daha derin, daha karmaşık ağların eğitilmesini sağlar ve bu da daha sağlam modellere yol açar.

Zayıflıklar

  • Eğitim Kaynakları: YOLOv9 belgelerinde belirtildiği gibi, YOLOv9 modellerini eğitmek, YOLOv5 gibi daha yerleşik modellere kıyasla daha fazla kaynak yoğun ve zaman alıcı olabilir.
  • Daha Yeni Ekosistem: Farklı bir araştırma grubunun daha yeni bir modeli olduğundan, ekosistemi, topluluk desteği ve üçüncü taraf entegrasyonları, köklü Ultralytics YOLOv5'inkine göre daha az olgundur.
  • Görev Çok Yönlülüğü: Orijinal YOLOv9 öncelikle nesne algılamaya odaklanır. Ultralytics modellerinde yerel olarak desteklenen örnek segmentasyonu, görüntü sınıflandırması ve poz tahmini gibi diğer görme görevleri için yerleşik desteği yoktur.

Kullanım Alanları

  • Gelişmiş video analizi ve yüksek hassasiyetli endüstriyel denetim gibi mümkün olan en yüksek nesne algılama doğruluğunu talep eden uygulamalar.
  • Trafik yönetimi için yapay zeka gibi, hesaplama verimliliğinin en üst düzey performansla dengelenmesi gereken senaryolar.
  • Yeni mimarileri keşfetmenin öncelikli olduğu gelişmiş bilgisayar görüşü alanındaki araştırma ve geliştirme çalışmaları.

YOLOv9 hakkında daha fazla bilgi edinin

Ultralytics YOLOv5: Yerleşik ve Çok Yönlü Standart

2020'de piyasaya sürülen Ultralytics YOLOv5, hızı, doğruluğu ve kullanım kolaylığı arasındaki olağanüstü dengesi nedeniyle kısa sürede bir endüstri standardı haline geldi. Tamamen PyTorch ile geliştirilmiş olup, sürekli olarak iyileştirilmekte ve sağlam bir ekosistem tarafından desteklenmektedir.

Yazar: Glenn Jocher
Kuruluş: Ultralytics
Tarih: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Belgeleme: https://docs.ultralytics.com/models/yolov5/

Mimari ve Özellikler

YOLOv5, etkili özellik toplama için bir CSPDarknet53 backbone ve bir PANet boynu içeren kanıtlanmış bir mimari kullanır. Anchor tabanlı algılama başlığı son derece verimlidir. Model, geliştiricilerin performans ve kaynak kısıtlamaları arasında mükemmel dengeyi seçmelerine olanak tanıyan çeşitli boyutlarda (n, s, m, l, x) mevcuttur.

Güçlü Yönler

  • Olağanüstü Hız ve Verimlilik: YOLOv5, hızlı çıkarım için son derece optimize edilmiştir ve bu da onu güçlü GPU'lardan kaynak kısıtlı uç cihazlara kadar çok çeşitli donanımlarda gerçek zamanlı uygulamalar için ideal kılar.
  • Kullanım Kolaylığı: Kolaylaştırılmış kullanıcı deneyimi ile tanınan YOLOv5, kapsamlı ve anlaşılır dokümantasyonun yanı sıra basit Python ve CLI arayüzleri sunar.
  • İyi Yönetilen Ekosistem: YOLOv5, aktif geliştirme, Discord üzerinde geniş ve destekleyici bir topluluk, sık güncellemeler ve kodsuz eğitim ve dağıtım için Ultralytics HUB gibi güçlü araçlar içeren kapsamlı Ultralytics ekosisteminden yararlanır.
  • Performans Dengesi: Çıkarım hızı ve tespit doğruluğu arasında güçlü bir denge sağlayarak, çeşitli gerçek dünya dağıtım senaryoları için uygun hale getirir.
  • Çok Yönlülük: Birçok özel modelin aksine, YOLOv5, nesne tespiti, örnek segmentasyonu ve görüntü sınıflandırması dahil olmak üzere birden fazla görevi kutudan çıkar çıkmaz destekler.
  • Eğitim Verimliliği: YOLOv5, verimli eğitim süreçleri, kolayca erişilebilen önceden eğitilmiş ağırlıklar ve özellikle transformatör tabanlı modeller olmak üzere diğer birçok mimariye kıyasla genellikle daha düşük bellek gereksinimleri sunar.

Zayıflıklar

  • En Yüksek Doğruluk: Zamanına göre oldukça doğru olmakla birlikte, YOLOv9 gibi daha yeni modeller COCO gibi kıyaslamalarda daha yüksek mAP puanları elde edebilir.
  • Anchor-Based Design: Önceden tanımlanmış anchor kutularına dayanır ve bu da modern anchor-free yaklaşımlara kıyasla alışılmadık şekilli nesnelere sahip veri kümeleri için daha fazla ayarlama gerektirebilir.

Kullanım Alanları

YOLOv5 hakkında daha fazla bilgi edinin

Performans ve Kıyaslamalar: YOLOv9 - YOLOv5

YOLOv9 ve YOLOv5 arasındaki performans karşılaştırması, yıllar içindeki model mimarisindeki gelişmeleri vurgulamaktadır. YOLOv9 modelleri, daha üst uçta genellikle parametrelerin ve FLOP'ların daha verimli kullanımıyla YOLOv5 muadillerinden sürekli olarak daha yüksek mAP puanları elde etmektedir. Örneğin, YOLOv9-C, 25,3 milyon parametreyle %53,0 mAP elde ederek, 86,7 milyon parametreyle YOLOv5x'in %50,7 mAP'sini geride bırakmaktadır.

Ancak, YOLOv5 özellikle YOLOv5n ve YOLOv5s gibi daha küçük varyantları ile hız konusunda öne çıkar ve hem CPU hem de GPU üzerinde son derece hızlı çıkarım süreleri sunarak birçok gerçek zamanlı uç uygulaması için rakipsiz hale gelir.

Model boyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

Sonuç: Hangi Modeli Seçmelisiniz?

YOLOv9 ve YOLOv5 arasındaki seçim büyük ölçüde projenizin özel ihtiyaçlarına bağlıdır.

  • YOLOv9, maksimum doğruluk'un birincil hedef olduğu ve eğitim için yeterli hesaplama kaynaklarına sahip olduğunuz uygulamalar için üstün bir seçimdir. Yenilikçi mimarisi, onu özel alanlarda nesne algılama performansının sınırlarını zorlamak için ideal kılar.

  • Ultralytics YOLOv5, daha geniş bir uygulama yelpazesi için daha pratik ve çok yönlü bir seçenek olmaya devam ediyor. Temel avantajları—kullanım kolaylığı, hız, çoklu görev desteği ve olgun, iyi desteklenen bir ekosistem—onu hızlı ve verimli bir şekilde sağlam, gerçek dünya çözümleri oluşturması gereken geliştiriciler için ideal model haline getirir. Uç cihazlarda dağıtım veya hız ve doğruluk arasında bir denge gerektiren projeler için YOLOv5 genellikle en uygun seçimdir.

Bir orta yol veya daha da gelişmiş özellikler arayanlar için Ultralytics, eksiksiz bir model paketi sunar. YOLOv5'in birçok kullanılabilirlik avantajını ankraj içermeyen bir mimari ve daha da fazla çok yönlülükle birleştiren YOLOv8'i veya Ultralytics ekosistemi içinde en son teknoloji performansı için en son YOLO11'i keşfetmeyi düşünün. Model karşılaştırma sayfamızda daha fazla karşılaştırma bulabilirsiniz.



📅 1 yıl önce oluşturuldu ✏️ 1 ay önce güncellendi

Yorumlar