İçeriğe geç

YOLOv5 - YOLOv9 Karşılaştırması: Detaylı Bir Karşılaştırma

Bu sayfa, iki önemli nesne algılama modeli arasında teknik bir karşılaştırma sunmaktadır: Ultralytics YOLOv5 ve YOLOv9. Her iki model de gerçek zamanlı nesne algılamada hız ve doğruluğu dengelemesiyle bilinen, etkili YOLO (You Only Look Once) serisinin bir parçasıdır. Bu karşılaştırma, bilgisayar görüşü projeleriniz için en uygun modeli seçmenize yardımcı olmak amacıyla mimari farklılıklarını, performans metriklerini ve ideal kullanım durumlarını incelemektedir.

Ultralytics YOLOv5: Yerleşik Endüstri Standardı

Yazar: Glenn Jocher
Kuruluş: Ultralytics
Tarih: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Belgeleme: https://docs.ultralytics.com/models/yolov5/

Ultralytics YOLOv5, hızı, doğruluğu ve kullanım kolaylığının olağanüstü dengesi nedeniyle piyasaya sürüldükten sonra hızla popülerlik kazandı. Tamamen PyTorch ile geliştirilen YOLOv5, backbone olarak CSPDarknet53 ve özellik toplama için PANet kullanan bir mimariye ve verimli bir anchor tabanlı algılama başlığına sahiptir. Kullanıcıların hesaplama kaynaklarına ve performans ihtiyaçlarına göre seçim yapmalarına olanak tanıyan çeşitli model boyutları (n, s, m, l, x) sunar.

Güçlü Yönler

  • Olağanüstü Hız ve Verimlilik: YOLOv5, hızlı çıkarım için son derece optimize edilmiştir ve bu da onu uç cihazlar dahil olmak üzere çeşitli donanımlarda gerçek zamanlı uygulamalar için ideal kılar.
  • Kullanım Kolaylığı: Ultralytics YOLOv5, kolaylaştırılmış kullanıcı deneyimi, basit Python ve CLI arayüzleri ve kapsamlı belgeleri ile ünlüdür.
  • İyi Yönetilen Ekosistem: Aktif geliştirme, geniş ve destekleyici bir topluluk, sık güncellemeler ve kodsuz eğitim için Ultralytics HUB gibi kapsamlı kaynaklar içeren entegre Ultralytics ekosisteminden yararlanır.
  • Performans Dengesi: Çıkarım hızı ve algılama doğruluğu arasında güçlü bir denge sağlayarak çeşitli gerçek dünya dağıtım senaryoları için uygun hale getirir.
  • Çok Yönlülük: Nesne tespiti, örnek segmentasyonu ve görüntü sınıflandırması dahil olmak üzere birden fazla görevi destekler.
  • Eğitim Verimliliği: Özellikle transformatör tabanlı modeller olmak üzere, diğer birçok mimariye kıyasla verimli eğitim süreçleri, hazır olarak bulunan önceden eğitilmiş ağırlıklar ve genellikle daha düşük bellek gereksinimleri sunar.

Zayıflıklar

  • Doğruluk: Zamanı için oldukça doğru olmasına rağmen, YOLOv9 gibi daha yeni modeller COCO gibi kıyaslamalarda daha yüksek mAP skorları elde edebilir.
  • Anchor Tabanlı: Önceden tanımlanmış anchor kutularına dayanır ve bu durum anchor'suz yaklaşımlara kıyasla belirli veri kümeleri için daha fazla ayarlama gerektirebilir.

Kullanım Alanları

YOLOv5 hakkında daha fazla bilgi edinin

YOLOv9: Yeni Tekniklerle Doğruluğu Geliştirme

Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
Kuruluş: Institute of Information Science, Academia Sinica, Tayvan
Tarih: 2024-02-21
Arxiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9
Belgeleme: https://docs.ultralytics.com/models/yolov9/

YOLOv9, Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) olmak üzere önemli mimari yenilikler sunar. PGI, kayıp fonksiyonu hesaplaması için eksiksiz girdi bilgisi sağlayarak veriler derin ağlardan geçerken bilgi kaybını azaltmayı amaçlar. GELAN, üstün parametre kullanımı ve hesaplama verimliliği için tasarlanmış yeni bir mimaridir. Bu gelişmeler, YOLOv9'un verimliliği korurken daha yüksek doğruluk elde etmesini sağlar.

Güçlü Yönler

  • Enhanced Accuracy: Gerçek zamanlı nesne dedektörleri için COCO veri kümesinde YOLOv5 ve diğer modelleri mAP'de geride bırakarak yeniState-of-the-art sonuçlar belirler.
  • Geliştirilmiş Verimlilik: GELAN ve PGI, önceki modellere kıyasla karşılaştırılabilir veya daha iyi performans için daha az parametre ve hesaplama kaynağı (FLOP) gerektiren modellere katkıda bulunur.
  • Bilgi Koruma: PGI, daha derin ve karmaşık ağların doğru bir şekilde eğitilmesi için çok önemli olan bilgi darboğazı sorununu etkili bir şekilde ele alır.

Zayıflıklar

  • Eğitim Kaynakları: YOLOv9 modellerini eğitmek, YOLOv9 belgelerinde belirtildiği gibi, Ultralytics YOLOv5'e kıyasla daha fazla kaynak yoğun ve zaman alıcı olabilir.
  • Daha Yeni Mimari: Farklı bir araştırma grubunun daha yeni bir modeli olduğundan, ekosistemi, topluluk desteği ve üçüncü taraf entegrasyonları, köklü Ultralytics YOLOv5'e göre daha az olgundur.
  • Görev Çok Yönlülüğü: Öncelikli olarak nesne algılamaya odaklanır ve Ultralytics'in YOLOv5 ve YOLOv8 gibi modellerinde bulunan segmentasyon, sınıflandırma ve poz tahmini için yerleşik desteği yoktur.

Kullanım Alanları

  • Mümkün olan en yüksek nesne algılama doğruluğunu talep eden uygulamalar.
  • Yüksek performansın yanı sıra hesaplama verimliliğinin de kritik olduğu senaryolar.
  • Gelişmiş video analizi ve yüksek hassasiyetli endüstriyel inceleme.
  • Üst düzey algılama gerektiren trafik yönetimi alanında yapay zeka ve akıllı şehir uygulamaları.

YOLOv9 hakkında daha fazla bilgi edinin

Performans ve Kıyaslamalar: YOLOv5 - YOLOv9

Performansı karşılaştırırken, YOLOv9 modelleri genellikle YOLOv5 muadillerinden daha yüksek mAP puanları elde ederek mimari yeniliklerinin etkinliğini göstermektedir. Bununla birlikte, Ultralytics YOLOv5, olağanüstü çıkarım hızı ve yüksek düzeyde optimize edilmiş uygulaması sayesinde güçlü bir konumunu koruyarak, saniyedeki kare sayısının (FPS) kritik bir metrik olduğu gerçek zamanlı uygulamalar için zorlu bir seçimdir.

Model boyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0

Mimari Derinlemesine İnceleme

YOLOv5 Mimarisi

Ultralytics YOLOv5'in mimarisi, YOLO ailesi prensiplerinin geliştirilmiş bir uygulamasıdır. Üç ana bölümden oluşur:

  • Backbone: Doğruluğu korurken hesaplamayı azaltmak için Çapraz Aşamalı Kısmi (CSP) modüllerini içeren Darknet-53'ün değiştirilmiş bir versiyonu olan bir CSPDarknet53 ağı.
  • Boyun: Çeşitli ölçeklerdeki nesnelerin algılanmasını iyileştirmek için farklı backbone seviyelerinden özellikleri toplamak için bir Yol Toplama Ağı (PANet) kullanılır.
  • Head: Tespit başlığı, önceden tanımlanmış çapa kutusu şekillerinden sınırlayıcı kutuları tahmin eden çapa tabanlıdır ve bu da yüksek hızına katkıda bulunur.

YOLOv9 Mimarisi

YOLOv9, doğruluk ve verimliliğin sınırlarını zorlamak için yeni konseptler sunar:

  • Programlanabilir Gradyan Bilgisi (PGI): Bu mekanizma, derin ağlardaki bilgi darboğazı sorunuyla mücadele etmek için tasarlanmıştır. Kayıp fonksiyonunu hesaplamak için eksiksiz girdi bilgisinin kullanılabilir olmasını sağlayarak daha güvenilir gradyan güncellemelerine ve daha iyi model yakınsamasına yol açar.
  • Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN): Bu, CSPNet ve ELAN prensiplerini temel alan yeni bir ağ mimarisidir. GELAN, parametre kullanımını ve hesaplama verimliliğini optimize etmek için tasarlanmıştır ve modelin daha az kaynakla daha yüksek doğruluk elde etmesini sağlar.

Eğitim ve Ekosistem

Eğitim deneyimi ve ekosistem desteği, Ultralytics YOLOv5'in gerçekten parladığı noktalardır.

  • Kullanım Kolaylığı: YOLOv5, basit komut satırı ve Python API'leri, kapsamlı eğitimler ve kapsamlı belgeler ile inanılmaz derecede kullanıcı dostu bir deneyim sunar.
  • İyi Yönetilen Ekosistem: Resmi bir Ultralytics modeli olarak YOLOv5, aktif geliştirme, GitHub ve Discord'da geniş bir topluluk, sık güncellemeler ve Ultralytics HUB gibi MLOps araçlarıyla sorunsuz entegrasyon içeren sağlam bir ekosistemin parçasıdır.
  • Eğitim Verimliliği: YOLOv5'i eğitmek oldukça verimlidir; kolayca erişilebilen önceden eğitilmiş ağırlıklara ve daha karmaşık mimarilere kıyasla daha düşük bellek gereksinimlerine sahiptir. Bu, daha geniş bir donanım yelpazesine sahip kullanıcılar için erişilebilir kılar.

YOLOv9 güçlü bir model olmasına rağmen, eğitim süreci daha zorlu olabilir ve ekosistemi Ultralytics modellerininki kadar olgun veya entegre değildir. Eğitimden dağıtıma sorunsuz, iyi desteklenen bir yol arayan geliştiriciler için YOLOv5 açık bir avantaj sunar.

Sonuç: Hangi Modeli Seçmelisiniz?

Hem YOLOv5 hem de YOLOv9 mükemmel modellerdir, ancak farklı önceliklere hitap ederler.

  • Ultralytics YOLOv5, hız, kullanım kolaylığı ve olgun, iyi desteklenen bir ekosisteme öncelik veren geliştiriciler için ideal seçimdir. Olağanüstü performans dengesi, onu gerçek zamanlı uygulamalar, hızlı prototipleme ve kaynak kısıtlı uç AI cihazlarında dağıtım için mükemmel kılar. Çoklu görme görevlerindeki çok yönlülüğü, genel amaçlı bir görme AI çerçevesi olarak değerini artırır.

  • YOLOv9, mümkün olan en yüksek nesne algılama doğruluğuna ulaşmanın birincil hedef olduğu ve eğitim için gereken hesaplama kaynaklarının daha az sorun teşkil ettiği uygulamalar için en uygunudur. Yenilikçi mimarisi, zorlu kıyaslama testlerinde son teknoloji sonuçlar sunar.

Çoğu kullanıcı için, özellikle güçlü topluluk ve ticari desteğe sahip güvenilir, hızlı ve kullanımı kolay bir model arayanlar için, Ultralytics YOLOv5 en iyi öneri olmaya devam ediyor. Ultralytics'in en son gelişmelerine ilgi duyanlar için, YOLOv8 ve en yeni YOLO11 gibi modeller, Ultralytics ekosistemini tanımlayan kullanıcı dostu deneyimi korurken daha da yüksek performans ve çok yönlülük sunar.



📅 1 yıl önce oluşturuldu ✏️ 1 ay önce güncellendi

Yorumlar