İçeriğe geç

YOLOv9 - YOLOv7 karşılaştırması: Detaylı Teknik Karşılaştırma

Nesne algılama için bir YOLO modeli seçerken, farklı versiyonlar arasındaki nüansları anlamak çok önemlidir. Bu sayfa, Tayvan, Academia Sinica, Bilgi Bilimi Enstitüsü'ndeki araştırmacılar tarafından geliştirilen YOLO serisindeki iki önemli model olan YOLOv7 ve YOLOv9 arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Bilgisayar görüşü projeleriniz için bilinçli bir karar vermenize yardımcı olmak için mimari yeniliklerini, performans kıyaslamalarını ve çeşitli uygulamalar için uygunluğunu inceleyeceğiz.

YOLOv9: Gelişmiş Öğrenme için Programlanabilir Gradyan Bilgisi

Şubat 2024'te tanıtılan YOLOv9, model performansını düşürebilen yaygın bir sorun olan derin sinir ağlarındaki bilgi kaybını ele alarak önemli bir ilerlemeyi temsil etmektedir.

Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
Tarih: 2024-02-21
Arşiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9
Belgeler: https://docs.ultralytics.com/models/yolov9/

Mimari ve Temel Özellikler

YOLOv9, bilgi akışını ve öğrenme verimliliğini artırmak için yeni konseptler sunar ve bu da onu öncekilerden ayırır.

  • Programlanabilir Gradyan Bilgisi (PGI): Bu, YOLOv9'un temel yeniliğidir. Yardımcı tersine çevrilebilir dallar aracılığıyla güvenilir gradyanlar oluşturarak derin ağlardaki bilgi darboğazı sorununu ele alır. Bu, tüm katmanlarda önemli bilgilerin korunmasını sağlayarak daha etkili model eğitimine ve daha iyi nihai doğruluğa yol açar.
  • Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN): YOLOv9, parametre kullanımını ve hesaplama verimliliğini optimize eden yeni bir ağ mimarisine sahiptir. GELAN, YOLOv5 gibi modellerde etkili olan CSPNet gibi tasarımların başarıları üzerine inşa edilmiş, hafif, gradyan yolu planlama tabanlı bir mimaridir.

Güçlü Yönler

  • Gelişmiş Doğruluk: PGI ve GELAN'ın kombinasyonu, özellikle daha büyük model varyantlarında belirgin olan YOLOv7'ye kıyasla üstün özellik çıkarımı ve daha yüksek ortalama Hassasiyet (mAP) skorları sağlar.
  • Gelişmiş Verimlilik: YOLOv9, YOLOv7'ye göre daha az parametre ve hesaplama (FLOP) ile daha iyi doğruluk elde eder. Örneğin, YOLOv9-C, %66 daha az parametre ve %46 daha az FLOP ile YOLOv7x'e benzer bir mAP elde eder.
  • Son Teknoloji: Orijinal YOLO yazarlarının gerçek zamanlı nesne algılamada mümkün olanın sınırlarını zorlayan en son yeniliklerini temsil eder.

Zayıflıklar

  • Hesaplama Talebi: Doğruluğu için verimli olmasına rağmen, gelişmiş mimari, özellikle YOLOv9-E gibi daha büyük varyantlar, eğitim ve dağıtım için hala önemli miktarda hesaplama kaynağı gerektirebilir.
  • Daha Yeni Model: Daha yeni bir sürüm olduğundan, topluluk desteği ve hazır dağıtım eğitimleri, köklü YOLOv7'ye göre daha az kapsamlı olabilir. Ancak, Ultralytics YOLOv9 uygulaması, kolaylaştırılmış, iyi belgelenmiş ve desteklenen bir ortam sağlayarak bunu hafifletir.

Kullanım Alanları

YOLOv9, nesneleri hassas bir şekilde tespit etmenin kritik olduğu, en yüksek doğruluğu ve verimliliği gerektiren uygulamalar için idealdir.

YOLOv9 hakkında daha fazla bilgi edinin

YOLOv7: Hız ve Verimlilik için Optimize Edildi

Temmuz 2022'de yayınlanan YOLOv7, gerçek zamanlı çıkarım için hız ve doğruluk arasındaki dengeyi önemli ölçüde optimize etmeyi amaçlayan bir dönüm noktası modeliydi.

Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
Tarih: 2022-07-06
Arşiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Belgeler: https://docs.ultralytics.com/models/yolov7/

Mimari ve Temel Özellikler

YOLOv7, çıkarım maliyetini artırmadan modelleri daha hızlı ve daha doğru hale getirmek için mimariyi ve eğitim sürecini optimize etmeye odaklanmıştır.

  • Genişletilmiş Verimli Katman Toplama Ağı (E-ELAN): Bu mimari blok, ağın daha çeşitli özellikleri öğrenmesini sağlayarak öğrenme yeteneğini geliştirir ve orijinal gradyan yolunu bozmadan performansı artırır.
  • Model Ölçeklendirme: YOLOv7, model derinliği ve genişliği için bileşik ölçeklendirme yöntemleri sunarak, farklı model boyutları ve hesaplama bütçeleri için etkili bir şekilde optimize edilmesine olanak tanır.
  • Eğitilebilir Ücretsiz Avantajlar Paketi: Bu kavram, gelişmiş veri artırma ve etiket atama stratejileri gibi eğitim sırasında çeşitli optimizasyon tekniklerini içerir. Bu teknikler, çıkarım sırasında herhangi bir ek hesaplama yükü eklemeden doğruluğu artırır.

Güçlü Yönler

  • Yüksek Çıkarım Hızı: YOLOv7 hız için büyük ölçüde optimize edilmiştir ve mevcut en hızlı nesne dedektörlerinden biri olmaya devam etmektedir, bu da onu çeşitli donanımlarda gerçek zamanlı uygulamalar için mükemmel kılar.
  • Yüksek Performans: Rekabetçi mAP skorları elde ederek birçok standart nesne algılama görevi için güvenilir ve güçlü bir seçimdir.
  • Yerleşik Model: Daha uzun süredir mevcut olan YOLOv7, daha geniş bir benimsemeden, kapsamlı topluluk kaynaklarından ve farklı sektörlerdeki birçok kanıtlanmış dağıtım örneğinden yararlanır.

Zayıflıklar

  • Daha Düşük Tepe Doğruluğu: Hızlı olmasına rağmen, zorlu nesnelerin bulunduğu karmaşık senaryolarda daha yeni YOLOv9'a kıyasla biraz daha düşük tepe doğruluğu sergileyebilir.
  • Anchor Tabanlı: Önceden tanımlanmış anchor kutularına dayanır ve bu durum bazen alışılmadık en boy oranlarına sahip nesneleri algılamak için anchor'suz yaklaşımlardan daha az esnek olabilir.

Kullanım Alanları

YOLOv7, çıkarım hızının en kritik faktör olduğu uygulamalar için çok uygundur.

  • Uç yapay zeka cihazlarında gerçek zamanlı video analizi ve gözetimi.
  • Hızlı hareket eden bir üretim hattında kalite kontrolü gibi yüksek verimli sistemler.
  • Hızlı dağıtımın önemli olduğu nesne algılama sistemlerinin hızlı prototiplemesi.

YOLOv7 hakkında daha fazla bilgi edinin

Performans ve Verimlilik: Karşılaştırmalı Bakış

YOLOv9 ve YOLOv7 arasındaki temel fark, doğruluk, model boyutu ve hesaplama maliyeti arasındaki ödünleşimde yatmaktadır. YOLOv9, daha az parametre ve FLOP ile daha yüksek doğruluk sunarak verimlilik sınırını zorlamaktadır. Örneğin, YOLOv9-M, YOLOv7l ile aynı %51.4 mAP'ye ulaşır, ancak %46 daha az parametreye ve %27 daha az FLOP'a sahiptir. Bu eğilim, YOLOv9-E'nin tüm YOLOv7 varyantlarını aşarak %55.6 mAP ile yeni bir son teknoloji belirlediği ölçeğe kadar devam etmektedir.

Bu gelişmiş verimlilik, belirli bir doğruluk hedefi için YOLOv9'un daha küçük, daha hızlı ve daha enerji verimli bir model sunduğu anlamına gelir.

Model boyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

Sonuç: Sizin İçin Hangi Model Doğru?

Hem YOLOv7 hem de YOLOv9 güçlü modellerdir, ancak biraz farklı önceliklere hitap ederler.

  • Uygulamanız mümkün olan en yüksek doğruluğu ve verimliliği gerektiriyorsa YOLOv9'u seçin. Mimari gelişmeleri, daha küçük bir modelden en iyi performansı almanız gereken karmaşık sahneler ve kaynak kısıtlı dağıtımlar için onu üstün kılar.

  • Standart gerçek zamanlı uygulamalar için savaşta test edilmiş, son derece hızlı bir modele ihtiyacınız varsa ve geniş topluluk kaynaklarına sahip daha yerleşik bir mimariyle çalışmayı tercih ediyorsanız YOLOv7'yi seçin.

En iyi genel deneyimi arayan geliştiriciler ve araştırmacılar için, bu modelleri Ultralytics ekosistemi içinde kullanmanızı öneririz. Ultralytics YOLOv8 ve YOLO11 gibi daha yeni modeller yalnızca rekabetçi performans sunmakla kalmaz, aynı zamanda önemli avantajlarla birlikte gelir:

  • Kullanım Kolaylığı: Basit bir Python API ve kapsamlı belgeler ile kolaylaştırılmış bir kullanıcı deneyimi.
  • İyi Yönetilen Ekosistem: Aktif geliştirme, güçlü topluluk desteği ve kodsuz eğitim ve dağıtım için Ultralytics HUB gibi araçlarla entegrasyon.
  • Çok Yönlülük: örnek segmentasyonu, poz tahmini ve sınıflandırma dahil olmak üzere, algılama ötesindeki birden fazla görevi tek bir çerçeve içinde destekler.
  • Eğitim Verimliliği: Önceden eğitilmiş ağırlıkların kolayca bulunabildiği ve diğer birçok model türüne kıyasla daha düşük bellek gereksinimleriyle verimli eğitim süreçleri.

Diğer Modelleri İnceleyin

Daha fazla karşılaştırma için, Ultralytics belgelerinde bulunan diğer son teknoloji modelleri keşfetmeyi düşünebilirsiniz:



📅 1 yıl önce oluşturuldu ✏️ 1 ay önce güncellendi

Yorumlar