YOLOv9 - EfficientDet Karşılaştırması: Detaylı Bir Karşılaştırma
Optimum nesne algılama modelini seçmek, doğruluk, hız ve hesaplama kaynaklarını dengeleyen bilgisayarla görme görevleri için kritiktir. Bu sayfa, nesne algılama alanında önemli iki model olan Ultralytics YOLOv9 ve EfficientDet arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Projeleriniz için bilinçli bir karar vermenize yardımcı olmak için mimari tasarımlarını, performans kıyaslamalarını ve uygun uygulamalarını inceleyeceğiz.
YOLOv9: Son Teknoloji Doğruluk ve Verimlilik
2024'te Academia Sinica, Tayvan'daki Bilgi Bilimi Enstitüsü'nden Chien-Yao Wang ve Hong-Yuan Mark Liao tarafından tanıtılan YOLOv9, YOLO serisinde önemli bir ilerlemeyi temsil etmektedir. "YOLOv9: Programlanabilir Gradyan Bilgisi Kullanarak Öğrenmek İstediğinizi Öğrenme" adlı makalelerinde detaylandırılmış ve GitHub depolarında uygulanmıştır. YOLOv9, Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) gibi yenilikçi mimari öğeler aracılığıyla derin ağlardaki bilgi kaybı sorununu ele almaktadır. Bu yenilikler, modelin etkili bir şekilde öğrenmesini ve daha az parametreyle yüksek doğruluğu korumasını sağlayarak performans ve verimlilik arasında güçlü bir denge sergilemektedir.
Teknik Detaylar:
- Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
- Tarih: 2024-02-21
- Arşiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
- Belgeler: https://docs.ultralytics.com/models/yolov9/
Güçlü Yönler
- Son Teknoloji Doğruluk: YOLOv9, nesne algılamada üstün doğruluk sağlar ve genellikle benzer parametre sayılarında rakiplerinden daha iyi performans gösterir.
- Verimli Parametre Kullanımı: PGI ve GELAN mimarileri, özellik çıkarımını geliştirir ve bilgi kaybını azaltır, bu da daha az parametre ve FLOP ile daha iyi performansa yol açar.
- Ölçeklenebilirlik: YOLOv9 ailesi, farklı hesaplama yetenekleri için esneklik sunan çeşitli model boyutları (YOLOv9t'den YOLOv9e'ye) içerir.
- Ultralytics Ekosistemi: Orijinal araştırma Academia Sinica'dan olmasına rağmen, Ultralytics çatısı içindeki entegrasyon muazzam faydalar sağlar. Bunlar arasında basit bir Python API'si aracılığıyla kullanım kolaylığı, kapsamlı belgelendirme ve kolayca erişilebilen önceden eğitilmiş ağırlıklarla verimli eğitim süreçleri yer alır. İyi yönetilen ekosistem, aktif geliştirmeyi, güçlü topluluk desteğini ve kodsuz eğitim için Ultralytics HUB gibi araçlarla entegrasyonu sağlar.
- Düşük Bellek Ayak İzi: YOLO modelleri, özellikle RT-DETR gibi transformatör tabanlı modeller olmak üzere, diğer birçok mimariye kıyasla eğitim sırasında tipik olarak daha düşük bellek gereksinimleri sergiler.
Zayıflıklar
- Yenilik: Daha yeni bir model olduğundan, gerçek dünyadaki dağıtım örnekleri, Ultralytics topluluğu içindeki benimsenme hızı yüksek olmasına rağmen, EfficientDet gibi daha eski, yerleşik modellere göre daha az sayıda olabilir.
- Görev Özgüllüğü: Orijinal YOLOv9 makalesi öncelikle nesne algılamaya odaklanmaktadır. Ancak, Ultralytics ekosistemine entegrasyonu, Ultralytics YOLOv8 gibi modellerin çoklu görev yetenekleriyle uyumlu olarak daha geniş bir potansiyele işaret etmektedir.
Kullanım Alanları
YOLOv9, özellikle aşağıdakiler gibi doğruluk ve verimliliğin çok önemli olduğu uygulamalar için özellikle uygundur:
- Uydu görüntülerini analiz etmek için bilgisayar görüşünü kullanma gibi yüksek çözünürlüklü görüntü analizi.
- Otonom araçlarda gerekli olan karmaşık sahne anlama.
- Üretimde kalite kontrolü gibi görevler için ayrıntılı nesne tanıma.
YOLOv9 hakkında daha fazla bilgi edinin
EfficientDet: Ölçeklenebilir ve Verimli Nesne Algılama
EfficientDet, 2019'da Google Research'teki bir ekip tarafından tanıtıldı. Doğruluktan ödün vermeden verimliliğe öncelik veren yeni bir ölçeklenebilir nesne algılayıcı ailesi önerdi. Modelin mimarisi, modelin tüm parçaları için çözünürlüğü, derinliği ve genişliği eşit şekilde ölçeklendiren son derece verimli EfficientNet backbone'una, özellik kaynaştırma için yeni bir Çift Yönlü Özellik Piramit Ağı'na (BiFPN) ve bileşik ölçeklendirme yöntemine dayanmaktadır.
Teknik Detaylar:
- Yazarlar: Mingxing Tan, Ruoming Pang, Quoc V. Le
- Kuruluş: Google
- Tarih: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
Güçlü Yönler
- Bileşik Ölçeklendirme: EfficientDet'in temel yeniliği, farklı kaynak kısıtlamalarına hitap eden bir model ailesi (D0-D7) oluşturmasına olanak tanıyan sistematik ölçeklendirme yaklaşımıdır.
- BiFPN: Çift Yönlü Özellik Piramidi Ağı, geleneksel FPN'lere kıyasla daha zengin çok ölçekli özellik kaynaştırmaya olanak tanıyarak algılama doğruluğunu artırır.
- Tarihsel Önem: Piyasaya sürüldüğü dönemde EfficientDet, nesne algılamada yeni bir verimlilik standardı belirleyerek sonraki birçok mimariyi etkiledi.
Zayıflıklar
- Güncel Olmayan Performans: Zamanı için çığır açıcı olsa da, EfficientDet hem doğruluk hem de hız açısından YOLOv9 gibi daha yeni modeller tarafından geride bırakılmıştır. Performans tablosunda gösterildiği gibi, YOLOv9 modelleri daha az parametre ve önemli ölçüde daha hızlı çıkarım hızlarıyla sürekli olarak daha yüksek mAP elde etmektedir.
- Daha Yavaş Çıkarım: NVIDIA T4 gibi modern donanımlarda, en küçük EfficientDet modelleri bile karşılaştırılabilir veya daha doğru YOLOv9 varyantlarından daha yavaştır.
- Sınırlı Ekosistem: EfficientDet öncelikle bir araştırma deposudur. Ultralytics tarafından sağlanan, kolaylaştırılmış eğitim, dağıtım ve topluluk desteği içeren kapsamlı, kullanıcı dostu ekosistemden yoksundur.
- Göreve Özgü: EfficientDet yalnızca nesne algılama için tasarlanmıştır ve Ultralytics çerçevesinde bulunan örnek segmentasyonu veya poz tahmini gibi diğer görevler için yerleşik çok yönlülük sunmaz.
Kullanım Alanları
EfficientDet, eski sistemler için veya akademik karşılaştırma için bir temel olarak hala düşünülebilir. Uygulamaları şunları içerir:
- Yüksek hızlı çıkarımın birincil kısıtlama olmadığı genel amaçlı nesne algılama.
- Özellik piramidi ağlarını ve model ölçeklendirme prensiplerini anlamak için eğitim amaçlı.
- Orijinal uygulamanın bulunduğu TensorFlow çerçevesinde standartlaştırılmış projeler.
EfficientDet hakkında daha fazla bilgi edinin
Performans Analizi: YOLOv9 - EfficientDet Karşılaştırması
YOLOv9 ve EfficientDet arasındaki performans karşılaştırması, son birkaç yılda nesne algılamada kaydedilen gelişmeleri açıkça göstermektedir. YOLOv9, doğruluk, hız ve model boyutu arasında sürekli olarak üstün bir denge sunmaktadır.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.30 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Tablodan, çeşitli önemli içgörüler ortaya çıkıyor:
- Doğruluk - Verimlilik Karşılaştırması: YOLOv9c modeli, yalnızca 25.3M parametre ve T4 GPU'da 7.16 ms'lik inanılmaz hızlı bir çıkarım süresiyle 53.0 mAP elde eder. Buna karşılık, benzer doğruluktaki EfficientDet-d6 (52.6 mAP), parametrelerin iki katından fazlasını (51.9M) gerektirir ve 89.29 ms ile 12 kat daha yavaştır.
- Üst Düzey Performans: En büyük model olan YOLOv9e, etkileyici bir 55.6 mAP'ye ulaşarak, 7 kat daha hızlı ve önemli ölçüde daha az FLOP gerektirirken, en büyük EfficientDet-d7 modelini (53.7 mAP) bile geride bırakıyor.
- Hafif Modeller: Daha küçük modeller arasında yer alan YOLOv9s (46.8 mAP), EfficientDet-d3'e (47.5 mAP) benzer doğruluk sunar, ancak parametrelerinin neredeyse yarısına sahiptir ve bir GPU'da 5 kat daha hızlıdır.
Sonuç: Hangi Modeli Seçmelisiniz?
Neredeyse tüm modern nesne algılama uygulamaları için YOLOv9 açık ara kazanan. Gelişmiş mimarisi, olağanüstü çıkarım hızı ve parametre verimliliğini korurken en son teknoloji doğruluğu sağlar. Ultralytics ekosistemine entegrasyonu, sağlam dokümantasyon ve aktif bir topluluk tarafından desteklenen eğitimden dağıtıma kadar kolaylaştırılmış bir iş akışı sağlayarak değerini daha da artırır.
EfficientDet, model ölçekleme ve özellik birleştirme konusundaki öncü kavramlarıyla tarihsel ve akademik bir bakış açısıyla önemli bir model olmaya devam ediyor. Ancak, pratik geliştirme ve dağıtım için performansı, YOLOv9 gibi daha yeni, daha verimli mimariler tarafından gölgede bırakılmıştır. Yeni bir projeye başlıyorsanız veya mevcut bir projeyi yükseltmek istiyorsanız, YOLOv9'u seçmek üstün performans, daha hızlı geliştirme döngüleri ve gelecekteki gelişmelere daha iyi destek sağlayacaktır.
Diğer Modelleri İnceleyin
Diğer son teknoloji modelleri araştırıyorsanız, YOLOv10, YOLOv8 ve RT-DETR gibi transformatör tabanlı mimarilerle yapılan karşılaştırmalara bakmayı düşünebilirsiniz. Model karşılaştırma sayfamızda daha ayrıntılı analizler bulabilirsiniz.