EfficientDet - YOLOv9 Karşılaştırması: Teknik Bir İnceleme
Optimum nesne algılama modelini seçmek, doğruluk, hız ve hesaplama kaynaklarını dengeleyen bilgisayarla görme görevleri için kritiktir. Bu sayfa, Google'ın EfficientDet'i ve Ultralytics YOLOv9 arasında, nesne algılama alanında önemli iki model arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Projeleriniz için bilinçli bir karar vermenize yardımcı olmak için mimari tasarımlarını, performans kıyaslamalarını ve uygun uygulamalarını inceleyeceğiz.
EfficientDet: Ölçeklenebilir ve Verimli Mimari
EfficientDet, 2019'da Google Research araştırmacıları tarafından tanıtıldı ve kısa sürede verimli nesne tespiti için bir ölçüt haline geldi. Sistematik bir bileşik ölçekleme yöntemi kullanarak hafif, uç uyumlu sürümlerden yüksek doğruluklu, bulut tabanlı olanlara kadar ölçeklenebilen bir model ailesi önerdi.
- Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
- Kuruluş: Google
- Tarih: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- Belgeler: https://github.com/google/automl/tree/master/efficientdet#readme
Mimari ve Temel Özellikler
EfficientDet'in mimarisi üç temel bileşen üzerine kurulmuştur:
- EfficientNet Backbone: Özellik çıkarımı için, hem doğruluk hem de FLOP'lar için optimize etmek üzere bir sinirsel mimari arama (NAS) kullanılarak tasarlanan yüksek verimli EfficientNet'i backbone olarak kullanır.
- BiFPN (Çift Yönlü Özellik Piramidi Ağı): Geleneksel bir FPN yerine, EfficientDet, ağırlıklı bağlantılarla daha zengin, çok ölçekli özellik kaynaştırmasına olanak tanıyan ve minimum hesaplama yüküyle doğruluğu artıran BiFPN'yi kullanır.
- Bileşik Ölçeklendirme: Backbone, özellik ağı ve tespit başlığının derinliğini, genişliğini ve çözünürlüğünü eşit şekilde ölçeklendiren yeni bir yöntem. Bu, farklı kaynak kısıtlamalarına hitap eden bir model ailesinin (D0'dan D7'ye) oluşturulmasına olanak tanır.
Güçlü Yönler
- Ölçeklenebilirlik: EfficientDet'in temel gücü, mobil cihazlardan veri merkezlerine kadar farklı dağıtım hedefleri için geniş bir seçenek yelpazesi sunan model ailesidir.
- Öncü Verimlilik: Piyasaya sürüldüğü sırada, rakip modellere göre daha az parametre ve FLOP ile yüksek doğruluk elde ederek verimlilik için yeni bir standart belirledi.
Zayıflıklar
- Yaş ve Performans: Mimari temel oluşturmasına rağmen 2019'dandır. YOLOv9 gibi daha yeni modeller, özellikle GPU'lar gibi modern donanımlarda hem hız hem de doğruluk açısından onu geride bırakmıştır.
- Çıkarım Hızı: Daha büyük EfficientDet modelleri, özellikle YOLO modellerinin yüksek düzeyde optimize edilmiş çıkarım hızlarına kıyasla yavaş olabilir.
- Görev Özgüllüğü: EfficientDet tamamen nesne algılama için tasarlanmıştır ve modern çerçevelerde bulunan örnek segmentasyonu veya poz tahmini gibi diğer görevler için yerleşik çok yönlülükten yoksundur.
- Ekosistem: Resmi depo, kullanıcı deneyimine daha az odaklanmıştır ve kapsamlı Ultralytics ekosistemi kadar aktif olarak sürdürülmemekte veya desteklenmemektedir.
Kullanım Alanları
EfficientDet hala şunlar için uygulanabilir bir seçenektir:
- Ölçeklendirilmiş varyantlarından (D0-D7) birinin sunduğu belirli bir ödünleşim noktasının mükemmel uyum sağladığı uygulamalar.
- Daha küçük modellerinin rekabetçi performans gösterdiği CPU'lar üzerinde dağıtım gerektiren projeler.
- Modelin zaten entegre olduğu ve yeterli performans gösterdiği eski sistemler.
EfficientDet hakkında daha fazla bilgi edinin
YOLOv9: Son Teknoloji Doğruluk ve Verimlilik
Chien-Yao Wang ve Hong-Yuan Mark Liao tarafından 2024'te tanıtılan Ultralytics YOLOv9, gerçek zamanlı nesne tespitinde önemli bir ilerlemeyi temsil etmektedir. Yenilikçi mimari öğeler aracılığıyla derin ağlardaki bilgi kaybı sorununu ele alarak yeni en son teknoloji ölçütleri belirlemektedir.
- Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
- Tarih: 2024-02-21
- Arşiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
- Belgeler: https://docs.ultralytics.com/models/yolov9/
Mimari ve Temel Özellikler
YOLOv9'un üstün performansı, iki temel yenilikten kaynaklanmaktadır:
- Programlanabilir Gradyan Bilgisi (PGI): Bu kavram, derin sinir ağlarındaki bilgi darboğazı sorununu ele almak için tasarlanmıştır. PGI, modelin eksiksiz bilgi öğrenmesini sağlamak için güvenilir gradyanlar oluşturur ve bu da daha doğru özellik temsillerine yol açar.
- Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN): YOLOv9, CSPNet ve ELAN prensiplerini temel alan yeni ve yüksek verimli bir mimari olan GELAN'ı sunar. Parametre kullanımını ve hesaplama verimliliğini optimize ederek modelin daha az kaynakla daha yüksek doğruluk elde etmesini sağlar.
Güçlü Yönler
- Son Teknoloji Doğruluk: YOLOv9, nesne algılamada üstün doğruluk sağlar ve "YOLOv9: Programlanabilir Gradyan Bilgisi Kullanarak Ne Öğrenmek İstediğinizi Öğrenme" adlı makalesinde ayrıntılı olarak açıklandığı gibi, benzer veya daha düşük parametre sayılarında EfficientDet gibi rakiplerinden daha iyi performans gösterir.
- Olağanüstü Performans Dengesi: Doğruluk, çıkarım hızı ve model boyutu arasında olağanüstü bir denge sunarak uç yapay zekadan yüksek performanslı bulut sunucularına kadar çok çeşitli uygulamalar için uygun hale getirir.
- Kullanım Kolaylığı: YOLOv9, Ultralytics çerçevesi içinde kullanıldığında, kolaylaştırılmış bir kullanıcı deneyimi, basit bir Python API ve kapsamlı belgelerden yararlanır.
- İyi Yönetilen Ekosistem: Ultralytics ekosistemi, aktif geliştirme, geniş ve destekleyici bir topluluk, sık güncellemeler ve kodsuz eğitim ve MLOps için Ultralytics HUB gibi araçlarla entegrasyon sağlar.
- Eğitim Verimliliği: YOLO modelleri, diğer mimarilere kıyasla eğitim sırasında genellikle daha düşük bellek gereksinimlerine sahiptir. Çerçeve, verimli eğitim süreçleri ve kolayca erişilebilen önceden eğitilmiş ağırlıklar sunar.
- Çok Yönlülük: Orijinal makale algılama üzerine odaklansa da, temel GELAN mimarisi çok yönlüdür. Orijinal depo, diğer Ultralytics modelleri gibi YOLOv8'in çoklu görev yetenekleriyle uyumlu olarak, örnek segmentasyonu ve panoptik segmentasyon gibi görevler için desteği gösteriyor.
Zayıflıklar
- Yenilik: Daha yeni bir model olduğundan, gerçek dünyadaki dağıtım örnekleri, Ultralytics topluluğu içindeki benimsenme hızı yüksek olmasına rağmen, EfficientDet gibi daha eski, yerleşik modellere göre daha az sayıda olabilir.
- Eğitim Kaynakları: Performans seviyesi için hesaplama açısından verimli olmasına rağmen, en büyük YOLOv9 varyantlarını (örneğin, YOLOv9-E) eğitmek hala önemli miktarda hesaplama kaynağı gerektirebilir.
Kullanım Alanları
YOLOv9, özellikle aşağıdakiler gibi doğruluk ve verimliliğin çok önemli olduğu uygulamalar için özellikle uygundur:
- Uydu görüntüleri gibi yüksek çözünürlüklü görüntü analizi.
- Otonom araçlar ve robotikte gerekli olan karmaşık sahne anlama.
- Üretimde kalite kontrolü gibi görevler için ayrıntılı nesne tanıma.
YOLOv9 hakkında daha fazla bilgi edinin
Performans Analizi: YOLOv9 - EfficientDet Karşılaştırması
Aşağıdaki tabloda, COCO veri kümesi üzerinde kıyaslanan EfficientDet ve YOLOv9'un çeşitli model boyutları için performans metriklerinin doğrudan bir karşılaştırması sunulmaktadır.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Verilerden, çeşitli önemli içgörüler ortaya çıkıyor:
- Doğruluk ve Verimlilik: YOLOv9 sürekli olarak daha iyi bir denge sunar. Örneğin, YOLOv9-C, parametrelerin ve FLOP'ların yaklaşık yarısıyla EfficientDet-D6'dan (52,6) daha yüksek bir mAP (53,0) elde eder.
- Çıkarım Hızı: TensorRT optimizasyonuna sahip modern bir GPU'da, YOLOv9 modelleri önemli ölçüde daha hızlıdır. YOLOv9-E, EfficientDet-D7'den 7 kattan daha hızlıdır ve aynı zamanda daha doğrudur. En küçük YOLOv9t modeli bile en küçük EfficientDet-d0'dan çok daha hızlıdır.
- Kaynak Kullanımı: YOLOv9 modelleri, parametre açısından daha verimlidir. YOLOv9-S (7,1M parametre), EfficientDet-D3'ün (12,0M parametre) doğruluğunu aşar. Bu verimlilik, kaynak kısıtlı cihazlarda dağıtım için çok önemlidir.
Sonuç ve Öneriler
EfficientDet, verimliliğin sınırlarını zorlayan çığır açan bir model olsa da, bilgisayarlı görü alanı hızla gelişti. Bugün başlayan yeni projeler için YOLOv9 açık bir seçimdir. Son teknoloji doğruluğu, modern donanımda üstün çıkarım hızı ve daha fazla hesaplama verimliliği sunar.
YOLOv9'un Ultralytics ekosistemine entegrasyonu, geliştiricilere eğitimden dağıtıma kadar tüm iş akışını hızlandıran kullanıcı dostu, iyi desteklenen ve çok yönlü bir çerçeve sağlayarak avantajını daha da pekiştiriyor. EfficientDet, tarihsel olarak önemli bir model olmaya devam ediyor ve eski sistemleri korumak için uygun olabilir, ancak yeni, yüksek performanslı uygulamalar için YOLOv9 belirleyici bir avantaj sunuyor.
Diğer Modelleri İnceleyin
Farklı son teknoloji modelleri araştırıyorsanız, diğer karşılaştırma sayfalarımıza göz atmayı unutmayın: