EfficientDet vs. YOLO: Nesne Algılama için Detaylı Bir Karşılaştırma
Farklı modeller doğruluk, hız ve verimlilik açısından benzersiz avantajlar sunduğundan, en uygun nesne algılama modelini seçmek bilgisayarla görme projeleri için kritik bir karardır. Bu sayfa, nesne algılama alanında öne çıkan iki model olan EfficientDet ve YOLO arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Bilinçli bir seçim yapmanıza yardımcı olmak için mimarilerini, performans ölçütlerini ve çeşitli uygulamalara uygunluklarını analiz ediyoruz.
EfficientDet
EfficientDet, 2019 yılında Google tarafından tanıtıldı ve nesne algılamadaki verimliliği ve ölçeklenebilirliği ile biliniyor. Birçok çağdaş dedektöre kıyasla önemli ölçüde daha az parametre ve FLOP ile son teknoloji ürünü doğruluğa ulaşır.
Mimari ve Temel Özellikler
EfficientDet, hem verimliliği hem de doğruluğu artırmak için bir dizi mimari yenilik kullanır:
- Omurga Ağı: Nöral mimari arama yoluyla elde edilen verimliliği ve ölçeklenebilirliği ile bilinen EfficientNet'i omurga olarak kullanır.
- BiFPN (Çift Yönlü Özellik Piramidi Ağı): Verimli ve etkili çok ölçekli özellik füzyonu sağlayan ağırlıklı çift yönlü bir özellik piramidi ağı.
- Bileşik Ölçeklendirme: Bileşik bir katsayı kullanarak dedektörün tüm boyutlarını (omurga, özellik ağı, kutu/sınıf tahmin ağı çözünürlüğü) sistematik olarak ölçeklendirir.
Performans Ölçütleri
EfficientDet modelleri, farklı hesaplama kaynaklarına uyacak şekilde bir dizi performans ödünleşimi sunan çeşitli boyutlarda (d0 ila d7) gelir.
- mAP: COCO veri setinde yüksek Ortalama Hassasiyet (mAP) elde ederek güçlü tespit doğruluğu gösterir.
- Çıkarım Hızı: Model boyutuna bağlı olarak bir dizi çıkarım hızı sunar, daha küçük modeller gerçek zamanlı uygulamalar için uygundur.
- Model Boyutu: EfficientDet modelleri, diğer yüksek doğruluklu dedektörlere kıyasla daha küçük model boyutlarına yol açacak şekilde parametre açısından verimli olacak şekilde tasarlanmıştır.
Güçlü ve Zayıf Yönler
Güçlü yönler:
- Yüksek Verimlilik: Doğruluk ve hesaplama maliyeti arasındaki mükemmel denge, onu kaynak kısıtlı ortamlar için uygun hale getirir.
- Ölçeklenebilirlik: Bileşik ölçeklendirme, istenen performans seviyelerine ulaşmak için modelin kolayca ölçeklendirilmesine olanak tanır.
- Doğruluk: Daha az parametre ile son teknoloji doğruluğa ulaşır.
- İyi belgelenmiş uygulama: Google'ın AutoML deposu net bir uygulama ve önceden eğitilmiş modeller sağlar.
Zayıflıklar:
- Karmaşıklık: BiFPN ve bileşik ölçeklendirme stratejileri mimariye karmaşıklık katar.
- Çıkarım Hızı: Verimli olsa da, çıkarım hızı, özellikle daha büyük EfficientDet varyantları için Ultralytics YOLO modelleri gibi bazı gerçek zamanlı dedektörler kadar hızlı olmayabilir.
Kullanım Örnekleri
EfficientDet, hem doğruluğun hem de verimliliğin çok önemli olduğu uygulamalar için çok uygundur:
- Mobil ve Uç Cihazlar: Verimliliği nedeniyle mobil cihazlara ve uç bilişim platformlarına dağıtılabilir.
- Robotik: Doğru ve verimli nesne algılama gerektiren robotik uygulamalar için uygundur.
- Kaynak kısıtlı uygulamalar: Hesaplama kaynaklarının sınırlı olduğu ancak yine de yüksek doğruluğa ihtiyaç duyulan senaryolar için idealdir.
EfficientDet hakkında daha fazla bilgi edinin
DAMO-YOLO
Alibaba Group tarafından 2022 yılında tanıtılan YOLO, özellikle endüstriyel uygulamalara vurgu yaparak yüksek hızlı ve doğru nesne tespiti için tasarlanmıştır. Hız ve hassasiyet dengesini sağlamak için çeşitli yeni teknikleri entegre eder.
Mimari ve Temel Özellikler
YOLO , mimarisinde birçok yenilikçi bileşen barındırmaktadır:
- NAS tabanlı Omurga: Hem hız hem de doğruluk için optimize edilmiş bir Sinirsel Mimari Arama (NAS) omurgası kullanır.
- RepGFPN (Reparameterized Gradient Feature Pyramid Network): Hesaplama verimliliğini korurken özellik temsilini geliştiren verimli bir özellik füzyon ağı.
- ZeroHead: Gecikmeyi en aza indirmek için tasarlanmış hafif bir algılama kafası.
- AlignedOTA (Hizalanmış Optimal Taşıma Ataması): Gelişmiş eğitim ve doğruluk için gelişmiş bir atama stratejisi.
Performans Ölçütleri
YOLO modelleri, çeşitli performans ihtiyaçlarını karşılamak için farklı boyutlarda (t, s, m, l) mevcuttur.
- mAP: COCO veri kümesinde rekabetçi mAP elde ederek güçlü nesne algılama performansı gösterir.
- Çıkarım Hızı: Yüksek çıkarım hızına öncelik vererek gerçek zamanlı ve gecikmeye duyarlı uygulamalar için uygun hale getirir.
- Model Boyutu: Model boyutu ve performans arasında iyi bir denge sunarak verimli olacak şekilde tasarlanmıştır.
Güçlü ve Zayıf Yönler
Güçlü yönler:
- Yüksek Hız: Gerçek zamanlı uygulamalar için optimize edilmiş olağanüstü çıkarım hızı.
- Endüstriyel Odak: Pratik kullanıma odaklanarak endüstriyel uygulamalar için özel olarak tasarlanmıştır.
- Doğruluk: Yüksek çıkarım hızlarına ulaşırken yüksek doğruluğu korur.
- Gelişmiş Teknikler: Gelişmiş performans için NAS omurgası ve AlignedOTA gibi en yeni teknikleri entegre eder.
- Açık Kaynak: Kod ve önceden eğitilmiş modellerle halka açık.
Zayıflıklar:
- Nispeten Yeni: Daha yeni bir model olarak, topluluk ve ekosistem daha köklü modellere kıyasla hala gelişiyor olabilir.
- Karmaşıklık: Birden fazla gelişmiş tekniğin entegrasyonu, mimariyi derinlemesine değiştirmek veya özelleştirmek için karmaşık hale getirebilir.
Kullanım Örnekleri
YOLO özellikle yüksek doğrulukla gerçek zamanlı nesne tespiti gerektiren senaryolarda etkilidir:
- Endüstriyel Denetim: Üretim süreçlerinde kalite kontrol ve denetim için idealdir.
- Otonom Sürüş: Düşük gecikmenin kritik olduğu otonom araçlar ve gelişmiş sürücü destek sistemleri (ADAS) için uygundur.
- Gerçek Zamanlı Video Analitiği: Trafik izleme ve güvenlik sistemleri gibi uygulamalar.
- Edge AI: Gerçek zamanlı işleme için uç cihazlarda dağıtım.
YOLO hakkında daha fazla bilgi edinin
Model Karşılaştırma Tablosu
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4TensorRT10 (ms) |
params (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Sonuç
Hem EfficientDet hem de YOLO , farklı güçlü yönlere sahip güçlü nesne algılama modelleridir. EfficientDet, güçlü doğruluğa sahip bir dizi verimli model sağlamada üstündür ve bu da onu çeşitli uygulamalar, özellikle de kaynak kısıtlamaları olanlar için çok yönlü hale getirir. Öte yandan YOLO, doğruluktan önemli ölçüde ödün vermeden yüksek hızlı çıkarım için tasarlanmıştır, bu da onu gerçek zamanlı endüstriyel ve uç uygulamalar için ideal hale getirir.
Diğer yüksek performanslı nesne algılama modelleriyle ilgilenen kullanıcılar için Ultralytics , aşağıdakiler de dahil olmak üzere bir dizi YOLO modeli sunar YOLOv5, YOLOv8ve en son YOLO11. Özel ihtiyaçlarınız için en iyi modeli bulmanıza yardımcı olmak için YOLOX gibi diğer modellerle karşılaştırmalar da mevcuttur. YOLO modellerinin kolaylaştırılmış eğitimi ve dağıtımı için Ultralytics HUB 'ı keşfetmeyi düşünün.