EfficientDet - DAMO-YOLO Karşılaştırması: Teknik Bir İnceleme
Bilgisayar görüşü alanındaki hızlı gelişmelerde, doğru nesne algılama mimarisini seçmek uygulama başarısı için kritik öneme sahiptir. Alanı şekillendiren iki önemli mimari, Google Research tarafından geliştirilen EfficientDet ve Alibaba'nın DAMO Academy'si tarafından geliştirilen DAMO-YOLO'dur. Her ikisi de performansı en üst düzeye çıkarmayı amaçlarken, tasarım felsefelerinde önemli ölçüde farklılaşırlar: biri parametre verimliliğine ve ölçeklenebilirliğe odaklanırken, diğeri endüstriyel donanımda düşük gecikmeli çıkarımı hedefler.
Bu kılavuz, geliştiricilerin bilinçli kararlar almasına yardımcı olmak amacıyla bu iki modelin mimarilerini, performans metriklerini ve ideal kullanım durumlarını karşılaştıran derinlemesine bir teknik analizini sunar.
Performans Analizi: Verimlilik - Gecikme Süresi Karşılaştırması
Aşağıdaki kıyaslamalar, EfficientDet ve DAMO-YOLO arasındaki belirgin ödünleşimleri göstermektedir. EfficientDet, düşük parametre sayısı ve FLOP'ları ile bilinir ve bu da onu teorik olarak verimli kılar, DAMO-YOLO ise GPU'larda gerçek dünya çıkarım hızı için optimize edilmiştir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Temel Kıyaslama Çıkarımları
Yukarıdaki verilerden, çeşitli kritik ayrımlar ortaya çıkmaktadır:
- GPU Gecikme Süresi Üstünlüğü: DAMO-YOLO, GPU donanımında önemli ölçüde daha hızlı çıkarım hızları gösterir. Örneğin, DAMO-YOLOm, bir T4 GPU'da yalnızca 5,09 ms'lik bir gecikmeyle 49,2'lik bir mAP elde eder. Buna karşılık, karşılaştırılabilir EfficientDet-d4 (49,7 mAP) 33,55 ms gerektirir; bu neredeyse 6 kat daha yavaştır.
- Parametre Verimliliği: EfficientDet, model sıkıştırma metriklerinde mükemmeldir. EfficientDet-d0 modeli yalnızca 3.9M parametre ve 2.54B FLOP kullanır ve depolama alanı kısıtlı cihazlar için ideal olan hafif bir ayak izi sunar.
- CPU Performansı: EfficientDet, CPU performansı için yerleşik kıyaslamalar sağlayarak, hızlandırılmamış uç cihazlar için öngörülebilir bir seçim olmasını sağlar. Bununla birlikte, karmaşık özellik birleştirme katmanları genellikle daha basit mimarilere kıyasla daha yavaş gerçek dünya verimine neden olur.
EfficientDet: Ölçeklenebilir ve Verimli
EfficientDet, model boyutlarını ölçeklendirmenin prensipli bir yolunu sunarak nesne algılamada devrim yarattı. EfficientNet backbone üzerine inşa edilmiş olup, teorik hesaplama maliyetini (FLOP'lar) en aza indirirken yüksek doğruluk elde etmeyi amaçlar.
EfficientDet Detayları:
- Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
- Kuruluş:Google
- Tarih: 2019-11-20
- Arxiv:https://arxiv.org/abs/1911.09070
- GitHub:https://github.com/google/automl/tree/master/efficientdet
Mimari Öne Çıkanlar
EfficientDet'in temel yeniliği iki ana bileşende yatmaktadır:
- BiFPN (Çift Yönlü Özellik Piramidi Ağı): Farklı ölçeklerdeki özellikleri toplayan geleneksel FPN'lerden farklı olarak BiFPN, farklı girdi özelliklerine öğrenilebilir ağırlıklar sunar ve bilgilerin hem yukarıdan aşağıya hem de aşağıdan yukarıya doğru tekrar tekrar akmasına izin verir. Bu, özellik birleşimini iyileştirir ancak hesaplama karmaşıklığını artırır.
- Bileşik Ölçeklendirme: EfficientDet, backbone, BiFPN, sınıf/kutu ağı ve giriş çözünürlüğünü ortaklaşa ölçeklendiren bir bileşik katsayı önerir. Bu, ağın tüm parçalarının yalnızca bir boyutu (derinlik veya genişlik gibi) keyfi olarak ölçeklendirmek yerine dengeli bir şekilde büyümesini sağlar.
Güçlü ve Zayıf Yönler
EfficientDet'in temel gücü, teorik verimliliğidir. YOLOv3 veya RetinaNet gibi önceki dedektörlerden çok daha az parametreyle son teknoloji doğruluğu elde eder. Bununla birlikte, derinlemesine ayrılabilir evrişimlerin yoğun kullanımı ve BiFPN'nin karmaşık bellek erişim düzenleri, modern GPU'larda daha düşük kullanıma yol açarak daha düşük FLOP'lara rağmen daha yüksek gecikmeye neden olabilir.
Dağıtım Hususları
EfficientDet'in düşük FLOP'ları olmasına rağmen, "düşük FLOP'lar" her zaman "hızlı çıkarım" anlamına gelmez. GPU'lar veya TPU'lar gibi donanımlarda, bellek bant genişliği ve çekirdek başlatma ek yükleri genellikle daha önemlidir. EfficientDet'in karmaşık grafik yapısı, bazen gerçek zamanlı çıkarım senaryolarında bir darboğaz olabilir.
DAMO-YOLO: Hız Odaklı İnovasyon
DAMO-YOLO, belirli bir hedefle tasarlanmıştır: endüstriyel donanımda yüksek performans ve düşük gecikme arasındaki boşluğu kapatmak. Algılama görevleri için en uygun yapıyı bulmak üzere en son sinirsel mimari arama (NAS) teknolojilerini içerir.
DAMO-YOLO Detayları:
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Kuruluş:Alibaba Group
- Tarih: 2022-11-23
- Arxiv:https://arxiv.org/abs/2211.15444v2
- GitHub:https://github.com/tinyvision/DAMO-YOLO
Mimari Öne Çıkanlar
DAMO-YOLO, YOLO ailesine çeşitli "yeni teknoloji" bileşenleri sunar:
- MAE-NAS Backbone: Değişken giriş çözünürlüklerini etkili bir şekilde işleyen verimli backboneleri keşfetmek için Maksimum Entropi tarafından yönlendirilen Sinirsel Mimari Arama (NAS) kullanır.
- RepGFPN: Bu, standart Genelleştirilmiş FPN'ye göre bir iyileştirmedir ve donanım kullanımını en üst düzeye çıkarmak için kaynaştırma bloğunu düzene koymak üzere yeniden parametrelendirme içerir.
- ZeroHead & AlignedOTA: "ZeroHead" tasarımı, detect başlığının karmaşıklığını önemli ölçüde azaltırken, AlignedOTA (Optimal Transport Assignment - Optimal Taşıma Ataması), sınıflandırma ve regresyon arasındaki uyumsuzluğu çözmek için eğitim sırasında güçlü bir etiket atama stratejisi sağlar.
Güçlü ve Zayıf Yönler
DAMO-YOLO, ham hızda mükemmeldir. Donanım hızlandırmasına uygun yapılara (TensorRT gibi) öncelik vererek, dikkat çekici bir verim elde eder. Bununla birlikte, karmaşık NAS tarafından oluşturulan mimarilere olan bağımlılığı, daha basit, elle hazırlanmış mimarilere kıyasla özel araştırma amaçları için değiştirmeyi veya ince ayar yapmayı zorlaştırabilir. Ek olarak, daha yaygın YOLO sürümlerinde bulunan geniş topluluk desteği ve çoklu platform kullanım kolaylığından yoksundur.
Ultralytics YOLO11: Bütünsel Alternatif
EfficientDet parametre verimliliği ve DAMO-YOLO GPU hızı sunarken, Ultralytics YOLO11 geliştirici dostu bir ekosistemde sarılı olarak her ikisinin de üstün bir dengesini sağlar. Uç AI'dan bulut dağıtımlarına kadar uzanan çoğu pratik uygulama için YOLO11 en uygun seçimi temsil eder.
YOLO11 hakkında daha fazla bilgi edinin
Neden Ultralytics Modellerini Seçmelisiniz?
- Rakipsiz Çok Yönlülük: Temelde nesne algılayıcıları olan EfficientDet ve DAMO-YOLO'nun aksine, Ultralytics YOLO11, örnek segmentasyonu, poz tahmini, yönlendirilmiş sınırlayıcı kutular (OBB) ve görüntü sınıflandırması dahil olmak üzere çok çeşitli bilgisayar görüşü görevlerini doğal olarak destekler. Bu, çeşitli proje gereksinimleri için tek bir çerçeve kullanmanıza olanak tanır.
- Performans Dengesi: YOLO11, doğruluk-gecikme sınırında çıtayı yükseltir. Genellikle daha ağır modellerin doğruluğuyla eşleşir veya onu aşarken, özel gerçek zamanlı modellerle rekabetçi çıkarım hızlarını korur.
- Kullanım Kolaylığı ve Ekosistem: Ultralytics API'si basitlik için tasarlanmıştır. Kapsamlı dokümantasyon ve topluluk desteği ile geliştiriciler dakikalar içinde kurulumdan eğitime geçebilirler. Ekosistem, veri etiketleme, deney takibi ve ONNX, TensorRT, CoreML ve TFLite gibi formatlara tek tıklamayla dışa aktarma için sorunsuz entegrasyonlar içerir.
- Eğitim Verimliliği: Ultralytics modelleri, hızlı yakınsama için optimize edilmiştir. Yüksek performanslı modellerin eğitimiyle ilişkili zamanı ve maliyeti azaltan gelişmiş veri artırma stratejileri ve verimli veri yükleyicileri kullanırlar.
- Bellek Verimliliği: Transformatör tabanlı modellere veya eski mimarilere kıyasla, YOLO11 eğitim için önemli ölçüde daha az CUDA belleği gerektirir ve bu da onu tüketici sınıfı GPU'larda erişilebilir kılar.
Kod Örneği: YOLO11 ile Başlarken
Ultralytics ile son teknoloji detect işlemini uygulamak basittir. Aşağıdaki kod parçacığı, önceden eğitilmiş bir YOLO11 modelinin nasıl yükleneceğini ve bir görüntüde çıkarımın nasıl çalıştırılacağını göstermektedir:
from ultralytics import YOLO
# Load a pre-trained YOLO11n model
model = YOLO("yolo11n.pt")
# Run inference on a local image or URL
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()
# Export the model to ONNX format for deployment
path = model.export(format="onnx")
Sorunsuz Entegrasyon
Ultralytics modelleri, popüler MLOps araçlarıyla zahmetsizce entegre olur. Günlüğe kaydetme için MLflow veya hiperparametre optimizasyonu için Ray Tune kullanıyor olsanız da, işlevsellik doğrudan kitaplığa yerleşiktir.
Sonuç
EfficientDet ve DAMO-YOLO arasındaki karşılaştırmada, seçim büyük ölçüde belirli donanım kısıtlamalarına bağlıdır. EfficientDet, parametre sayısının birincil darboğaz olduğu teorik verimlilik ve senaryolar için güçlü bir aday olmaya devam ediyor. DAMO-YOLO, gecikmenin en önemli olduğu modern GPU'larda çalışan yüksek verimli uygulamalar için açık bir kazanan.
Ancak, her iki dünyanın da en iyilerini bir araya getiren bir çözüm için (yüksek performans, kullanım kolaylığı ve çoklu görev yeteneği) Ultralytics YOLO11 endüstri standardı olarak öne çıkıyor. Sağlam ekosistemi ve sürekli iyileştirmeleri, geliştiricilerin ölçeklenebilir bilgisayarlı görü çözümleri oluşturmak için en güvenilir araçlara sahip olmasını sağlar.
Diğer Karşılaştırmaları İnceleyin
Nesne algılama modellerinin genel yapısını daha iyi anlamak için, bu ek karşılaştırmaları inceleyin:
- YOLO11 - EfficientDet Karşılaştırması
- YOLOv8 - DAMO-YOLO
- RT-DETR - DAMO-YOLO Karşılaştırması
- YOLO11 - RT-DETR Karşılaştırması
- YOLOX - EfficientDet Karşılaştırması