DAMO-YOLO ve EfficientDet: Teknik Bir Karşılaştırma
Bilgisayar görüşü alanındaki hızlı gelişmelerde, doğru nesne algılama mimarisini seçmek uygulama başarısı için kritik öneme sahiptir. Bu kapsamlı analiz, Alibaba'dan yüksek performanslı bir model olan DAMO-YOLO ile Google'dan ölçeklenebilir ve verimli bir mimari olan EfficientDet'i karşılaştırmaktadır. Her iki model de hız, doğruluk ve hesaplama maliyeti arasındaki ebedi dengeyi ele alarak alana önemli yenilikler getirmiştir.
Model Genel Bakışları
Performans metriklerine dalmadan önce, her modelin soyunu ve arkasındaki mimari felsefeyi anlamak önemlidir.
DAMO-YOLO
Alibaba Group tarafından geliştirilen DAMO-YOLO (Distillation-Enhanced Neural Architecture Search-based YOLO), doğruluktan ödün vermeden çıkarım hızını en üst düzeye çıkarmaya odaklanır. Backbone'lar için Neural Architecture Search (NAS), verimli bir RepGFPN (Reparameterized Generalized Feature Pyramid Network) ve ZeroHead olarak bilinen hafif bir algılama başlığı gibi teknolojiler sunar.
DAMO-YOLO Detayları:
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Kuruluş:Alibaba Group
- Tarih: 2022-11-23
- Arxiv:DAMO-YOLO: Gerçek Zamanlı Nesne Algılama Tasarımı Üzerine Bir Rapor
- GitHub:tinyvision/DAMO-YOLO
DAMO-YOLO hakkında daha fazla bilgi edinin
EfficientDet
Google Brain ekibi tarafından oluşturulan EfficientDet, bileşik bir ölçeklendirme yöntemi önererek nesne tespiti alanında devrim yarattı. Bu yaklaşım, backbone'un, özellik ağının ve tahmin ağlarının çözünürlüğünü, derinliğini ve genişliğini düzgün bir şekilde ölçeklendirir. Kolay ve hızlı özellik birleştirmeye olanak tanıyan BiFPN (Çift Yönlü Özellik Piramidi Ağı)'ye sahiptir.
EfficientDet Detayları:
- Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
- Kuruluş:Google
- Tarih: 2019-11-20
- Arxiv:EfficientDet: Ölçeklenebilir ve Verimli Nesne Algılama
- GitHub:google/automl/efficientdet
EfficientDet hakkında daha fazla bilgi edinin
Performans Analizi: Hız, Doğruluk ve Verimlilik
Aşağıdaki grafik ve tablo, COCO veri setindeki EfficientDet ve DAMO-YOLO modellerinin nicel bir karşılaştırmasını sunmaktadır. Bu kıyaslamalar, her mimarinin farklı optimizasyon hedeflerini vurgulamaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Temel Çıkarımlar
Verilerden, her model ailesi için belirgin güçlü yönler gözlemleyebiliriz:
- GPU Gecikmesi: DAMO-YOLO, GPU çıkarım hızında baskındır. Örneğin,
DAMO-YOLOmelde ediyor. ortalama Ortalama Kesinlik (mAP) bir T4 GPU'da sadece 5,09 ms'lik bir gecikmeyle 49,2'dir. Buna karşılık,EfficientDet-d4, benzer bir 49.7 mAP'ye sahip olan, 33.55 ms'de önemli ölçüde daha yavaştır. - Parametre Verimliliği: EfficientDet, parametreler açısından son derece hafiftir ve kayan nokta işlemleri (FLOPs).
EfficientDet-d0yalnızca 3.9M parametre kullanır, bu da onu depolama açısından oldukça verimli kılar, ancak bu, DAMO-YOLO gibi mimari açısından optimize edilmiş modellere kıyasla modern GPU'larda her zaman daha hızlı çıkarıma dönüşmez. - CPU Performansı: EfficientDet, güvenilir CPU kıyaslamaları sağlayarak, GPU hızlandırmasının kullanılamadığı eski donanımlar için uygulanabilir bir seçenek olmaya devam ettiğini gösterir.
Mimari Notu
DAMO-YOLO'nun hız avantajı, Neural Architecture Search (NAS) kullanılarak donanım gecikmesi için özel optimizasyonundan kaynaklanırken, EfficientDet teorik FLOP'lar için optimizasyon yapar ve bu da her zaman gerçek dünya gecikmesiyle doğrusal olarak ilişkili değildir.
Mimari Derinlemesine İnceleme
EfficientDet: Bileşik Ölçeklendirmenin Gücü
EfficientDet, mobil ters çevrilmiş darboğaz evrişimlerini (MBConv) kullanan EfficientNet backbone üzerine inşa edilmiştir. Tanımlayıcı özelliği, ağırlıklı çift yönlü bir özellik piramidi ağı olan BiFPN'dir. Yalnızca yukarıdan aşağıya özellikleri toplayan geleneksel FPN'lerden farklı olarak BiFPN, her özellik katmanını öğrenilebilir ağırlıklarla ele alarak bilginin hem yukarıdan aşağıya hem de aşağıdan yukarıya akmasına izin verir. Bu, ağın farklı girdi özelliklerinin önemini anlamasını sağlar.
Model, ağ genişliğini, derinliğini ve çözünürlüğünü düzgün bir şekilde artıran bileşik bir katsayı olan phi'yi kullanarak ölçeklenir, böylece daha büyük modeller (örneğin d7) doğruluk ve verimlilik arasında dengeli kalır.
DAMO-YOLO: Hız Odaklı İnovasyon
DAMO-YOLO, gerçek zamanlı gecikmeye odaklanarak farklı bir yaklaşım benimser. Belirli gecikme kısıtlamaları altında en uygun backbone yapısını bulmak için MAE-NAS (Mimari Arama Otomasyonu Yöntemi) kullanır.
Temel yenilikler şunları içerir:
- RepGFPN: Hız için özellik kaynaştırma yollarını optimize etmek üzere yeniden parametrelendirme ile geliştirilmiş standart GFPN'ye göre bir iyileştirme.
- ZeroHead: Genellikle son tahmin katmanlarıyla ilişkili olan hesaplama yükünü azaltan basitleştirilmiş bir detect başlığı.
- AlignedOTA: Eğitim sırasında sınıflandırma ve regresyon görevleri arasındaki uyumsuzluğu çözen bir etiket atama stratejisidir.
Kullanım Alanları ve Uygulamalar
Mimari farklılıklar, her modelin gerçek dünya senaryolarında nerede öne çıktığını belirler.
- EfficientDet, depolama alanı kısıtlı ortamlar veya FLOP'ları en aza indirmenin çok önemli olduğu CPU çıkarımına dayanan uygulamalar için idealdir. Genellikle pil ömrünün (FLOP'larla ilişkili) öncelikli bir endişe olduğu mobil uygulamalarda ve gömülü sistemlerde kullanılır.
- DAMO-YOLO, GPU'larda gerçek zamanlı çıkarımın gerekli olduğu endüstriyel otomasyon, otonom sürüş ve güvenlik gözetiminde öne çıkar. Düşük gecikme süresi, kare düşürmeden yüksek kare hızlı video akışlarının işlenmesine olanak tanır.
Ultralytics'in Avantajı
DAMO-YOLO ve EfficientDet yetenekli modeller olsa da, Ultralytics ekosistemi, modern yapay zeka geliştirme için daha kapsamlı bir çözüm sunar. Son teknoloji ürünü YOLO11 ve çok yönlü YOLOv8 gibi modeller, kullanılabilirlik, performans ve özellik kümesinde önemli avantajlar sağlar.
YOLO11 hakkında daha fazla bilgi edinin
Neden Ultralytics'i Seçmelisiniz?
- Performans Dengesi: Ultralytics modelleri, hız ve doğruluk arasında en iyi dengeyi sağlamak için tasarlanmıştır. Örneğin YOLO11, önceki nesillere kıyasla daha yüksek mAP sunarken, hem CPU'lar hem de GPU'lar üzerinde olağanüstü çıkarım hızlarını korur.
Kullanım Kolaylığı: "Piller dahil" felsefesiyle Ultralytics, basit bir Python API ve güçlü bir Komut Satırı Arayüzü (CLI) sağlar. Geliştiriciler, kurulumdan eğitime dakikalar içinde geçebilir.
from ultralytics import YOLO # Load a pre-trained YOLO11 model model = YOLO("yolo11n.pt") # Run inference on an image results = model("path/to/image.jpg")İyi Yönetilen Ekosistem: Yayınlandıktan sonra terk edilen birçok araştırma modelinin aksine, Ultralytics, GitHub sorunları ve tartışmaları yoluyla sık güncellemeler, hata düzeltmeleri ve topluluk desteği ile aktif bir depoyu korur.
- Çok Yönlülük: Ultralytics modelleri sınırlayıcı kutularla sınırlı değildir. Tek bir birleşik çerçeve içinde yerel olarak örnek segmentasyonu, poz tahmini, görüntü sınıflandırması ve yönlendirilmiş sınırlayıcı kutuları (OBB) destekler.
- Bellek Verimliliği: Ultralytics YOLO modelleri, eğitim sırasında bellek açısından verimli olacak şekilde tasarlanmıştır. Bu, genellikle önemli miktarda CUDA belleği gerektiren transformatör tabanlı modeller veya eski mimarilerle tezat oluşturur ve Ultralytics modellerini tüketici sınıfı donanımda erişilebilir kılar.
- Eğitim Verimliliği: Çerçeve, otomatik karma duyarlılık (AMP), çoklu GPU eğitimi ve önbelleğe alma gibi özellikleri destekleyerek özel veri kümelerinin eğitilmesinin hızlı ve uygun maliyetli olmasını sağlar.
Sonuç
Hem DAMO-YOLO hem de EfficientDet, bilgisayar görüşü tarihinde önemli kilometre taşlarını temsil etmektedir. EfficientDet, prensipli ölçeklendirmenin ve verimli özellik kaynaştırmanın gücünü gösterirken, DAMO-YOLO gecikmeye duyarlı mimari aramanın sınırlarını zorlamıştır.
Ancak, yüksek performansı olağanüstü bir geliştirici deneyimiyle birleştiren, üretime hazır bir çözüm arayan geliştiriciler için Ultralytics YOLO11 önerilen seçimdir. Sağlam bir ekosisteme entegrasyonu, birden fazla bilgisayarlı görü görevine yönelik desteği ve sürekli iyileştirmeleri, onu görsel verileri eyleme geçirilebilir içgörülere dönüştürmek için en pratik araç haline getiriyor.
Diğer Model Karşılaştırmalarını İnceleyin
Model seçim sürecinize daha fazla yardımcı olmak için, Ultralytics belgeleri içindeki bu ilgili karşılaştırmaları keşfedin:
- YOLOv8 - DAMO-YOLO
- YOLO11 ve DAMO-YOLO
- RT-DETR - EfficientDet Karşılaştırması
- YOLOv10 - DAMO-YOLO Karşılaştırması
- YOLOv9 - EfficientDet