DAMO-YOLO ve EfficientDet: Teknik Bir Karşılaştırma
Bilgisayarla görmenin hızla gelişen ortamında, doğru nesne algılama mimarisini seçmek uygulama başarısı için kritik öneme sahiptir. Bu kapsamlı analiz, Alibaba'nın yüksek performanslı bir modeli olan YOLO ile Googleın ölçeklenebilir ve verimli bir mimarisi olan EfficientDet'i karşılaştırmaktadır. Her iki model de hız, doğruluk ve hesaplama maliyeti arasındaki sonsuz dengeyi ele alarak alana önemli yenilikler getirmiştir.
Model Genel Bakışları
Performans ölçütlerine geçmeden önce, her modelin arkasındaki soyağacını ve mimari felsefeyi anlamak çok önemlidir.
DAMO-YOLO
Alibaba Group tarafından geliştirilen YOLO (Distillation-Enhanced Neural Architecture Search-based YOLO), doğruluktan ödün vermeden çıkarım hızını en üst düzeye çıkarmaya odaklanmaktadır. Omurgalar için Nöral Mimari Arama (NAS), verimli bir RepGFPN (Yeniden Parametrelendirilmiş Genelleştirilmiş Özellik Piramidi Ağı) ve ZeroHead olarak bilinen hafif bir algılama kafası gibi teknolojiler sunar.
YOLO Detaylar:
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Organizasyon:Alibaba Group
- Tarih: 2022-11-23
- Arxiv:YOLO: Gerçek Zamanlı Nesne Algılama Tasarımı Üzerine Bir Rapor
- GitHub:YOLO
DAMO-YOLO hakkında daha fazla bilgi edinin
EfficientDet
Google Brain ekibi tarafından oluşturulan EfficientDet, bileşik bir ölçeklendirme yöntemi önererek nesne algılamada devrim yarattı. Bu yaklaşım, backbone, özellik ağı ve tahmin ağlarının çözünürlüğünü, derinliğini ve genişliğini eşit olarak ölçeklendirir. Kolay ve hızlı özellik füzyonu sağlayan BiFPN (Çift Yönlü Özellik Piramidi Ağı) özelliğine sahiptir.
VerimliDetaylar:
- Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
- Organizasyon:Google
- Tarih: 2019-11-20
- Arxiv:EfficientDet: Ölçeklenebilir ve Verimli Nesne Algılama
- GitHub:google
EfficientDet hakkında daha fazla bilgi edinin
Performans Analizi: Hız, Doğruluk ve Verimlilik
Aşağıdaki grafik ve tablo, EfficientDet ve YOLO modellerinin COCO veri kümesi üzerinde nicel bir karşılaştırmasını sunmaktadır. Bu kıyaslamalar, her mimarinin farklı optimizasyon hedeflerini vurgulamaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Temel Çıkarımlar
Verilerden, her model ailesi için farklı güçlü yönler gözlemleyebiliriz:
- GPU Gecikmesi: YOLO GPU çıkarım hızında baskındır. Örneğin,
DAMO-YOLOmbaşarır Ortalama Ortalama HassasiyetmAP) T4 GPU'da sadece 5,09 ms gecikme süresiyle 49,2 değerine ulaşmıştır. Buna karşılık,EfficientDet-d4benzer bir mAP 49,7 ile 33,55 ms ile önemli ölçüde daha yavaştır. - Parametre Verimliliği: EfficientDet parametreler açısından son derece hafiftir ve kayan nokta işlemleri (FLOPs).
EfficientDet-d0sadece 3,9 milyon parametre kullanır, bu da onu yüksek depolama verimliliğine sahip kılar, ancak bu, YOLO gibi mimari olarak optimize edilmiş modellere kıyasla modern GPU'larda her zaman daha hızlı çıkarım anlamına gelmez. - CPU Performansı: EfficientDet güvenilir CPU kıyaslamaları sunarak GPU hızlandırmanın kullanılamadığı eski donanımlar için uygun bir seçenek olmaya devam ettiğini göstermektedir.
Mimari Not
YOLO 'nun hız avantajı, Neural Architecture Search (NAS) kullanarak donanım gecikmesi için özel optimizasyonundan kaynaklanırken, EfficientDet teorik FLOP'lar için optimizasyon yapar ve bu da her zaman gerçek dünya gecikmesiyle doğrusal olarak ilişkili değildir.
Mimari Derinlemesine İnceleme
EfficientDet: Bileşik Ölçeklendirmenin Gücü
EfficientDet, mobil ters çevrilmiş darboğaz konvolüsyonlarını (MBConv) kullanan EfficientNet backbone üzerine inşa edilmiştir. Belirleyici özelliği, ağırlıklı çift yönlü bir özellik piramidi ağı olan BiFPN'dir. Özellikleri yalnızca yukarıdan aşağıya toplayan geleneksel FPN'lerin aksine BiFPN, her özellik katmanına öğrenilebilir ağırlıklar uygulayarak bilginin hem yukarıdan aşağıya hem de aşağıdan yukarıya akmasına izin verir. Bu, ağın farklı girdi özelliklerinin önemini anlamasını sağlar.
Model, ağ genişliğini, derinliğini ve çözünürlüğünü eşit olarak artıran bileşik bir katsayı olan phi kullanarak ölçeklenir, böylece daha büyük modeller (örneğin d7) doğruluk ve verimlilik arasında dengeli kalır.
YOLO: Hız Odaklı İnovasyon
YOLO , gerçek zamanlı gecikme süresine odaklanarak farklı bir yaklaşım benimser. Belirli gecikme kısıtlamaları altında en uygun backbone yapısını bulmak için MAE-NAS (Mimari Aramayı Otomatikleştirme Yöntemi) kullanır.
Temel yenilikler şunlardır:
- RepGFPN: Standart GFPN üzerinde, özellik birleştirme yollarını hız açısından optimize etmek için yeniden parametrelendirme ile geliştirilmiş bir iyileştirme.
- ZeroHead: Genellikle son tahmin katmanlarıyla ilişkili hesaplama yükünü azaltan basitleştirilmiş bir algılama kafası.
- AlignedOTA: Eğitim sırasında sınıflandırma ve regresyon görevleri arasındaki yanlış hizalamayı çözen bir etiket atama stratejisi.
Kullanım Alanları ve Uygulamalar
Mimari farklılıklar, her modelin gerçek dünya senaryolarında üstün olduğu noktaları belirler.
- EfficientDet, FLOP'ları en aza indirmenin çok önemli olduğu depolama kısıtlı ortamlar veya CPU çıkarımına dayanan uygulamalar için idealdir. Genellikle pil ömrünün (FLOP'larla ilişkili) birincil endişe kaynağı olduğu mobil uygulamalarda ve gömülü sistemlerde kullanılır.
- YOLO, GPU'larda gerçek zamanlı çıkarımın gerekli olduğu endüstriyel otomasyon, otonom sürüş ve güvenlik gözetiminde mükemmeldir. Düşük gecikme süresi, yüksek kare hızlı video akışlarının kareleri düşürmeden işlenmesini sağlar.
Ultralytics Avantajı
YOLO ve EfficientDet yetenekli modeller olsa da Ultralytics ekosistemi, modern yapay zeka gelişimi için daha kapsamlı bir çözüm sunuyor. Son teknoloji ürünü gibi modeller YOLO11 ve çok yönlü YOLOv8 kullanılabilirlik, performans ve özellik setinde önemli avantajlar sağlar.
YOLO11 hakkında daha fazla bilgi edinin
Neden Ultralytics'i Seçmelisiniz?
- Performans Dengesi: Ultralytics modelleri, hız ve doğruluk arasında en iyi dengeyi sağlayacak şekilde tasarlanmıştır. Örneğin YOLO11, hem CPU'larda hem de GPU'larda olağanüstü çıkarım hızlarını korurken önceki nesillere kıyasla üstün mAP sunar.
Kullanım Kolaylığı: "Piller dahil" felsefesiyle Ultralytics , basit bir Python API'si ve güçlü bir Komut Satırı Arayüzü (CLI) sağlar. Geliştiriciler kurulumdan eğitime dakikalar içinde geçebilirler.
from ultralytics import YOLO # Load a pre-trained YOLO11 model model = YOLO("yolo11n.pt") # Run inference on an image results = model("path/to/image.jpg")İyi Korunan Ekosistem: Yayınlandıktan sonra terk edilen birçok araştırma modelinin aksine, Ultralytics , GitHub sorunları ve tartışmaları aracılığıyla sık güncellemeler, hata düzeltmeleri ve topluluk desteği ile aktif bir depoyu korur.
- Çok yönlülük: Ultralytics modelleri sınırlayıcı kutularla sınırlı değildir. Tek bir birleşik çerçeve içinde örnek segmentasyonunu, poz tahminini, görüntü sınıflandırmasını ve yönlendirilmiş sınırlayıcı kutuları (OBB) yerel olarak desteklerler.
- Bellek Verimliliği: Ultralytics YOLO modelleri, eğitim sırasında bellek açısından verimli olacak şekilde tasarlanmıştır. Bu, genellikle önemli miktarda CUDA belleği gerektiren transformatör tabanlı modeller veya eski mimarilerle tezat oluşturarak Ultralytics modellerini tüketici sınıfı donanımlarda erişilebilir kılar.
- Eğitim Verimliliği: Çerçeve, otomatik karışık hassasiyet (AMP), çoklu GPU eğitimi ve önbelleğe alma gibi özellikleri destekleyerek özel veri kümelerinin eğitim inin hızlı ve uygun maliyetli olmasını sağlar.
Sonuç
Hem YOLO hem de EfficientDet bilgisayarla görme tarihinde önemli kilometre taşlarını temsil etmektedir. EfficientDet, ilkeli ölçeklendirme ve verimli özellik füzyonunun gücünü gösterirken, YOLO gecikmeye duyarlı mimari aramanın sınırlarını zorladı.
Ancak, yüksek performansı olağanüstü bir geliştirici deneyimi ile birleştiren üretime hazır bir çözüm arayan geliştiriciler için, Ultralytics YOLO11 önerilen seçimdir. Sağlam bir ekosisteme entegrasyonu, birden fazla bilgisayarla görme görevini desteklemesi ve sürekli iyileştirmeleri, onu görsel verileri eyleme dönüştürülebilir içgörülere dönüştürmek için en pratik araç haline getirmektedir.
Diğer Model Karşılaştırmalarını İnceleyin
Model seçim sürecinize daha fazla yardımcı olmak için Ultralytics belgelerindeki bu ilgili karşılaştırmaları keşfedin:
- YOLOv8 - DAMO-YOLO
- YOLO11 ve DAMO-YOLO
- RT-DETR - EfficientDet Karşılaştırması
- YOLOv10 vs. YOLO
- YOLOv9 vs. EfficientDet