EfficientDet - DAMO-YOLO Karşılaştırması: Teknik Bir İnceleme
Nesne algılama alanında, geliştiriciler her biri benzersiz güçlü yönlere sahip çok çeşitli modellerle karşı karşıyadır. Bu sayfa, Google tarafından geliştirilen EfficientDet ve Alibaba Group tarafından geliştirilen DAMO-YOLO olmak üzere iki etkili mimari arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Her ikisi de güçlü tek aşamalı dedektörler olmasına rağmen, farklı tasarım felsefelerini izlerler. EfficientDet, sistematik ölçeklendirme yoluyla hesaplama ve parametre verimliliğine öncelik verirken, DAMO-YOLO, Nöral Mimari Arama (NAS) gibi modern teknikleri kullanarak hız-doğruluk dengesinin sınırlarını zorlar.
Bu karşılaştırma, bilgisayarlı görü projeniz için doğru modeli seçmenize yardımcı olmak amacıyla mimarilerini, performans metriklerini ve ideal kullanım durumlarını derinlemesine inceleyecektir.
EfficientDet: Ölçeklenebilir ve Verimli Nesne Algılama
EfficientDet, çeşitli hesaplama bütçeleri arasında verimli bir şekilde ölçeklenebilen bir nesne algılayıcı ailesi oluşturma hedefiyle Google Research tarafından tanıtıldı. Yüksek verimli EfficientNet backbone'u üzerine inşa edilmiş olup, çok ölçekli özellik kaynaştırması ve model ölçeklendirmesi için yeni bileşenler sunar.
EfficientDet hakkında daha fazla bilgi edinin
Teknik Detaylar
- Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
- Kuruluş: Google
- Tarih: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- Belgeler: https://github.com/google/automl/tree/master/efficientdet#readme
Mimari ve Temel Özellikler
- EfficientNet Backbone: EfficientDet, önceden eğitilmiş EfficientNet'i doğruluk ve verimliliğin güçlü bir dengesi için zaten optimize edilmiş olan backbone'u olarak kullanır.
- BiFPN (Çift Yönlü Özellik Piramidi Ağı): Standart bir FPN yerine, EfficientDet, daha verimli bir çok ölçekli özellik kaynaştırma katmanı olan BiFPN'yi sunar. BiFPN, ağırlıklı özellik kaynaştırması ve yukarıdan aşağıya/aşağıdan yukarıya bağlantıları dahil ederek farklı özellik haritası çözünürlükleri arasında kolay ve hızlı bilgi akışına olanak tanır.
- Bileşik Ölçekleme: EfficientDet'in temel yeniliği, bileşik ölçekleme yöntemidir. Tek bir bileşik katsayı kullanarak backbone, özellik ağı ve tahmin başlıkları için derinliği, genişliği ve çözünürlüğü ortaklaşa ölçeklendirir. Bu, ağın tüm bölümlerinde kaynakların dengeli bir şekilde tahsis edilmesini sağlayarak önemli verimlilik kazanımlarına yol açar.
- Ölçeklenebilir Aile: Bileşik ölçekleme yöntemi, geliştiricilerin mobil cihazlardan güçlü bulut sunucularına kadar donanım kısıtlamalarına mükemmel şekilde uyan bir model seçmelerini sağlayarak, tüm bir model ailesinin (EfficientDet-D0'dan D7'ye) oluşturulmasına olanak tanır.
Güçlü Yönler
- Yüksek Parametre ve FLOP Verimliliği: Model boyutunun ve hesaplama maliyetinin kritik kısıtlamalar olduğu senaryolarda mükemmeldir.
- Ölçeklenebilirlik: Doğruluk ve kaynak kullanımı arasında net bir denge sağlayan geniş bir model yelpazesi (D0-D7) sunar.
- Güçlü Doğruluk: Özellikle düşük parametre ve FLOP sayıları göz önüne alındığında rekabetçi doğruluk elde eder.
Zayıflıklar
- Daha Yavaş Çıkarım Hızı: FLOP'lar açısından verimli olmasına rağmen, GPU'lardaki ham çıkarım gecikmesi, DAMO-YOLO ve Ultralytics YOLO gibi daha yeni, yüksek düzeyde optimize edilmiş modellere göre daha yüksek olabilir.
- Karmaşıklık: BiFPN ve bileşik ölçeklendirme, etkili olmakla birlikte, mimariyi daha basit YOLO tasarımlarına kıyasla anlamayı ve değiştirmeyi daha karmaşık hale getirebilir.
İdeal Kullanım Senaryoları
EfficientDet, kaynak kısıtlamalarının birincil endişe olduğu uygulamalar için çok uygundur. Ölçeklenebilirliği, uç yapay zeka cihazları ve güç veya termal yönetim için hesaplama maliyetini en aza indirmenin esas olduğu sistemler dahil olmak üzere çeşitli donanımlarda dağıtım için çok yönlü bir seçimdir.
DAMO-YOLO: Hızlı ve Doğru Bir YOLO Varyantı
DAMO-YOLO, Alibaba Group'un YOLO serisi üzerine inşa edilmiş, ancak son teknoloji hız-doğruluk dengesi elde etmek için çeşitli son teknoloji teknikleri içeren yüksek performanslı bir nesne dedektörüdür. Ağın temel bileşenlerini belirli donanımlar için optimize etmek üzere Neural Architecture Search'ten (NAS) yararlanır.
DAMO-YOLO hakkında daha fazla bilgi edinin
Teknik Detaylar
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Kuruluş: Alibaba Group
- Tarih: 2022-11-23
- Arxiv: https://arxiv.org/abs/2211.15444v2
- GitHub: https://github.com/tinyvision/DAMO-YOLO
- Belgeler: https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md
Mimari ve Temel Özellikler
- NAS Destekli Backbone: DAMO-YOLO, otomatik olarak en uygun ağ yapısını bulan ve gelişmiş özellik çıkarma yeteneklerine yol açan Sinirsel Mimari Arama (NAS) tarafından oluşturulan bir backbone kullanır.
- Verimli RepGFPN Katmanı: Donanım açısından verimli ve çok ölçekli özellikleri kaynaştırmada etkili olacak şekilde tasarlanmış RepGFPN adlı yeni bir katman tasarımı sunar.
- ZeroHead: Model, mimari karmaşıklığı ve hesaplama yükünü performanstan ödün vermeden azaltan basitleştirilmiş bir "ZeroHead" kullanır; bu, birleşik bir başlık tasarımıdır.
- AlignedOTA Etiket Atama: DAMO-YOLO, sınıflandırma ve regresyon hedeflerini daha iyi hizalayarak eğitimi iyileştiren gelişmiş bir dinamik etiket atama stratejisi olan AlignedOTA'yı kullanır.
- Damıtma İyileştirmesi: Eğitim süreci, ailedeki daha küçük modellerin performansını daha da artırmak için bilgi damıtma ile geliştirilmiştir.
Güçlü Yönler
- Olağanüstü GPU Hızı: GPU donanımında son derece hızlı çıkarım hızları sunarak gerçek zamanlı çıkarım için idealdir.
- Yüksek Doğruluk: Sınıfındaki en iyi modellerle yarışan yüksek mAP puanları elde eder.
- Modern Tasarım: Nesne algılama araştırmasının ön saflarını temsil eden çeşitli gelişmiş teknikleri (NAS, gelişmiş etiket atama) içerir.
Zayıflıklar
- Sınırlı Çok Yönlülük: DAMO-YOLO, nesne tespiti için uzmanlaşmıştır ve örnek segmentasyonu veya poz tahmini gibi diğer görevler için yerel desteği yoktur.
- CPU Performansı: Orijinal araştırma ve depo öncelikle GPU performansına odaklanır ve CPU optimizasyonuna daha az önem verir.
- Ekosistem ve Kullanılabilirlik: Araştırma odaklı bir model olarak, tam olarak desteklenen Ultralytics gibi çerçevelere kıyasla entegre etmek ve dağıtmak için daha fazla mühendislik çabası gerekebilir.
İdeal Kullanım Senaryoları
DAMO-YOLO, GPU donanımında hem yüksek doğruluk hem de çok düşük gecikme süresi gerektiren uygulamalar için mükemmel bir seçimdir. Bu, hızlı karar vermenin kritik olduğu gerçek zamanlı video gözetimi, robotik ve otonom sistemler'i içerir.
Performans Analizi: Hız, Doğruluk ve Verimlilik
Aşağıdaki tablo, COCO veri kümesi üzerinde EfficientDet ve DAMO-YOLO modellerinin nicel bir karşılaştırmasını sunmaktadır. Sonuçlar, her modelin yaptığı farklı ödünleşimleri vurgulamaktadır.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Kıyaslamalardan şu sonuçları çıkarabiliriz:
- GPU Hızı: DAMO-YOLO, bir T4 GPU'da önemli ölçüde daha hızlıdır. Örneğin, DAMO-YOLOm 5.09 ms'lik bir gecikme süresiyle 49.2 mAP'ye ulaşırken, karşılaştırılabilir EfficientDet-d4, 33.55 ms'lik çok daha yüksek bir gecikme süresiyle 49.7 mAP'ye ulaşır.
- Parametre Verimliliği: EfficientDet, üstün parametre ve FLOP verimliliği gösterir. En küçük model olan EfficientDet-d0, yalnızca 3,9M parametre ve 2,54B FLOP kullanır.
- CPU Performansı: EfficientDet, net CPU kıyaslamaları sağlar ve bu da onu CPU tabanlı dağıtımlar için daha öngörülebilir bir seçim haline getirir. DAMO-YOLO için resmi CPU hızlarının olmaması, GPU olmayan donanımı hedefleyen geliştiriciler için önemli bir eksikliktir.
Ultralytics Avantajı: Performans ve Kullanılabilirlik
EfficientDet ve DAMO-YOLO'nun her ikisi de güçlü yetenekler sunarken, Ultralytics YOLO modelleri, YOLOv8 ve en son YOLO11 daha bütünsel ve geliştirici dostu bir çözüm sunar.
Ultralytics modellerini kullanmanın temel avantajları şunlardır:
- Kullanım Kolaylığı: Kolaylaştırılmış bir Python API'si, kapsamlı dokümantasyon ve basit CLI kullanımı, başlamayı, eğitmeyi ve modelleri dağıtmayı inanılmaz derecede kolaylaştırır.
- İyi Yönetilen Ekosistem: Ultralytics, aktif geliştirme, GitHub üzerinde güçlü topluluk desteği, sık güncellemeler ve MLOps için Ultralytics HUB ile sorunsuz entegrasyon ile sağlam bir ekosistem sunar.
- Performans Dengesi: Ultralytics modelleri, hem CPU hem de GPU donanımında hız ve doğruluk arasında mükemmel bir denge için yüksek düzeyde optimize edilmiştir, bu da onları çok çeşitli dağıtım senaryoları için uygun hale getirir.
- Çok Yönlülük: YOLOv8 ve YOLO11 gibi modeller çoklu görevlidir ve tek, birleşik bir çerçeve içinde nesne tespiti, segmentasyon, sınıflandırma, poz tahmini ve yönlendirilmiş sınırlayıcı kutuları (OBB) destekler.
- Eğitim Verimliliği: Hızlı eğitim sürelerinden, daha düşük bellek gereksinimlerinden ve kolayca erişilebilen önceden eğitilmiş ağırlıklardan yararlanın.
Sonuç
Hem EfficientDet hem de DAMO-YOLO, ilgi çekici nesne algılama modelleridir. EfficientDet, olağanüstü parametre ve FLOP verimliliği ile öne çıkar ve çeşitli donanım profillerine uygun ölçeklenebilir bir model ailesi sunar. DAMO-YOLO, modern mimari yeniliklerden yararlanarak çok hızlı GPU çıkarım hızlarında yüksek doğruluk sağlamada mükemmeldir.
Ancak, yüksek performans, kullanım kolaylığı ve sağlam, çok yönlü bir ekosistemin bir karışımını arayan geliştiriciler ve araştırmacılar için, YOLOv8 ve YOLO11 gibi Ultralytics YOLO modelleri genellikle en güçlü genel değer önerisini sunar. Hız, doğruluk, çoklu görev desteği ve geliştirici merkezli çerçevelerinin dengesi, onları çok çeşitli gerçek dünya uygulamaları için şiddetle tavsiye edilen bir seçim haline getirir.
Diğer Model Karşılaştırmalarını İnceleyin
Daha fazla bilgi için, bu modellerin diğer son teknoloji mimarilerle nasıl karşılaştırıldığını inceleyin:
- RT-DETR - DAMO-YOLO Karşılaştırması
- YOLOv9 - DAMO-YOLO Karşılaştırması
- YOLOX - EfficientDet Karşılaştırması
- YOLOv8 - EfficientDet