EfficientDet - PP-YOLOE+ Karşılaştırması: Teknik Bir İnceleme
Bilgisayarla görmenin evriminde, tasarım felsefesindeki değişimi Google'ın EfficientDet 'i ile Baidu'nun PP-YOLOE+'sı arasındaki zıtlık kadar net bir şekilde vurgulayan çok az karşılaştırma vardır. EfficientDet bileşik ölçeklendirme yoluyla parametre verimliliğinde bir dönüm noktası oluştururken, PP-YOLOE+ GPU çıkarımı için optimize edilmiş yüksek hızlı, çapasız tespitin modern çağını temsil etmektedir.
Bu analiz, geliştiricilerin özel nesne algılama ihtiyaçları için doğru aracı seçmelerine yardımcı olmak için mimarilerini, performans ölçümlerini ve pratik uygulamalarını incelemektedir.
Karşılaştırmalı Performans Analizi
Bu iki modelin piyasaya sürülmesi arasında performans ortamı önemli ölçüde değişmiştir. EfficientDet, FLOP 'ları (kayan nokta işlemleri) ve parametre sayısını en aza indirmeye odaklanarak teorik olarak verimli hale getirir. Ancak PP-YOLOE+, TensorRT optimizasyonlarından yararlanarak GPU'lar gibi donanım hızlandırıcılarında pratik çıkarım hızı için tasarlanmıştır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Veriler kritik bir içgörüyü ortaya koymaktadır: EfficientDet-d0 hafifken, daha büyük varyantlar (d5-d7) önemli gecikmelerden muzdariptir. Tersine, PP-YOLOE+l, EfficientDet-d6 ile karşılaştırılabilir bir Ortalama Hassasiyet (mAP) elde eder (52,9'a karşı 52,6), ancak T4 GPU 'da 10 kattan fazla daha hızlı çalışır (8,36 ms'ye karşı 89,29 ms).
EfficientDet: Ölçeklenebilir Verimlilik
EfficientDet, Google Brain AutoML ekibi tarafından önceki dedektörlerin verimlilik kısıtlamalarını kırmak amacıyla tanıtıldı. EfficientNet üzerine inşa edilmiştir backboneçözünürlüğü, derinliği ve genişliği eşit olarak ölçeklendiren bir bileşik ölçeklendirme yöntemi uygulayarak.
Yazarlar Mingxing Tan, Ruoming Pang ve Quoc V. Le
Organizasyon:Google
Tarih: 2019-11-20
Arxiv:1911.09070
GitHub:google
Docs:README
Temel Mimari Özellikler
- BiFPN (Çift Yönlü Özellik Piramidi Ağı): Geleneksel FPN'lerin aksine, BiFPN kolay çok ölçekli özellik füzyonu sağlar. Farklı girdi özelliklerinin önemini öğrenmek için öğrenilebilir ağırlıklar sunar, yukarıdan aşağıya ve aşağıdan yukarıya çok ölçekli özellik füzyonunu tekrar tekrar uygular.
- Bileşik Ölçeklendirme: Tek bir bileşik katsayı $\phi$ ağ genişliğini, derinliğini ve çözünürlüğünü kontrol ederek farklı kaynak kısıtlamalarını hedefleyen bir model ailesine (D0 ila D7) izin verir.
Güçlü ve Zayıf Yönler
- Güçlü yönleri: Mükemmel parametre verimliliği; FLOP'ların birincil darboğaz olduğu düşük güçlü CPU'lar için etkili; son derece yapılandırılmış ölçeklendirme yaklaşımı.
- Zayıf yönler: BiFPN'deki karmaşık bağlantılar ve derinlemesine ayrılabilir konvolüsyonlar GPU'larda genellikle belleğe bağlıdır, bu da düşük FLOP sayılarına rağmen gerçek dünyada daha yavaş çıkarım gecikmesine yol açar.
Biliyor muydunuz?
EfficientDet'in derinlemesine ayrılabilir konvolüsyonları yoğun bir şekilde kullanması parametre sayısını önemli ölçüde azaltır ancak YOLO gibi modellerde kullanılan standart konvolüsyonlara kıyasla daha düşük GPU kullanımına yol açabilir.
EfficientDet hakkında daha fazla bilgi edinin
PP-YOLOE+: Çapasız Challenger
Baidu tarafından PaddlePaddle ekosisteminin bir parçası olarak piyasaya sürülen PP-YOLOE+, PP-YOLOv2'nin bir evrimidir. Tamamen çapasız bir mekanizma ve gelişmiş eğitim stratejileri benimseyerek YOLOv5 ve YOLOX'un performansını aşmayı amaçlamaktadır.
Yazarlar: PaddlePaddle Yazarlar
Organizasyon:Baidu
Tarih: 2022-04-02
Arxiv:2203.16250
GitHub:PaddlePaddle
Dokümanlar:PP-YOLOE+ Konfigürasyonları
Temel Mimari Özellikler
- Çapasız Tasarım: PP-YOLOE+, önceden tanımlanmış çapa kutularını ortadan kaldırarak algılama kafasını basitleştirir ve hiperparametre ayarlama yükünü azaltır.
- CSPRepResNet: backbone , eğitim sırasında artık bağlantıların faydalarını birleştiren ve bunları çıkarım için kolaylaştırılmış bir yapıda yeniden parametrelendiren RepResBlock'u kullanır.
- TAL (Görev Hizalama Öğrenimi): Sınıflandırma puanını ve yerelleştirme kalitesini dinamik olarak hizalayan gelişmiş bir etiket atama stratejisi.
Güçlü ve Zayıf Yönler
- Güçlü yönleri: COCO veri setinde son teknoloji doğruluk; TensorRT donanımda son derece hızlı; yenilikçi kafa tasarımı.
- Zayıf yönler: PyTorch üzerinde standartlaştırılmış ekipler için entegrasyon zorlukları oluşturabilecek PaddlePaddle çerçevesine büyük ölçüde bağlıdır; EfficientDet-d0 ile karşılaştırıldığında küçük modeller için biraz daha yüksek parametre sayısı.
Ultralytics Avantajı: Birleşik Bir Çözüm
EfficientDet teorik verimlilik ve PP-YOLOE+ ham hız sunarken, geliştiriciler genellikle performansı kullanılabilirlik ve ekosistem desteği ile dengeleyen bir çözüme ihtiyaç duyarlar. İşte burası Ultralytics YOLO11 mükemmel.
Karşılaştırma modellerinin özel yapısının aksine, Ultralytics modelleri modern MLOps iş akışı için tasarlanmıştır ve eğitilmesi ve dağıtılması zahmetsiz olan yerel bir PyTorch deneyimi sunar.
Neden Ultralytics YOLO11'i Seçmelisiniz?
- Kullanım Kolaylığı: Geliştirici deneyimine odaklanan Ultralytics , üç satır Python koduyla kurulumdan çıkarıma geçmenizi sağlar. Karmaşık operatör kütüphanelerini manuel olarak derlemeye veya tescilli formatları dönüştürmeye gerek yoktur.
- Çok yönlülük: Tek bir çerçeve Nesne Algılama, Örnek Segmentasyonu, Poz Tahmini, Sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutuları (OBB) destekler.
- Performans Dengesi: YOLO11 , hız ve doğruluk arasındaki dengeyi optimize ederek hem Edge cihazlarda (Jetson gibi) hem de bulut GPU'larda gerçek zamanlı çıkarım yetenekleri sağlar.
- Bellek Gereksinimleri: Ultralytics YOLO modelleri, transformatör tabanlı alternatiflere veya eski çok ölçekli özellik ağlarına kıyasla eğitim sırasında tipik olarak daha az CUDA belleği gerektiren optimize edilmiş mimariler kullanır.
- Bakımlı Ekosistem: Canlı bir açık kaynak topluluğu tarafından desteklenen depo, PyTorch, CUDA ve Python'un en son sürümleriyle uyumluluğu sağlamak için sık sık güncellemeler alır.
- Eğitim Verimliliği: Kullanıcılar, özel veri kümelerindeki modellere hızlı bir şekilde ince ayar yapmak için önceden eğitilmiş hazır ağırlıklardan yararlanarak eğitim verisi gereksinimlerini ve hesaplama maliyetlerini önemli ölçüde azaltabilir.
Kod Örneği: YOLO11 ile Başlarken
Son teknoloji ürünü bir modeli çalıştırmak karmaşık olmamalıdır. İşte Ultralytics kullanarak nesne algılamayı ne kadar kolay uygulayabileceğiniz:
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()
YOLO11 hakkında daha fazla bilgi edinin
Sonuç
EfficientDet ve PP-YOLOE+ arasındaki seçim büyük ölçüde donanım kısıtlamalarınıza ve eski gereksinimlerinize bağlıdır.
- EfficientDet, parametre-verimli ölçeklendirme araştırmaları için geçerli bir referans olmaya devam etmektedir ve bellek bant genişliğinin kısıtlı olduğu CPU belirli senaryolar için uygundur.
- PP-YOLOE+, yüksek performanslı GPU dağıtımı için üstün bir seçimdir ve PaddlePaddle ekosisteminde rahatça gezinebiliyorsanız önemli ölçüde daha iyi gecikme-doğruluk ödünleşimleri sunar.
Bununla birlikte, akıllı şehir analizlerinden tarımsal izlemeye kadar gerçek dünya uygulamalarının büyük çoğunluğu içinUltralytics YOLO11 en pragmatik seçim olarak öne çıkıyor. Modern çapasız dedektörlerin mimari yeniliklerini eşsiz bir kullanıcı deneyimi ile birleştirerek, çerçeve karmaşıklıklarında hata ayıklamak yerine iş sorunlarını çözmeye odaklanmanıza olanak tanır.
Diğer Modelleri Keşfedin
Daha fazlasını keşfetmek için bu ilgili karşılaştırmaları gözden geçirmeyi düşünün: