PP-YOLOE+ - EfficientDet karşılaştırması: Nesne Algılama için Teknik Bir Karşılaştırma
Optimal nesne algılama modelini seçmek, bilgisayar görüşü uygulamaları için çok önemlidir. Bu sayfa, proje gereksinimlerinize göre bilinçli bir karar vermenize yardımcı olmak için önemli iki model olan PP-YOLOE+ ve EfficientDet arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Mimari tasarımlarını, performans kıyaslamalarını ve uygulama uygunluklarını inceleyeceğiz. Her iki model de önemli katkılarda bulunmuş olsa da, verimli nesne dedektörlerinin evriminde farklı aşamaları temsil etmektedirler.
PP-YOLOE+: Verimlilik ve Doğruluk için Optimize Edildi
PP-YOLOE+, Baidu'daki PaddlePaddle Yazarları tarafından geliştirilen ve 2 Nisan 2022'de yayınlanan, PP-YOLOE serisinin geliştirilmiş bir versiyonudur. Özellikle PaddlePaddle ekosistemi içinde yüksek doğruluk ve verimli dağıtım sağlamaya odaklanır. Nesne algılama görevlerinde üstün bir performans ve hız dengesi için tasarlanmış anchor-free, tek aşamalı bir dedektör olarak öne çıkar.
- Yazarlar: PaddlePaddle Yazarları
- Kuruluş: Baidu
- Tarih: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- Belgeler: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
Mimari ve Temel Özellikler
PP-YOLOE+, önceden tanımlanmış ankraj kutularına olan ihtiyacı ortadan kaldırarak model yapısını ve eğitim sürecini basitleştiren ankrajsız bir yaklaşım benimser. Mimarisi, genel doğruluğu artıran sınıflandırma ve yerelleştirme görevlerini ayıran ayrıştırılmış bir algılama head'ine sahiptir. Model, sınıflandırma ve sınırlayıcı kutu hassasiyetini daha da iyileştirmek için pozitif ve negatif örnekler arasındaki dengesizliği daha iyi ele almak üzere özel bir kayıp fonksiyonu olan VariFocal Loss'u kullanır. Mimari, hem doğruluğu hem de çıkarım hızını artırmak için backbone, Yol Toplama Ağı (PAN) içeren neck ve head'de iyileştirmeler içerir.
Güçlü ve Zayıf Yönler
- Güçlü Yönleri: Parametre sayısı için yüksek doğruluk, anchor-free (bağlantısız) tasarım uygulamayı basitleştirir ve PaddlePaddle çerçevesinde iyi desteklenir. Model, TensorRT ile optimize edildiğinde mükemmel GPU çıkarım hızları gösterir.
- Zayıflıklar: Öncelikle PaddlePaddle ekosistemi için optimize edilmiştir, bu da PyTorch gibi diğer popüler çerçevelerin kullanıcıları için esnekliği sınırlayabilir. Topluluk desteği ve mevcut kaynakları, Ultralytics YOLO serisi gibi küresel olarak benimsenen modeller için olanlardan daha az kapsamlı olabilir.
Kullanım Alanları
Dengeli performansı ve modern anchor içermeyen tasarımı, PP-YOLOE+'yı çeşitli uygulamalar için çok yönlü bir seçim haline getirir. Endüstriyel kalite kontrolü, geri dönüşüm otomasyonu ve akıllı perakende operasyonlarını geliştirme gibi görevler için çok uygundur.
PP-YOLOE+ hakkında daha fazla bilgi edinin
EfficientDet: Ölçeklenebilir ve Verimli Mimari
EfficientDet, Google Brain ekibi tarafından Kasım 2019'da tanıtıldı. Uç cihazlardan büyük bulut sunucularına kadar ölçeklenebilen bir model ailesi sunarak nesne tespitinde yeni bir verimlilik standardı belirledi. Temel yenilikleri, yüksek verimli ve ölçeklenebilir bir mimari oluşturmaya odaklanmıştır.
- Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
- Kuruluş: Google
- Tarih: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- Belgeler: https://github.com/google/automl/tree/master/efficientdet
Mimari ve Temel Özellikler
EfficientDet'in mimarisi üç temel fikir üzerine kurulmuştur:
- EfficientNet Backbone: Doğruluk ve FLOP'lar için optimize etmek üzere bir sinirsel mimari araması kullanılarak tasarlanan özellik çıkarımı için son derece verimli EfficientNet'i backbone olarak kullanır.
- BiFPN (Çift Yönlü Özellik Piramidi Ağı): Standart bir FPN yerine, EfficientDet, daha verimli bir çok ölçekli özellik kaynaştırma yöntemi olan BiFPN'yi sunar. Ağırlıklı bağlantılarla farklı özellik seviyeleri arasında kolay ve hızlı bilgi akışına olanak tanır.
- Bileşik Ölçeklendirme: Basit bir bileşik katsayı kullanarak backbone, özellik ağı ve algılama head'i için derinliği, genişliği ve çözünürlüğü düzgün bir şekilde ölçeklendiren yeni bir ölçeklendirme yöntemi. Bu, modelin küçük D0'dan büyük D7 varyantına prensipli ve etkili bir şekilde ölçeklenmesini sağlar.
Performans Analizi
Aşağıdaki tablo, ayrıntılı bir performans karşılaştırması sunmaktadır. EfficientDet piyasaya sürüldüğünde son teknoloji ürünü olmasına rağmen, kıyaslamalar PP-YOLOE+ gibi daha yeni modellerin, özellikle GPU üzerindeki çıkarım hızı açısından önemli ölçüde daha iyi performans sunduğunu göstermektedir. Örneğin, PP-YOLOE+l, EfficientDet-d5'ten (51.5) daha yüksek bir mAP'ye (52.9) ulaşır, ancak TensorRT ile bir T4 GPU'da 8 kattan daha hızlıdır. Bu, model mimarisi ve optimizasyon tekniklerindeki hızlı gelişmeleri vurgulamaktadır.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Güçlü ve Zayıf Yönler
- Güçlü Yönleri: BiFPN ve bileşik ölçeklendirme ile çığır açan mimari, sonraki birçok modeli etkilemiştir. Çok çeşitli hesaplama bütçeleri arasında yüksek düzeyde ölçeklenebilir.
- Zayıflıklar: Modern mimarilere kıyasla daha yavaş çıkarım hızları. Anchor tabanlı tasarım, anchor içermeyen alternatiflerden daha karmaşıktır. Orijinal uygulama TensorFlow'dadır, bu da PyTorch ağırlıklı araştırma topluluğu için bir engel olabilir.
Kullanım Alanları
EfficientDet, modelin ölçeklenebilirliğinin önemli olduğu ve aşırı gerçek zamanlı performansın birincil kısıtlama olmadığı uygulamalar için hala uygulanabilir bir seçenektir. Görüntülerin çevrimdışı toplu işlenmesi, bulut tabanlı görüntü işleme API'leri ve daha küçük varyantlarının (D0-D2) iyi bir doğruluk-kaynak dengesi sağlayabileceği belirli uç yapay zeka senaryoları için kullanılabilir.
EfficientDet hakkında daha fazla bilgi edinin
Sonuç: Hangi Modeli Seçmelisiniz?
Hem PP-YOLOE+ hem de EfficientDet güçlü modellerdir, ancak farklı ihtiyaçlara hitap ederler ve nesne algılama araştırmasının zaman çizelgesinde farklı noktaları temsil ederler.
- PP-YOLOE+, PaddlePaddle ekosistemi içinde çalışıyorsanız ve modern, hızlı ve doğru bir anchor-free dedektöre ihtiyacınız varsa güçlü bir seçimdir.
- EfficientDet, mimari yenilikleri nedeniyle hala önemli bir modeldir. Ancak, yeni projeler için performansı büyük ölçüde daha yeni modeller tarafından aşılmıştır.
Performans, çok yönlülük ve kullanım kolaylığının en iyi kombinasyonunu arayan geliştiriciler ve araştırmacılar için, Ultralytics YOLO serisini göz önünde bulundurmanızı öneririz. YOLOv8 ve en son YOLO11 gibi modeller çeşitli önemli avantajlar sunar:
- Performans Dengesi: Ultralytics YOLO modelleri, hız ve doğruluk arasında en son teknolojiyi sunan bir denge sağlar ve bu da onları hem gerçek zamanlı uç dağıtımı hem de yüksek doğruluklu bulut uygulamaları için uygun hale getirir.
- Çok Yönlülük: Bunlar, yalnızca nesne algılamayı değil, aynı zamanda örnek segmentasyonunu, poz tahminini, sınıflandırmayı ve daha fazlasını tek ve birleşik bir çerçeve içinde destekleyen çok görevli modellerdir.
- Kullanım Kolaylığı: Modeller, basit bir Python API'si ve CLI, kapsamlı belgeler ve anlaşılır bir eğitim süreci ile birlikte gelir.
- İyi Yönetilen Ekosistem: Ultralytics, aktif geliştirme, güçlü topluluk desteği ve veri kümesi yönetiminden dağıtıma kadar MLOps'u kolaylaştırmak için Ultralytics HUB gibi araçlarla sorunsuz entegrasyon sağlayan sağlam bir ekosistem sunar.
- Eğitim Verimliliği: Ultralytics YOLO modelleri, verimli eğitimleriyle bilinir; birçok alternatife kıyasla daha az bellek ve zaman gerektirir ve özel projeleri hızlandırmak için çok çeşitli önceden eğitilmiş ağırlıklarla birlikte gelir.
Daha ayrıntılı karşılaştırmalar için, bu modellerin YOLO11 - EfficientDet veya PP-YOLOE+ - YOLOv10 gibi diğer popüler mimarilere karşı nasıl performans gösterdiğini incelemek isteyebilirsiniz.