PP-YOLOE+ ve EfficientDet: Nesne Algılama Mimarilerine Derinlemesine Bir Bakış
Nesne algılama modellerinin dünyasında yolunu bulmak, genellikle yerleşik eski mimariler ile daha yeni, optimize edilmiş çerçeveler arasında seçim yapmayı gerektirir. Bu karşılaştırma, Baidu'nun rafine edilmiş ankarsız algılayıcısı PP-YOLOE+ ile Google bileşik ölçeklendirmeyi getiren ölçeklenebilir mimarisi EfficientDet arasındaki teknik farklılıkları incelemektedir. Her ikisi de bilgisayar görüşüne önemli katkılar sağlamış olsa da, verimlilik ve doğruluk konusundaki yaklaşımları önemli ölçüde farklılık göstermektedir.
Performans Analizi ve Karşılaştırmalı Değerlendirme
Çıkarım hızı ile algılama doğruluğu arasındaki denge — genellikle Ortalama Hassasiyet (mAP)ile ölçülür — bu modelleri değerlendirmek için birincil ölçüttür.
Aşağıdaki tablo, PP-YOLOE+'nın TensorRT tasarımı sayesinde GPU genellikle daha üstün gecikme süresi sunduğunu, EfficientDet'in ise parametre açısından verimli olmasına rağmen karmaşık özellik piramidi bağlantıları nedeniyle genellikle daha yüksek gecikme süresine maruz kaldığını göstermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Mimari ve Tasarım Felsefesi
Bu iki model arasındaki temel fark, özellik birleştirme ve ölçeklendirme işlemlerini nasıl gerçekleştirdiklerinde yatmaktadır.
EfficientDet: Bileşik Ölçeklendirme ve BiFPN
Google ekibi tarafından geliştirilen EfficientDet, ağın çözünürlüğünü, derinliğini ve genişliğini eşit şekilde ölçeklendiren bileşik ölçeklendirme kavramını ortaya attı.
- Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
- Kuruluş:Google Research
- Tarih: 2019-11-20
- Arxiv:EfficientDet: Ölçeklenebilir ve Verimli Nesne Algılama
EfficientDet'in belirleyici özelliği BiFPN (Ağırlıklı Çift Yönlü Özellik Piramit Ağı)dır. Standart FPN'den farklı olarak, BiFPN yukarıdan aşağıya ve aşağıdan yukarıya çok ölçekli özellik füzyonuna izin verir. Bu, yüksek parametre verimliliği (düşük FLOP'lar) ile sonuçlansa da, BiFPN'nin düzensiz bellek erişim modelleri GPU'larda çıkarımları önemli ölçüde yavaşlatabilir ve teorik verimliliğine rağmen gerçek zamanlı uygulamalar için daha az ideal hale getirebilir.
PP-YOLOE+: Gelişmiş Anchor'suz Detect
PP-YOLOE+, Baidu ekibi tarafından özellikle PaddlePaddle çalışmak üzere tasarlanan PP-YOLOE mimarisinin bir evrimidir.
- Yazarlar: PaddlePaddle Yazarları
- Kuruluş:Baidu
- Tarih: 2022-04-02
- Arxiv:PP-YOLOE: YOLO'nun Gelişmiş Bir Versiyonu
Bu model, önceden tanımlanmış bağlantı kutularına olan ihtiyacı ortadan kaldıran bağlantısız bir paradigma kullanır. Sınıflandırma ve yerelleştirmeyi daha iyi uyumlu hale getirmek için CSPRepResStage backbone Görev Hizalama Öğrenimi (TAL) stratejisini kullanır. "+" versiyonu, özellikle küçültülmüş bir backbone genişlik çarpanı 0,75) ve geliştirilmiş eğitim stratejileri sunarak, düşük parametre rejiminde daha rekabetçi hale getirir.
Mimari Evrim
PP-YOLOE+, karmaşık eğitim zamanı yapılarının daha basit çıkarım zamanı bloklarına indirgendiği "yeniden parametrelendirilmiş" mimarilere doğru bir geçişi temsil eder. Bu, EfficientDet'in statik grafik karmaşıklığıyla tezat oluşturur ve NVIDIA TensorRT gibi donanımlarda daha iyi dağıtım hızları sunar.
Eğitim Metodolojileri ve Ekosistem
Çerçeve seçimi genellikle geliştirme kolaylığını belirler.
- PP-YOLOE+, PaddlePaddle ekosistemiyle derin bir şekilde bağlantılıdır. Güçlü olmasına rağmen, bu ekosistem dışındaki kullanıcılar, standart MLOps araçlarıyla entegrasyon veya yerel olmayan dağıtım hedefleri için modelleri dönüştürme sırasında sorunlarla karşılaşabilirler.
- EfficientDet, TensorFlow (özellikle AutoML kütüphanesi) kullanır. Yaygın olarak desteklenmesine rağmen, bu depo modern YOLO kıyasla daha az sıklıkta güncellenmektedir ve sonuçları yeniden üretmek bazen eski bağımlılık zincirlerini incelemek gerektirebilir.
Buna karşılık, Kullanım Kolaylığı ve İyi Bakımlı Ekosistemi önceliklendiren geliştiriciler genellikle Ultralytics tercih ederler. Ultralytics , PyTorch üzerinde sorunsuz eğitim imkanı sunarak, aşağıdaki gibi araçlarla sağlam entegrasyonlar sağlar Weights & Biases gibi araçlarla sağlam entegrasyonlar ve model dağıtımı için net yollar sağlar.
İdeal Kullanım Senaryoları
Ne Zaman EfficientDet Seçmeli
EfficientDet, gecikme süresinden ziyade parametre verimliliğinin katı bir kısıtlama olduğu akademik araştırmalar için uygun bir seçenek olmaya devam etmektedir. Ayrıca, belirli donanım hızlandırıcılarının MobileNet tarzı bloklar için optimize edildiği eski mobil uygulamalarda (2020 civarı) da kullanılmaktadır.
Ne Zaman PP-YOLOE+ Seçmeli
PP-YOLOE+, endüstriyel kalite kontrolü veya sunucu tarafı video işleme gibi GPU kritik olduğu ortamlarda üstün performans gösterir. Ankarsız kafası, eski ankarsız yöntemlere kıyasla hiperparametre arama alanını basitleştirir.
Ultralytics Ne Zaman Seçmelisiniz?
Mühendislik maliyetini en aza indirirken hız ve doğruluk arasında performans dengesi arayan geliştiriciler için, Ultralytics gibi YOLO11 ve yeni YOLO26 gibi Ultralytics modelleri önerilir. Bu modeller, transformatör tabanlı dedektörlere kıyasla eğitim sırasında daha düşük bellek gereksinimleri sunar ve poz tahmini ve segmentasyon gibi görevleri destekleyen kapsamlı çok yönlülüksağlar.
Ek olarak, Ultralytics Eğitim Verimliliği, hazır önceden eğitilmiş ağırlıklar ve karmaşık kalıplaşmış kodları soyutlayan basit bir API ile artırılmıştır.
from ultralytics import YOLO
# Load the recommended YOLO26 model
model = YOLO("yolo26n.pt")
# Perform inference on an image
results = model("path/to/image.jpg")
YOLO26 hakkında daha fazla bilgi edinin
Modern Standart: Ultralytics
PP-YOLOE+ ve EfficientDet önemli kilometre taşları olsa da, bu alan daha da ilerlemiştir. 2026 yılında piyasaya sürülen Ultralytics , önceki mimarilerin sınırlamalarını ortadan kaldıran çığır açan özellikler sunmaktadır.
Uçtan Uca NMS'siz Tasarım
Non-Maximum Suppression (NMS) son işlem gerektiren EfficientDet ve çoğu YOLO farklı olarak, YOLO26 doğal olarak uçtan uca çalışır. YOLOv10 ilk kez kullanılan bu tasarım, NMS ile ilişkili gecikme ve karmaşıklığı ortadan kaldırarak, uç AI için gerekli olan daha hızlı ve deterministik çıkarım hızlarını garanti eder.
Edge ve CPU için optimize edilmiştir
YOLO26, yaygın kullanım için tasarlanmıştır. ONNX CoreML gibi dışa aktarım formatları için model grafiğini basitleştiren DFL (Dağıtım Odak Kaybı) Kaldırma özelliğine sahiptir. CPU %43'e kadar hızlandıran optimizasyonlarla birleştiğinde, Raspberry Pi'lerden cep telefonlarına kadar çeşitli cihazlar için en iyi seçimdir.
MuSGD ve ProgLoss ile İleri Düzey Eğitim
Büyük Dil Modeli (LLM) eğitiminden yenilikleri ödünç alan YOLO26, SGD Muon'un bir karışımı olan MuSGD Optimizer'ıkullanır. Bu, daha istikrarlı bir eğitim dinamiği ve daha hızlı yakınsama sağlar. Ayrıca, ProgLoss ve STAL (Soft Task Alignment Learning) özelliklerinin eklenmesi, EfficientDet-d0 gibi önceki dedektörlerde yaygın bir zayıf nokta olan küçük nesne algılamayı önemli ölçüde iyileştirir.
Görev Özgüllüğü
YOLO26 sadece sınırlayıcı kutular için değildir. Yüksek doğrulukta poz tahmini için Artık Log-Olasılık Tahmini (RLE) ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) görevleri için özel açı kaybı gibi göreve özel iyileştirmeler içerir ve hava görüntülerinde döndürülmüş nesnelerin hassas bir şekilde algılanmasını sağlar.
Sonuç
Hem PP-YOLOE+ hem de EfficientDet, donanım ve çerçeve tercihlerinin belirli kısıtlamalarına bağlı olarak benzersiz avantajlar sunar. EfficientDet, bileşik ölçeklendirmenin güçlü bir teorik kavram olduğunu kanıtlarken, PP-YOLOE+ GPU'larda ankrajsız, yeniden parametrelendirilmiş mimarilerin pratik hız avantajlarını gösterir.
Ancak, en son teknolojiye sahip doğruluk, kolay kurulum ve gelişen bir topluluk özelliklerini bir araya getiren bütünsel bir çözüm için Ultralytics en iyi seçenek olarak öne çıkıyor. Uçtan uca NMS mimarisi ve Ultralytics için yerel desteği ile geliştiricilerin konseptten üretime eşsiz bir verimlilikle geçmelerini sağlıyor.
Diğer yüksek performanslı seçenekleri keşfetmek için, aşağıdaki belgeleri gözden geçirmeyi düşünün YOLO11 veya YOLOv10belgelerini gözden geçirmeyi düşünün.