YOLOv7 vs. EfficientDet: Gerçek Zamanlı Nesne Algılama Mimarilerinin Teknik Karşılaştırması
Nesne algılama, otonom sürüşten tıbbi görüntülemeye kadar çeşitli alanlardaki yenilikleri yönlendiren bilgisayarla görmenin temel taşı olmaya devam ediyor. Doğru mimariyi seçmek doğruluk, hız ve hesaplama kaynaklarını dengelemek için kritik öneme sahiptir. Bu analiz, aşağıdakilere derinlemesine bir bakış sağlar YOLOv7 ve EfficientDet, gerçek zamanlı algılama ortamını şekillendiren iki etkili model.
Mimari Tasarım ve Felsefe
Bu iki mimari arasındaki temel fark optimizasyon hedeflerinde yatmaktadır. Google Brain ekibi tarafından geliştirilen EfficientDet, parametre verimliliğine ve kayan nokta işlemlerine (FLOP) öncelik verir. Kullanıcıların doğruluk için kaynakları doğrusal olarak takas etmelerine olanak tanıyan ölçeklenebilir bir mimariden yararlanır. Tam tersine, YOLOv7YOLOv4'ün (Chien-Yao Wang ve ark.) yazarları tarafından oluşturulan YOLOv4, son teknoloji doğruluğu korurken GPU donanımında çıkarım hızını en üst düzeye çıkarmaya odaklanmaktadır.
EfficientDet: Bileşik Ölçeklendirme ve BiFPN
EfficientDet, ağ çözünürlüğünü, derinliğini ve genişliğini eşit şekilde ölçeklendirmek için bileşik bir ölçeklendirme yöntemi kullanan EfficientNet backbone üzerine inşa edilmiştir. EfficientDet'teki önemli bir yenilik de Çift Yönlü Özellik Piramidi Ağı'dır (BiFPN). Geleneksel FPN'lerin aksine BiFPN, farklı girdi özelliklerinin önemini öğrenmek için öğrenilebilir ağırlıklar sunarak kolay ve hızlı çok ölçekli özellik füzyonuna olanak tanır. Bu tasarım, EfficientDet'i bellek ve FLOP'ların kesinlikle sınırlı olduğu uç bilişim uygulamaları için oldukça etkili hale getirir.
EfficientDet hakkında daha fazla bilgi edinin
YOLOv7: E-ELAN ve Model Yeniden Parametrelendirme
YOLOv7 , Genişletilmiş Verimli Katman Toplama Ağını (E-ELAN) tanıtmaktadır. Bu mimari, orijinal gradyan yolunu yok etmeden ağın öğrenme yeteneğini geliştirmek için en kısa ve en uzun gradyan yollarını kontrol eder. Ayrıca YOLOv7 , karmaşık bir eğitim yapısının basitleştirilmiş bir çıkarım yapısına dönüştürüldüğü bir teknik olan model yeniden parametrelendirmeyi kullanır. Bu, eğitim sırasında sağlam ancak GPU'larda dağıtım sırasında son derece hızlı bir modelle sonuçlanır.
YOLOv7 hakkında daha fazla bilgi edinin
Performans Analizi: Metrikler ve Kıyaslamalar
Performansı karşılaştırırken, seçim genellikle dağıtım donanımına bağlıdır. EfficientDet düşük güçlü ortamlarda (CPU'lar) parlarken, YOLOv7 yüksek verimli GPU çıkarımı için tasarlanmıştır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Temel Çıkarımlar
- Gecikme ve Verimlilik: EfficientDet-d0 önemli ölçüde daha az parametre (3,9 milyon) kullanırken, YOLOv7l GPU'larda son derece düşük gecikme süresiyle (6,84 ms) çok daha yüksek bir mAP (%51,4) sunar. Bu, YOLOv7'nin paralel işlem gücünü üstün bir şekilde kullandığını göstermektedir.
- Ölçeklenebilirlik: EfficientDet, d0'dan d7'ye kadar granüler bir ölçeklendirme yolu sağlayarak geliştiricilerin belirli CPU kısıtlamaları için model boyutuna ince ayar yapmasına olanak tanır.
- Üst Düzey Doğruluk: Üst uçta, EfficientDet-d7 mükemmel doğruluk (%53,7 mAP) elde eder, ancak yüksek gecikme süresi (~128ms) pahasına. YOLOv7x, T4 GPU'da çıkarım süresinin (11,57 ms) onda birinden daha kısa sürede karşılaştırılabilir doğruluk (%53,1 mAP) elde eder.
Donanımla İlgili Hususlar
Dağıtım hedefiniz genel bir CPU veya mobil işlemci ise, EfficientDet modellerinin (özellikle d0-d2) daha düşük FLOP'ları genellikle daha iyi pil ömrü ve termal yönetim sağlar. Uç GPU'lar ( NVIDIA Jetson gibi) veya bulut çıkarım sunucuları için, YOLOv7 gerçek zamanlı video analizi için önemli ölçüde daha yüksek kare hızları sunar.
Eğitim Metodolojileri ve Optimizasyon
Bu modeller için eğitim stratejileri mimari hedeflerini yansıtmaktadır.
YOLOv7 eğitim maliyetini artıran ancak çıkarım hızını etkilemeden doğruluğu artıran yöntemleri içeren bir "Bag-of-Freebies" yaklaşımı kullanır. Temel teknikler şunları içerir:
- Kaba-İnce Derin Denetim: Ağın orta katmanlarını denetlemek için bir yardımcı kafa kullanılır ve etiket atama stratejileri yardımcı kafayı lider kafadan farklı şekilde yönlendirir.
- Dinamik Etiket Ataması: Model, eğitim sırasında temel gerçek nesnelerinin çapalara atanmasını uyarlayarak yakınsamayı iyileştirir.
EfficientDet, optimum backbone ve özellik ağı mimarisini bulmak için büyük ölçüde AutoML 'ye dayanır. Eğitimi tipik olarak şunları içerir:
- Stokastik Derinlik: Genellemeyi iyileştirmek için eğitim sırasında katmanları rastgele düşürme.
- Swish Aktivasyonu: Daha derin ağlarda ReLU'dan sürekli olarak daha iyi performans gösteren yumuşak, monotonik olmayan bir fonksiyon.
Ultralytics Avantajı
Hem YOLOv7 hem de EfficientDet güçlü olsa da, bilgisayarla görme alanı hızla gelişmektedir. Ultralytics ekosistemi aşağıdaki gibi modern alternatifler sunar YOLO11 önceki mimarilerin en iyi özelliklerini sentezlerken geliştirici deneyimini de geliştiriyor.
Kullanım Kolaylığı ve Ekosistem
Araştırma odaklı depolarda (orijinal EfficientDet kod tabanı gibi) karşılaşılan temel zorluklardan biri entegrasyonun karmaşıklığıdır. Ultralytics bunu birleşik bir Python paketi ile çözer. Geliştiriciler, kapsamlı belgeler ve aktif topluluk desteği ile desteklenen modelleri yalnızca birkaç satır kodla eğitebilir, doğrulayabilir ve dağıtabilir.
Çok Yönlülük ve Performans Dengesi
Ultralytics modelleri sınırlayıcı kutularla sınırlı değildir. Örnek segmentasyonunu, poz tahminini, sınıflandırmayı ve Yönlendirilmiş Nesne Algılamayı (OBB) yerel olarak desteklerler. Performans açısından, modern YOLO sürümleri ( YOLOv8 ve YOLO11 gibi) genellikle parametre başına EfficientDet'ten daha yüksek doğruluk ve YOLOv7'den daha hızlı çıkarım elde ederek gerçek dünya dağıtımı için ideal bir denge sağlar.
Hafıza ve Eğitim Verimliliği
Ultralytics YOLO modelleri bellek verimliliği ile ünlüdür. Transformer tabanlı dedektörlere veya eski ölçeklenebilir mimarilere kıyasla eğitim sırasında genellikle daha az CUDA belleğine ihtiyaç duyarlar. Bu, araştırmacıların tüketici sınıfı donanımlarda son teknoloji modelleri eğitmelerine olanak tanır. Ayrıca, anında indirilebilen yüksek kaliteli önceden eğitilmiş ağırlıklarla transfer öğrenimi kolaylaştırılmıştır.
from ultralytics import YOLO
# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference with high speed
predictions = model("https://ultralytics.com/images/bus.jpg")
Model Özellikleri
YOLOv7
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
- Çıkış Tarihi 6 Temmuz 2022
- Makale:YOLOv7: Eğitilebilir bedava çanta, gerçek zamanlı nesne dedektörleri için yeni bir çığır açıyor
- KaynakGitHub Deposu
EfficientDet
- Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
- Organizasyon: Google Araştırma, Beyin Ekibi
- Çıkış Tarihi Kasım 20, 2019
- Kağıt:EfficientDet: Ölçeklenebilir ve Verimli Nesne Algılama
- KaynakGitHub Deposu
Gerçek Dünya Kullanım Durumları
EfficientDet Ne Zaman Seçilmeli
EfficientDet, GPU hızlandırmasının kullanılamadığı gömülü sistemler için güçlü bir aday olmaya devam etmektedir.
- Mobil Uygulamalar: CPU üzerinde nesne algılama gerçekleştiren iOS uygulamaları.
- Uzak IoT Sensörleri: Her miliwatt hesaplamanın önemli olduğu çevresel değişiklikleri izleyen pille çalışan cihazlar.
YOLOv7 Ne Zaman Seçilmeli
YOLOv7 , yüksek performanslı endüstriyel ortamlarda üstünlük sağlar.
- Otonom Sürüş: Güvenliği sağlamak için yayaları ve araçları yüksek kare hızlarında algılama.
- Akıllı Şehirler: Uç sunucularda trafik yönetimi için aynı anda birden fazla video akışını analiz etme.
Sonuç
Her iki mimari de bilgisayarla görme alanında önemli kilometre taşlarını temsil etmektedir. EfficientDet, parametre verimliliği için bileşik ölçeklendirmenin gücünü gösterirken YOLOv7GPU gecikme optimizasyonu ile mümkün olanın sınırlarını zorladı.
Bununla birlikte, en modern, sürdürülebilir ve çok yönlü çözümü arayan geliştiriciler için Ultralytics YOLO11 model ailesi tavsiye edilir. Üstün doğruluk-hız dengeleri, daha basit bir iş akışı ve veri kümesi küratörlüğünden dağıtıma kadar olan yolculuğu basitleştiren sağlam bir ekosistem sunar.
Diğer Modelleri İnceleyin
Diğer nesne algılama mimarilerini karşılaştırmakla ilgileniyorsanız, bu kaynakları göz önünde bulundurun:
- YOLOv7 vs. YOLOv8
- EfficientDet - YOLOv8 Karşılaştırması
- YOLOv5 vs. YOLOv7
- RT-DETR - EfficientDet Karşılaştırması
- YOLO11 vs. YOLOv10