YOLOv6.0 vs EfficientDet: Nesne Algılamada Hız ve Hassasiyeti Dengeleme
Bilgisayarla görmenin hızla gelişen ortamında, doğru nesne algılama mimarisini seçmek projenizin başarısı için kritik öneme sahiptir. Bu karşılaştırma, görsel tanıma sorununa farklı açılardan yaklaşan iki önemli model olan YOLOv6.0 ve EfficientDet'i incelemektedir. EfficientDet parametre verimliliği ve ölçeklenebilirliğe odaklanırken, YOLOv6.0 özellikle çıkarım gecikmesi ve gerçek zamanlı hızın pazarlık konusu olmadığı endüstriyel uygulamalar için tasarlanmıştır.
Performans Ölçütleri ve Teknik Analiz
Bu iki mimari arasındaki temel fark tasarım felsefelerinde yatmaktadır. EfficientDet, doğruluğu artıran ancak genellikle GPU'larda hesaplama hızı pahasına BiFPN olarak bilinen sofistike bir özellik füzyon mekanizmasına dayanır. Buna karşılık, YOLOv6.0, çıkarım sırasında işlemleri kolaylaştırmak için yeniden parametrelendirmeyi kullanarak donanıma duyarlı bir tasarım benimser ve bu da önemli ölçüde daha yüksek FPS (saniye başına kare) ile sonuçlanır.
Aşağıdaki tablo bu değiş tokuşu göstermektedir. EfficientDet-d7 yüksek bir mAP elde ederken, gecikme süresi oldukça yüksektir. Buna karşılık, YOLOv6.0l, büyük ölçüde azaltılmış çıkarım süreleriyle karşılaştırılabilir doğruluk sunar ve bu da onu gerçek zamanlı çıkarım senaryoları için çok daha uygun hale getirir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv6.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Performans Optimizasyonu
Endüstriyel dağıtımlar için, YOLOv6.0 ile TensorRT büyük hız iyileştirmeleri sağlayabilir. YOLOv6 'nın mimari basitliği, eski modellerde bulunan karmaşık özellik piramidi ağlarına kıyasla GPU donanım talimatlarına çok verimli bir şekilde eşlenmesini sağlar.
YOLOv6.0: Endüstri için Üretildi
YOLOv6.0, akademik araştırma ve endüstriyel gereksinimler arasındaki boşluğu doldurmak için tasarlanmış tek aşamalı bir nesne dedektörüdür. Kalite denetimi gibi görevler için gereken hassasiyetten ödün vermeden hıza öncelik verir.
Yazarlar Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Organizasyon:Meituan
Tarih: 2023-01-13
Arxiv:YOLOv6 v3.0: Tam Ölçekli Bir Yeniden Yükleme
GitHub:YOLOv6
Docs:YOLOv6 Documentation
Mimari ve Güçlü Yönler
YOLOv6.0'ın çekirdeği verimli backbone ve "RepOpt" tasarımı. Model, yeniden parametrelendirmeyi kullanarak eğitim zamanı çok dallı yapıları çıkarım zamanı tek dallı yapılardan ayırır. Bu, zengin gradyanlarla eğitilmesi kolay ancak yürütülmesi son derece hızlı bir modelle sonuçlanır.
- Kendi Kendine Damıtma: Eğitim stratejisi, modelin kendi tahmininin öğrenmeyi yönlendirmek için yumuşak bir etiket görevi gördüğü ve ekstra veri olmadan doğruluğu artırdığı kendi kendine damıtmayı kullanır.
- Niceleme Desteği: Model kuantizasyonu göz önünde bulundurularak tasarlanmıştır ve uç dağıtım için INT8'e dönüştürülürken doğruluk düşüşlerini en aza indirir.
- Endüstriyel Odak: Milisaniyelik gecikmelerin önemli olduğu üretim ve robotik alanlarında yapay zeka için idealdir.
YOLOv6.0 hakkında daha fazla bilgi edinin
EfficientDet: Ölçeklenebilir Hassasiyet
EfficientDet, nesne algılamaya bileşik ölçeklendirme kavramını getirerek bu alanda devrim yaratmıştır. Parametre başına mükemmel performans elde etmek için ağ derinliğini, genişliğini ve çözünürlüğünü aynı anda optimize eder.
Yazarlar Mingxing Tan, Ruoming Pang ve Quoc V. Le
Organizasyon:Google
Tarih: 2019-11-20
Arxiv:EfficientDet: Ölçeklenebilir ve Verimli Nesne Algılama
GitHub:google
Mimari ve Güçlü Yönler
EfficientDet, EfficientNet backbone dayanır ve Çift Yönlü Özellik Piramit Ağı'nı (BiFPN) sunar. Bu karmaşık boyun yapısı, kolay ve hızlı çok ölçekli özellik füzyonu sağlar.
- BiFPN: Geleneksel FPN'lerin aksine, BiFPN bilginin hem yukarıdan aşağıya hem de aşağıdan yukarıya akmasına izin verir ve önemlerini vurgulamak için farklı girdi özelliklerine ağırlıklar uygular.
- Bileşik Ölçeklendirme: Basit bir $\phi$ katsayısı, kullanıcıların mevcut kaynaklara bağlı olarak modeli ölçeklendirmesine (d0'dan d7'ye) olanak tanıyarak öngörülebilir bir doğruluk-hesaplama eğrisi sağlar.
- Parametre Verimliliği: Daha küçük varyantlar (d0-d2) disk boyutu ve FLOP'lar açısından son derece hafiftir, bu da onları depolama açısından kısıtlı ortamlar için kullanışlı hale getirir.
Mimari Karmaşıklık
BiFPN doğruluk açısından oldukça etkili olsa da, düzensiz bellek erişim modelleri, YOLO mimarilerinde kullanılan yoğun, düzenli konvolüsyon bloklarına kıyasla GPU'larda daha yavaş olmasına neden olabilir. Bu nedenle EfficientDet, daha az parametreye sahip olmasına rağmen genellikle daha yüksek çıkarım gecikmesi ile kıyaslanır.
EfficientDet hakkında daha fazla bilgi edinin
Gerçek Dünya Kullanım Durumları
Bu modeller arasındaki seçim genellikle dağıtım ortamının özel kısıtlamalarına bağlıdır.
YOLOv6.0 için İdeal Senaryolar
- Yüksek Hızlı Üretim: Her öğeyi track için yüksek FPS'nin gerekli olduğu hızlı hareket eden konveyör bantlarındaki kusurları tespit etme.
- Otonom Navigasyon: Video akışlarını gerçek zamanlı olarak işleyerek robotların dinamik ortamlarda gezinmesini sağlamak.
- Uç Bilişim: GPU kaynaklarının verim için en üst düzeye çıkarılması gereken NVIDIA Jetson gibi cihazlarda dağıtım.
EfficientDet için İdeal Senaryolar
- Tıbbi Analiz: X-ışınlarında tümör tespiti gibi, işlem süresinin hassasiyetten daha az kritik olduğu statik yüksek çözünürlüklü görüntülerin analizi.
- Uzaktan Algılama: Çevresel değişiklikleri veya kentsel gelişimi belirlemek için uydu görüntülerinin çevrimdışı olarak işlenmesi.
- Düşük Depolama Alanlı IoT: Küçük bir model dosya boyutu gerektiren son derece sınırlı depolama kapasitesine sahip cihazlar (EfficientDet-d0 gibi).
Ultralytics Avantajı: Neden YOLO11'i Seçmelisiniz?
YOLOv6.0 ve EfficientDet yetenekli modeller olsa da Ultralytics YOLO11 bilgisayarla görme teknolojisinin en ileri noktasını temsil etmektedir. YOLO11 , önceki YOLO nesillerinin en iyi özelliklerini geliştiriyor ve bunları sorunsuz, kullanıcı dostu bir ekosisteme entegre ediyor.
YOLO11'in Temel Avantajları
- Kullanım Kolaylığı: Ultralytics , geliştirici deneyimine öncelik verir. Pythonic API ile, EfficientDet için genellikle gerekli olan karmaşık yapılandırma dosyalarının aksine, modelleri yalnızca birkaç satır kodla eğitebilir, doğrulayabilir ve dağıtabilirsiniz.
- Çok yönlülük: Öncelikle nesne algılama modelleri olan YOLOv6 ve EfficientDet'in aksine, YOLO11 örnek segmentasyonu, poz tahmini, yönlendirilmiş sınırlayıcı kutular (OBB) ve sınıflandırma dahil olmak üzere birden fazla görevi yerel olarak destekler.
- Performans Dengesi: YOLO11 , hız ve doğruluk arasında son teknoloji ürünü bir denge sağlar. Düşük gecikme süresini korurken COCO veri kümesinde eski mimarilerden sürekli olarak daha iyi performans gösterir.
- İyi Korunan Ekosistem: Ultralytics modelleri aktif bir topluluk tarafından desteklenir ve sık sık güncellenir. Bulut eğitimi ve veri kümesi yönetimi için Ultralytics HUB gibi araçlarla kapsamlı belgelere, eğitimlere ve sorunsuz entegrasyonlara erişim elde edersiniz.
- Eğitim Verimliliği: YOLO11 , eğitim sırasında kaynak açısından verimli olacak şekilde tasarlanmıştır, genellikle daha hızlı yakınsar ve karmaşık transformatör tabanlı modellere veya eski mimarilere göre daha az GPU belleği gerektirir.
from ultralytics import YOLO
# Load the YOLO11 model (recommended over older versions)
model = YOLO("yolo11n.pt")
# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display results
results[0].show()
YOLO11 hakkında daha fazla bilgi edinin
Diğer Modelleri İnceleyin
Bilgisayarla görme işlem hattınız için seçenekleri değerlendiriyorsanız, Ultralytics kataloğundaki diğer modelleri keşfetmeyi düşünün. Bu YOLOv8 çok çeşitli görevler için sağlam performans sunarken, transformatör tabanlı RT-DETR küresel bağlam farkındalığı gerektiren senaryolar için bir alternatif sunar. Mobil cihazlara özel uygulamalar için, YOLOv10 ayrıca araştırmaya değer. Bunları EfficientDet ile karşılaştırmak, özel donanım ve doğruluk gereksinimleriniz için seçiminize ince ayar yapmanıza yardımcı olabilir.