YOLO11 - EfficientDet: Kapsamlı Teknik Bir Karşılaştırma
Bilgisayar görüşü alanındaki hızlı gelişmelerde, başarılı yapay zeka uygulamaları oluşturmak için doğru nesne algılama modelini seçmek kritik öneme sahiptir. Bu değerlendirmelerde sıklıkla karşılaşılan iki önemli isim Ultralytics YOLO11 ve Google'ın EfficientDet'idir. Her iki mimari de görüntülerdeki nesneleri algılama sorununu çözmeyi amaçlarken, bu zorluğa temelde farklı tasarım felsefeleri, mimari yenilikler ve performans öncelikleriyle yaklaşırlar.
Bu kılavuz, geliştiricilerin ve araştırmacıların bu iki model arasındaki nüansları anlamalarına yardımcı olmak amacıyla derinlemesine bir teknik karşılaştırmayı sunar. Mimarilerini, performans metriklerini, eğitim metodolojilerini ve ideal kullanım durumlarını inceleyeceğiz ve modern gelişmelerin neden genellikle YOLO ailesinin çok yönlülüğünü ve hızını tercih ettiğini vurgulayacağız.
Ultralytics YOLO11: Gerçek Zamanlı Görüntülemede Son Teknoloji
2024'ün sonlarında piyasaya sürülen YOLO11, Ultralytics tarafından oluşturulan ünlü "You Only Look Once" mimarisinin en son yinelemesini temsil etmektedir. Çıkarım gecikmesi ve doğruluk arasında en uygun dengeyi sağlamak üzere tasarlanmıştır ve bu da onu uç cihazlardan bulut sunucularına kadar gerçek zamanlı uygulamalar için ilk tercih haline getirmektedir.
Teknik Detaylar:
- Yazarlar: Glenn Jocher, Jing Qiu
- Kuruluş:Ultralytics
- Tarih: 2024-09-27
- GitHub:ultralytics/ultralytics
- Belgeler:Ultralytics YOLO11 Dökümanları
Mimari ve Temel Özellikler
YOLO11, bir optimizasyon geçmişi üzerine inşa edilmiştir. Manuel anchor box hesaplamalarına olan ihtiyacı ortadan kaldırarak eğitim sürecini basitleştiren, iyileştirilmiş bir anchor-free detector tasarımı kullanır. Mimari, yüksek mAP'yi korurken toplam parametre sayısını azaltan gelişmiş özellik çıkarma katmanlarını entegre eder.
Yalnızca tespiti hedefleyen öncüllerinin veya rakiplerinin aksine, YOLO11 bir çoklu görev çerçevesidir. Tek bir model mimarisi şunlar için uyarlanabilir:
- Nesne Algılama
- Örnek Segmentasyonu
- Görüntü Sınıflandırması
- Poz Tahmini
- Yönlendirilmiş Sınırlayıcı Kutu (OBB)
Ultralytics'in Avantajı
YOLO11 kullanmanın en önemli faydalarından biri Ultralytics ekosistemidir. Model, güçlü bir Python API ve CLI, aktif topluluk bakımı ve MLOps araçlarıyla sorunsuz entegrasyonlarla desteklenir. Bu, geliştiricilerin kodla uğraşmak için daha az ve çözüm dağıtmak için daha fazla zaman harcamasını sağlar.
Güçlü Yönler
- Rakipsiz Hız: Yüksek çözünürlüklü akışlarda bile gerçek zamanlı performans elde ederek GPU çıkarımı için optimize edilmiştir.
- Çok Yönlülük: Çoklu bilgisayarla görme görevleri için yerel destek, segmentasyon veya poz tahmini için çerçeve değiştirme ihtiyacını ortadan kaldırır.
- Kullanım Kolaylığı:
ultralyticspaketi, yalnızca birkaç satır kodla eğitim, doğrulama ve dağıtıma olanak tanır. - Bellek Verimliliği: Transformatör tabanlı alternatiflere veya eski mimarilere kıyasla daha düşük CUDA bellek gereksinimleriyle daha hızlı eğitilmek üzere tasarlanmıştır.
YOLO11 hakkında daha fazla bilgi edinin
Google'in EfficientDet'i: Verimlilik için Optimizasyon
2019'un sonlarında Google Brain ekibi tarafından tanıtılan EfficientDet, nesne algılama modellerinin verimliliğini artırmak için tasarlanmıştır. Yüksek doğruluk elde etmek için gereken parametre sayısını ve teorik hesaplamayı (FLOP'lar) optimize etmeye büyük önem vermiştir.
Teknik Detaylar:
- Yazarlar: Mingxing Tan, Ruoming Pang, Quoc V. Le
- Kuruluş:Google
- Tarih: 2019-11-20
- Arxiv:EfficientDet: Ölçeklenebilir ve Verimli Nesne Algılama
- GitHub:google/automl/efficientdet
- Belgeler:EfficientDet README
Mimari ve Temel Özellikler
EfficientDet, EfficientNet backbone üzerine inşa edilmiştir ve iki temel kavram sunar:
- BiFPN (Çift Yönlü Özellik Piramidi Ağı): Girdi özelliklerini önemlerini öğrenmek için farklı şekilde tartarak kolay çok ölçekli özellik entegrasyonuna izin veren bir özellik birleştirme katmanı.
- Bileşik Ölçeklendirme: Ağın çözünürlüğünü, derinliğini ve genişliğini düzgün bir şekilde ölçeklendirme yöntemi, D0'dan (en küçük) D7'ye (en büyük) bir model ailesi oluşturur.
Güçlü ve Zayıf Yönler
EfficientDet, parametre verimliliğinde mükemmeldir ve genellikle YOLOv3 gibi eski modellere göre daha az parametre ile iyi doğruluk elde eder. Yüksek oranda ölçeklenebilirdir ve kullanıcıların teorik FLOP bütçelerine uyan bir model boyutu seçmelerine olanak tanır.
Ancak, EfficientDet'in modern dağıtım bağlamlarında dikkate değer sınırlamaları vardır:
- Daha Yavaş GPU Çıkarımı: FLOP'larda verimli olmasına rağmen, EfficientDet'te yaygın olarak kullanılan derinlemesine ayrılabilir evrişimler, YOLO modellerinde kullanılan yoğun evrişimlere kıyasla GPU'larda genellikle daha az optimize edilmiştir. Bu, daha yüksek çıkarım gecikmesine neden olur.
- Sınırlı Kapsam: Öncelikli olarak bir nesne algılayıcıdır ve YOLO11'de bulunan OBB veya poz tahmini gibi karmaşık görevler için yerel, birleşik desteğe sahip değildir.
- Karmaşık Araçlar: Orijinal depo araştırma odaklıdır (TensorFlow) ve Ultralytics ekosistemini karakterize eden cilalı, kullanıcı dostu API ve dağıtım araçlarından yoksundur.
EfficientDet hakkında daha fazla bilgi edinin
Performans Karşılaştırması
YOLO11 ve EfficientDet karşılaştırıldığında, en çarpıcı fark GPU donanımındaki gerçek dünya çıkarım hızında yatmaktadır. EfficientDet FLOP'ları en aza indirirken, YOLO11 gecikmeyi en aza indirir; bu da gerçek zamanlı uygulamalar için en önemli ölçüttür.
Aşağıdaki tablo bu farkı göstermektedir. Örneğin, YOLO11n, hem doğrulukta (+%4,9 mAP) hem de hızda (T4 GPU'da 2,6 kat daha hızlı) EfficientDet-d0'dan daha iyi performans gösterir. Ölçeği büyüttükçe, fark daha da belirginleşir; YOLO11x, EfficientDet-d7'ye göre daha üstün doğruluk sunarken 11 kat daha hızlıdır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Sonuçların Analizi
- Gerçek Zamanlı Yetenekler: YOLO11, GPU üzerindeki tüm model boyutlarında gerçek gerçek zamanlı çıkarım yetenekleri sağlarken, EfficientDet daha büyük varyantlarıyla (d4-d7) gerçek zamanlı kare hızlarını (30 FPS veya ~33ms) korumakta zorlanır.
- Doğruluk - Hız Karşılaştırması: Karşılaştırılabilir her doğruluk noktasında (örneğin, 47.0 mAP), YOLO11 varyantı (YOLO11s), EfficientDet eşdeğerinden (EfficientDet-d3) önemli ölçüde daha hızlıdır.
- Eğitim Verimliliği: Ultralytics modelleri genellikle daha hızlı yakınsar ve donanım hızlandırmasını daha etkili bir şekilde kullanarak özel veri kümeleri üzerinde eğitim için gereken maliyeti ve süreyi azaltır.
İdeal Kullanım Senaryoları
Ultralytics YOLO11 Ne Zaman Seçilir
YOLO11, hız, doğruluk ve geliştirme kolaylığı dengesi gerektirenler başta olmak üzere, modern bilgisayar görüsü projelerinin büyük çoğunluğu için tercih edilen seçenektir.
- Uç Yapay Zeka ve Robotik: Navigasyon veya çarpışmayı önleme gibi görevler için düşük gecikme süresinin olmazsa olmaz olduğu NVIDIA Jetson veya Raspberry Pi gibi cihazlarda dağıtım.
- Ticari Uygulamalar: Güvenilirlik ve hızın yatırım getirisini doğrudan etkilediği perakende analitiği, otomatik üretim ve güvenlik izleme.
- Çoklu Görev Sistemleri: Bir çalışanın güvenlik ekipmanı giyip giymediğini (algılama) ve duruşunun doğru olup olmadığını (poz tahmini) kontrol etmek gibi, sınırlayıcı kutulardan daha fazlasını gerektiren projeler.
- Hızlı Geliştirme: Kullanıcı dostu bir API ve kapsamlı belgeler kullanarak hızlı bir şekilde yineleme yapması gereken ekipler.
Ne Zaman EfficientDet Seçmeli
EfficientDet belirli niş senaryolarda hala geçerliliğini koruyor:
- Akademik Kıyaslama: Bileşik ölçeklendirme veya BiFPN mimarilerinin belirli etkilerini inceleyen araştırmacılar.
- Şiddetli FLOP Kısıtlamaları: Gecikme veya bellek bant genişliğinden ziyade teorik işlem sayısının (FLOP) tek sınırlayıcı faktör olduğu son derece kısıtlı CPU ortamları.
Kullanım Kolaylığı: Ultralytics Kod Deneyimi
YOLO11'in belirleyici özelliklerinden biri, sorunsuz geliştirici deneyimidir. Eski modeller genellikle karmaşık yapılandırma dosyaları ve standart kod gerektirirken, Ultralytics iş akışını birkaç sezgisel Python satırına dönüştürür.
İşte önceden eğitilmiş bir YOLO11 modelini yükleyip çıkarım yapmanın ne kadar basit olduğu:
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference on an image
results = model("path/to/image.jpg")
# Display the results
results[0].show()
Bu basitlik, özel veriler üzerinde eğitime de uzanır:
# Train the model on a custom dataset (e.g., COCO8)
model.train(data="coco8.yaml", epochs=100, imgsz=640)
Ekosistem Desteği
Ultralytics, popüler veri kümeleri ve araçlarla sorunsuz entegrasyon sağlar. İster veri yönetimi için Roboflow'u, ister dağıtım optimizasyonu için TensorRT'yi kullanıyor olun, ekosistem tüm hattınızı desteklemek için oluşturulmuştur.
Sonuç
EfficientDet, model ölçeklendirme ve verimlilik konusunda önemli kavramlar sunarken, Ultralytics YOLO11 günümüzün pratik bilgisayarlı görü ihtiyaçları için üstün bir seçimdir. Aşağıdakilerin zorlayıcı bir kombinasyonunu sunar:
- Üstün Performans: Modern donanımda daha hızlı çıkarım hızları ve daha yüksek doğruluk.
- Daha Fazla Çok Yönlülük: Algılama, segmentasyon, poz ve daha fazlası için birleşik bir çerçeve.
- Daha İyi Kullanılabilirlik: Mükemmel dokümantasyon ve topluluk desteği ile iyi yönetilen bir ekosistem.
Güçlü, yüksek performanslı ve ölçeklenebilir yapay görme uygulamaları oluşturmak isteyen geliştiriciler için YOLO11, başarılı olmak için gereken gücü ve esnekliği sunar.
Diğer Model Karşılaştırmaları
YOLO11'in diğer önde gelen mimarilerle nasıl karşılaştırıldığını inceleyin:
- YOLO11 - YOLOv10
- YOLO11 - YOLOv8 Karşılaştırması
- YOLO11 - RT-DETR Karşılaştırması
- EfficientDet - YOLOv8 Karşılaştırması
- EfficientDet - YOLOv7 Karşılaştırması