İçeriğe geç

EfficientDet vs. YOLO11: Verimlilik ve Gerçek Zamanlı Performansın Dengelenmesi

Nesne algılama alanı, yalnızca doğru değil aynı zamanda gerçek dünyada kullanılabilecek kadar verimli modellere duyulan ihtiyaç nedeniyle hızla gelişmiştir. Bu evrimdeki iki önemli kilometre taşı Google'ın EfficientDet ve Ultralytics YOLO11. Her iki mimari de hız ve doğruluk arasındaki dengeyi optimize etmeyi amaçlasa da, soruna farklı tasarım felsefeleriyle yaklaşmakta ve farklı birincil kullanım durumlarını hedeflemektedir.

EfficientDet, model boyutlarını ölçeklendirmek için sistematik bir yöntem sunarak, yoğun bir şekilde parametre verimliliğine ve teorik hesaplama maliyetlerine (FLOP'lar) odaklanarak bu alanda devrim yaratmıştır. Buna karşılık YOLO11 , modern donanımlarda pratik çıkarım hızına, görevler arasında çok yönlülüğe ve geliştirici merkezli bir deneyime öncelik vererek gerçek zamanlı bilgisayarla görmenin en ileri noktasını temsil etmektedir. Bu kapsamlı karşılaştırma, projeniz için doğru aracı seçmenize yardımcı olmak üzere teknik özellikleri, mimari yenilikleri ve performans kıyaslamalarını incelemektedir.

Google'ın EfficientDet'i

EfficientDet, Google Brain ekibi tarafından geliştirilen bir nesne algılama modelleri ailesidir. 2019'un sonlarında piyasaya sürülen bu model, genellikle devasa omurgalara veya optimize edilmemiş özellik füzyon ağlarına dayanan önceki son teknoloji dedektörlerin verimsizliğini gidermek için tasarlanmıştır.

Teknik Detaylar:

Mimari ve Temel Yenilikler

EfficientDet'in başarısı, verimliliği en üst düzeye çıkarmak için birlikte çalışan iki ana mimari katkıya dayanmaktadır:

  1. BiFPN (Çift Yönlü Özellik Piramidi Ağı): Geleneksel Özellik Piramidi Ağları (FPN) farklı ölçeklerdeki özellikleri yukarıdan aşağıya bir şekilde birleştirir. EfficientDet, bilginin hem yukarıdan aşağıya hem de aşağıdan yukarıya doğru akmasına izin veren BiFPN'yi tanıttı. Ayrıca, her bir girdi özelliğinin önemini öğrenerek ağın daha bilgilendirici sinyallere öncelik vermesini sağlayan ağırlıklı bir özellik füzyon mekanizması kullanır.
  2. Bileşik Ölçeklendirme: EfficientNet'ten esinlenen bu yöntem, backbone, özellik ağı ve tahmin ağlarının çözünürlüğünü, derinliğini ve genişliğini eşit şekilde ölçeklendirerek bir model ailesi (D0 ila D7) oluşturur. Bu, model büyüdükçe çeşitli bileşenleri arasında bir denge kurmasını, FLOP 'ları ve parametre sayısını optimize etmesini sağlar.

EfficientNet Backbone

EfficientDet, backbone olarak yine Google tarafından geliştirilen bir sınıflandırma ağı olan EfficientNet 'i kullanmaktadır. EfficientNet, en verimli ağ yapısını bulmak için Nöral Mimari Arama (NAS) kullanılarak optimize edilmiş ve hesaplamayı azaltmak için yoğun olarak derinlemesine ayrılabilir konvolüsyonlar kullanılmıştır.

Güçlü ve Zayıf Yönler

EfficientDet, yüksek parametre verimliliği ile tanınır ve rekabetçi mAPval Çağdaşlarının çoğundan önemli ölçüde daha az parametre ile puanlar. Ölçeklenebilir yapısı, araştırmacıların teorik hesaplama bütçelerine tam olarak uyan bir model boyutu seçmelerine olanak tanır.

Bununla birlikte, teorik verimlilik her zaman pratik hıza dönüşmez. Derinlemesine ayrılabilir konvolüsyonların yoğun kullanımı ve BiFPN'in karmaşık bağlantısı, GPU kullanımının daha düşük olmasına neden olabilir. Sonuç olarak, GPU'lardaki çıkarım gecikmesi, YOLO serisi gibi paralel işleme için optimize edilmiş modellere kıyasla genellikle daha yüksektir. Ek olarak, EfficientDet kesinlikle bir nesne algılayıcıdır ve aynı kod tabanı içinde örnek segmentasyonu veya poz tahmini gibi diğer bilgisayarla görme görevleri için yerel destekten yoksundur.

İdeal Kullanım Senaryoları

  • CPU'larda Edge AI: Belleğin zorlayıcı bir kısıtlama olduğu ve GPU hızlandırmasının kullanılamadığı cihazlar.
  • Akademik Araştırma: Sinir ağı verimliliği ve ölçeklendirme yasalarına odaklanan çalışmalar.
  • Düşük Güç Uygulamaları: Pil tüketimini en aza indirmenin (FLOP'lara bağlı olarak) ham gecikmeden daha kritik olduğu senaryolar.

EfficientDet hakkında daha fazla bilgi edinin

Ultralytics YOLO11

Ultralytics YOLO11 beğenilen YOLO (You Only Look Once) serisinin en son yinelemesidir. Geliştiricilerin beklediği ışık hızında çıkarım hızlarını korurken doğruluğun sınırlarını zorlayan mimari iyileştirmeler sunarak gerçek zamanlı performans mirası üzerine inşa edilmiştir.

Teknik Detaylar:

Mimari ve Özellikler

YOLO11 , manuel çapa kutusu yapılandırması ihtiyacını ortadan kaldıran ve eğitim sürecini basitleştiren son teknoloji ürünü çapasız bir algılama kafası kullanır. backbone ve boyun mimarileri, özellik çıkarma yeteneklerini geliştirmek için optimize edilmiş ve küçük nesne algılama ve dağınık sahneler gibi zorlu görevlerde performansı artırmıştır.

EfficientDet'in FLOP azaltmaya odaklanmasının aksine, YOLO11 donanıma duyarlı verimlilik için tasarlanmıştır. Bu, katmanlarının ve işlemlerinin GPU'lar ve NPU hızlandırıcıları üzerindeki verimi en üst düzeye çıkarmak için seçildiği anlamına gelir.

Çok Yönlülük Serbest Bırakıldı

Tek bir YOLO11 model mimarisi çok çeşitli görüş görevlerini destekler. Aynı çerçeve içinde şunları gerçekleştirebilirsiniz Nesne Algılama, Örnek Segmentasyonu, Görüntü Sınıflandırma, Poz Tahminive Yönlendirilmiş Sınırlayıcı Kutu (OBB) Algılama.

Güçlü ve Zayıf Yönler

YOLO11'in birincil gücü, olağanüstü hız-doğruluk dengesidir. Gecikme süresinin çok az bir kısmında çalışırken daha büyük modellere rakip olan veya onları geçen son teknoloji ürünü doğruluk sunar. Bu, onu gerçek zamanlı çıkarım uygulamaları için ideal hale getirir. Ayrıca Ultralytics ekosistemi, birleşik bir API ile kullanım kolaylığı sağlayarak eğitim ve dağıtımı sorunsuz hale getirir.

Göz önünde bulundurulması gereken bir husus, en küçük YOLO11 varyantlarının inanılmaz derecede hızlı olmalarına rağmen, akademide mevcut olan en büyük, hesaplama açısından ağır modellere kıyasla küçük bir doğruluk marjından ödün verebilmeleridir. Ancak, pratik kullanım için bu ödünleşme neredeyse her zaman olumludur.

İdeal Kullanım Senaryoları

YOLO11 hakkında daha fazla bilgi edinin

Performans Karşılaştırması

EfficientDet ve YOLO11 karşılaştırıldığında, en çarpıcı fark, özellikle GPU donanımında çıkarım hızında yatmaktadır. EfficientDet modelleri (D0-D7) iyi parametre verimliliği gösterirken, karmaşık işlemleri (BiFPN gibi) paralel işleme yeteneklerini tam olarak kullanmalarını engellemektedir.

Aşağıdaki tabloda gösterildiği gibi, YOLO11n EfficientDet-d0 'dan (34,6) daha yüksek bir mAP (39,5) elde ederken önemli ölçüde daha hızlıdır. Daha da etkileyici bir şekilde, YOLO11m çok daha ağır olan EfficientDet-d5 'in (51,5 mAP) doğruluğuyla eşleşiyor ancak T4 GPU 'da yaklaşık 14 kat daha hızlı çalışıyor (4,7 ms'ye karşı 67,86 ms). Bu muazzam hız avantajı, YOLO11 'in yüksek çözünürlüklü video akışlarını gerçek zamanlı olarak işlemesine olanak tanır ki bu, daha yüksek seviyeli EfficientDet modelleri için zorlayıcı bir başarıdır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Ultralytics Avantajı

Teknik ölçümler çok önemli olsa da, geliştirici deneyimi ve ekosistem desteği proje başarısı için eşit derecede önemlidir. Ultralytics , tüm MLOps yaşam döngüsünü basitleştiren ve araştırma merkezli EfficientDet havuzuna göre belirgin avantajlar sunan kapsamlı bir araç paketi sağlar.

  • Kullanım Kolaylığı: Ultralytics Python API ve CLI basitlik için tasarlanmıştır. EfficientDet genellikle TensorFlow'da karmaşık yapılandırma dosyaları ve bağımlılık yönetimi gerektirirken, son teknoloji ürünü bir modeli yalnızca birkaç satır kodla yükleyebilir, eğitebilir ve dağıtabilirsiniz.
  • İyi Korunan Ekosistem: Ultralytics modelleri aktif bir topluluk ve sık güncellemelerle desteklenir. GitHub deposundan kapsamlı belgelere kadar, geliştiriciler çok sayıda kaynağa, öğreticiye ve destek kanalına erişebilir.
  • Eğitim Verimliliği: YOLO11 hızlı yakınsama için optimize edilmiştir. Eğitim süresini azaltan verimli veri yükleme ve artırma stratejilerini destekler. Ayrıca, eski mimarilere veya transformatör tabanlı modellere kıyasla daha düşük bellek gereksinimleri, CUDA belleği tükenmeden tüketici sınıfı GPU'larda eğitim yapılmasına olanak tanır.
  • Dağıtım Esnekliği: Çerçeve, modellerin aşağıdakiler de dahil olmak üzere çeşitli formatlara aktarılmasını yerel olarak destekler ONNX, TensorRT, CoreML ve OpenVINO. Bu, YOLO11 modelinizin bulut sunucularından Raspberry Pi gibi uç cihazlara kadar her yere dağıtılabilmesini sağlar.

YOLO11 ile uygulamalı çalışma

Ultralytics API'sinin basitliğini deneyimleyin. Aşağıdaki örnek, önceden eğitilmiş bir YOLO11 modelinin nasıl yükleneceğini ve bir görüntü üzerinde çıkarımın nasıl çalıştırılacağını göstermektedir:

from ultralytics import YOLO

# Load a pre-trained YOLO11n model
model = YOLO("yolo11n.pt")

# Run inference on an image source
results = model("path/to/image.jpg")

# Display the results
results[0].show()

Sonuç

Hem EfficientDet hem de YOLO11 bilgisayarla görme alanında dönüm noktası niteliğinde başarılardır. EfficientDet ölçeklenebilir mimari tasarımı için değerli bir referans olmaya devam etmektedir ve teorik FLOP'ların birincil kısıtlama olduğu niş uygulamalar için uygundur.

Ancak, modern bilgisayarla görme uygulamalarının büyük çoğunluğu için, Ultralytics YOLO11 üstün bir seçimdir. Mimarisi, özellikle çoğu üretim ortamında kullanılan GPU donanımında çok daha iyi bir doğruluk ve hız dengesi sunar. Çok yönlü çoklu görev çerçevesi, sağlam ekosistemi ve benzersiz kullanım kolaylığı ile birlikte YOLO11 , geliştiricilerin yüksek performanslı yapay zeka çözümlerini güvenle oluşturmalarını ve dağıtmalarını sağlar.

Diğer Karşılaştırmaları İnceleyin

Nesne algılama modellerinin manzarasını daha iyi anlamak için bu ek karşılaştırmaları keşfetmeyi düşünün:


Yorumlar