EfficientDet ve YOLO11: Nesne Algılamanın Evrimini Değerlendirme

Bilgisayar görme uygulamaları için en uygun mimariyi seçmek, genellikle hesaplama verimliliği ile algılama doğruluğu arasındaki dengeyi kurmayı gerektirir. Bu kapsamlı karşılaştırma, Google 2019 yılında geliştirdiği ölçeklenebilir algılama mimarisi EfficientDet ile YOLO11, 2024 yılında piyasaya sürülen Ultralytics tarafından piyasaya sürülen ve gerçek zamanlı performansı yeniden tanımlayan YOLO11

EfficientDet, model ölçeklendirmede çığır açan kavramlar getirirken, YOLO11 kullanılabilirlik, çıkarım hızı ve çoklu görev çok yönlülüğü açısından önemli bir ilerlemeyi YOLO11 . 2026'da yeni projelere başlayan geliştiriciler için, burada tartışılan yenilikleri temel alan ve yerel uçtan uca işleme özelliğine sahip en yeni YOLO26'yı da keşfetmelerini öneririz.

Performans Kıyaslama Analizi

Nesne algılama alanı, teorik FLOP'ları optimize etmekten gerçek dünya gecikmesini optimize etmeye doğru önemli bir değişim geçirdi. Aşağıdaki tablo, çıkarım hızlarındaki belirgin farkı göstermektedir. EfficientDet-d0, CPU yaklaşık 10 ms gerektirirken, YOLO11n gibi modern mimariler benzer görevleri çok daha hızlı, genellikle karşılaştırılabilir donanımlarda 2 ms'nin altında gerçekleştirirken, rekabetçi ortalama hassasiyet (mAP) değerini korur.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20.7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

YOLO11n	640	39.5	1.5	2.6	2.6	6.5
YOLO11s	640	47.0	2.5	9.4	9.4	21.5
YOLO11m	640	51.5	4.7	20.1	20.1	68.0
YOLO11l	640	53.4	6.2	25.3	25.3	86.9
YOLO11x	640	54.7	11.3	56.9	56.9	194.9

EfficientDet: Bileşik Ölçeklendirmenin Öncüsü

Google ekibi tarafından geliştirilen EfficientDet, ölçeklendirme modellemesine sistematik bir yaklaşım olarak ortaya çıktı. EfficientNet backbone üzerine inşa edilen bu model backbone kolay ve hızlı çok ölçekli özellik füzyonu sağlayan Ağırlıklı Çift Yönlü Özellik Piramidi Ağı (BiFPN) teknolojisini kullanıyor.

Temel yenilik, ağ backbone, özellik ağının ve kutu/sınıf tahmin ağlarının çözünürlüğünü, derinliğini ve genişliğini eşit şekilde ölçeklendiren bir yöntem olan bileşik ölçeklendirmeydi. Bu, EfficientDet ailesi (D0'dan D7'ye kadar) mobil cihazlardan yüksek güçlü GPU kadar çok çeşitli kaynak kısıtlamalarını hedeflemesine olanak tanıdı.

Akademik başarısı ve FLOP açısından yüksek verimliliğine rağmen, EfficientDet, karmaşık BiFPN bağlantılarının ve derinlik açısından ayrılabilir konvolüsyonlarının bellek erişim maliyetleri nedeniyle gerçek dünya donanımlarında gecikmeyle sık sık mücadele eder. Bu maliyetler, TensorRT gibi hızlandırıcılar tarafından her zaman optimize edilmez. TensorRTgibi hızlandırıcılar tarafından her zaman optimize edilmez.

Verimli Metadata:

Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
Kuruluş:Google Research
Tarih: 2019-11-20
Arxiv:EfficientDet: Ölçeklenebilir ve Verimli Nesne Algılama
GitHub:google/automl

EfficientDet hakkında daha fazla bilgi edinin

Ultralytics YOLO11: Gerçek Zamanlı Son Teknolojiyi Yeniden Tanımlamak

Eylül 2024'te piyasaya sürülen YOLO11 , pratik, yüksek hızlı nesne algılama ve anında dağıtım için tasarlanmıştır. Parametre verimliliğine yoğun bir şekilde odaklanan EfficientDet'ten farklı olarak, YOLO11 donanım kullanımını YOLO11 modelin hem uç CPU'larda hem de kurumsal GPU'larda olağanüstü hızlı çalışmasını sağlar.

YOLO11 , C3k2 bloğu ve geliştirilmiş SPPF (Spatial Pyramid Pooling - Fast) modülü gibi mimari iyileştirmeler YOLO11 . Bu değişiklikler, eski özellik piramidi tasarımlarında görülen gecikme cezası olmadan modelin çeşitli ölçeklerde özellikleri çıkarma yeteneğini geliştirir. Ayrıca YOLO11 , EfficientDet ile karmaşık özel uygulamalar gerektiren özellikler olan örnek segmentasyonu, poz tahmini ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) algılama dahil olmak üzere çoklu görme görevleri için birleşik bir çerçeve YOLO11 .

Ekosistem Avantajı

Ultralytics , Ultralytics ile tamamen entegre olup, bulutta sorunsuz veri kümesi yönetimi, otomatik açıklama ekleme ve tek tıklamayla model eğitimi sağlar.

YOLO11 :

Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş:Ultralytics
Tarih: 2024-09-27
GitHub:ultralytics/ultralytics
Belgeler:YOLO11 Dökümantasyonu

YOLO11 hakkında daha fazla bilgi edinin

Temel Teknik Farklılıklar

Mimarlık ve Özellik Birleştirme

EfficientDet, özellik haritalarını yukarıdan aşağıya ve aşağıdan yukarıya tekrar tekrar bağlayan karmaşık bir ağırlıklı özellik füzyon katmanı olan BiFPN'ye dayanır. Teorik olarak verimli olsa da, düzensiz bellek erişim modelleri GPU'larda çıkarımları yavaşlatabilir.

Buna karşılık, YOLO11 , C3k2 blokları ile akıcı bir PANet (Yol Toplama Ağı) mimarisini YOLO11 . Bu tasarım, CUDA ve modern NPU mimarileriyle uyumlu, yoğun ve düzenli bellek erişim modellerini tercih eder, bu da karşılaştırma tablosunda gözlemlenen büyük hız artışlarına neden olur (örneğin, YOLO11x, daha yüksek doğruluğu korurken EfficientDet-d7'den çok daha hızlıdır).

Eğitim Verimliliği ve Kullanım Kolaylığı

Verimli bir Det modelinin eğitimi genellikle TensorFlow Algılama API'sini veya AutoML kütüphanesini kullanmayı gerektirir. Bu, zorlu bir öğrenme süreci ve karmaşık yapılandırma dosyaları içerebilir.

Ultralytics , geliştirici deneyimini Ultralytics . YOLO11 eğitimi YOLO11 basit bir Python veya Komut Satırı Arayüzü (CLI) aracılığıyla YOLO11 . Kütüphane, hiperparametre ayarlamasını, veri artırmayı ve veri kümesi biçimlendirmeyi otomatik olarak gerçekleştirir.

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Çok Yönlülük ve Dağıtım

EfficientDet, öncelikle bir nesne algılama mimarisidir. Segmentasyon veya poz tahmini gibi görevler için uyarlanması, önemli mimari değişiklikler gerektirir.

YOLO11 , doğal olarak çok modlu YOLO11 . Aynı backbone eğitim boru hattı şunları destekler:

Algılama: Standart sınırlayıcı kutular.
Segmentasyon: Hassas nesne sınırları için piksel düzeyinde maskeler.
Sınıflandırma: Tüm görüntü kategorizasyonu.
Poz: İskelet takibi için anahtar nokta algılama.
OBB: Hava görüntüleri ve metin algılama için döndürülmüş kutular.

Bu çok yönlülük, YOLO11 AI mühendisleri için YOLO11 "İsviçre çakısı" haline getirerek, tek bir deponun sağlık hizmetleri görüntüleme alanından otonom robotik alanına kadar çeşitli uygulamaları desteklemesini sağlar.

Neden Ultralytics Modellerini Seçmelisiniz?

Modern üretim sistemleri için bu iki mimariyi karşılaştırdığımızda, Ultralytics belirgin avantajlar sunmaktadır:

Daha Az Bellek Kullanımı: YOLO , tüketici sınıfı donanımlarda eğitilmek üzere optimize edilmiştir. Büyük CUDA gerektiren transformatör tabanlı modellerin veya eski ağır mimarilerin aksine, verimli YOLO , üst düzey AI eğitimine erişimi demokratikleştirir.
Kolaylaştırılmış Dağıtım: ONNX, TensorRT, CoreML veya TFLite dışa aktarma, Ultralytics tek satırlık bir TFLite
Aktif Destek: Ultralytics canlı ve aktiftir. Sık sık yapılan güncellemelerle, çerçeve PyTorch CUDA en son sürümleriyle uyumluluğu garanti eder.

Sonuç: Modern Seçim

EfficientDet, bilgisayar görme araştırmalarının tarihinde önemli bir dönüm noktası olmaya devam ederken, bileşik ölçeklendirmenin gücünü ortaya koymaktadır. YOLO11 ve daha yeni olan YOLO26, günümüzde pratik kullanım için daha üstün seçeneklerdir. Hız ve doğruluk arasında daha iyi bir denge, önemli ölçüde daha kolay bir kullanıcı deneyimi ve tek bir çerçeve içinde birden fazla bilgisayar görme görevini yerine getirme esnekliği sunarlar.

En son teknolojileri takip etmek isteyen geliştiriciler için, daha düşük gecikme süresi ve daha basit dağıtım süreçleri için uçtan uca NMS tasarım sunan YOLO26'yı incelemenizi öneririz.

Diğer yüksek performanslı seçenekleri keşfetmek için, karşılaştırmalarımızı okumanızı öneririz. YOLOv10 veya RT-DETR.