EfficientDet ve YOLO26: Nesne Algılama Mimarilerine Derinlemesine Bir Bakış
Bilgisayar görüşü alanı, 2019 ile 2026 yılları arasında önemli ölçüde gelişmiştir. EfficientDet, ölçeklenebilir mimari optimizasyonu kavramını dünyaya tanıtırken, YOLO26 uçtan uca tasarımıyla modern, gerçek zamanlı verimliliğin zirvesini temsil etmektedir. Bu karşılaştırma, bu iki etkili modelin mimari değişikliklerini, performans ölçütlerini ve pratik uygulamalarını inceleyerek, geliştiricilerin belirli nesne algılama ihtiyaçları için doğru aracı seçmelerine yardımcı olmaktadır.
Performans Metrikleri Karşılaştırması
Aşağıdaki tablo, EfficientDet varyantlarının YOLO26 ailesine kıyasla performansını karşılaştırmaktadır. Yeni mimarinin sağladığı önemli çıkarım hızı ve parametre verimliliği artışına dikkat edin.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
EfficientDet: Ölçeklenebilir Öncü
Google ekibi tarafından geliştirilen EfficientDet, 2019'un sonlarında piyasaya sürüldü ve kısa sürede verimlilik konusunda yeni bir çığır açtı. Temel yenilik, ağ backbone EfficientNet) ve özellik ağı/tahmin ağının çözünürlüğünü, derinliğini ve genişliğini eşit şekilde ölçeklendiren bir yöntem olan Compound Scaling idi.
- Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
- Kuruluş:Google
- Tarih: 2019-11-20
- Arxiv:EfficientDet: Ölçeklenebilir ve Verimli Nesne Algılama
- GitHub:google/automl/efficientdet
Temel Mimari Özellikler
EfficientDet, Çift Yönlü Özellik Piramidi Ağı (BiFPN) kullanır. Özellikleri yalnızca yukarıdan aşağıya doğru toplayan geleneksel FPN'lerden farklı olarak, BiFPN farklı giriş özelliklerine öğrenilebilir ağırlıklar ekler ve yukarıdan aşağıya ve aşağıdan yukarıya çok ölçekli özellik birleştirmeyi tekrar tekrar uygular. Bu, yüksek doğruluk sağlasa da, karmaşık bağlantılar, özellikle özel donanım hızlandırıcıları olmayan cihazlarda hesaplama açısından ağır olabilir.
Miras Karmaşıklığı
O dönemde devrim niteliğinde olan BiFPN yapısı, yeni modellerde kullanılan modern CNN yapılarına kıyasla modern Edge AI donanımında gecikme darboğazlarına neden olabilecek düzensiz bellek erişim modelleri içerir.
YOLO26: Uçtan Uca Hız Canavarı
2026 yılının başında piyasaya sürülen YOLO26, uç cihazlarda mümkün olanları yeniden tanımlıyor. Geçmişteki çapa tabanlı mantıktan uzaklaşarak, Non-Maximum Suppression (NMS) gibi karmaşık son işlem adımlarına gerek kalmayan, basitleştirilmiş, uçtan uca bir mimariye geçiyor.
- Yazarlar: Glenn Jocher ve Jing Qiu
- Kuruluş:Ultralytics
- Tarih: 2026-01-14
- GitHub:ultralytics/ultralytics
- Belgeler:Ultralytics Belgeleri
YOLO26 hakkında daha fazla bilgi edinin
YOLO26'daki Teknik Atılımlar
YOLO26, EfficientDet gibi önceki sürümlerden ve rakiplerinden ayıran birkaç son teknoloji gelişmeyi bünyesinde barındırır:
- Uçtan Uca NMS Tasarım: NMS ortadan kaldırarak, YOLO26 çıkarım boru hattını basitleştirir. Bu, gecikme değişkenliğini azaltır ve TensorRT veya CoreML kolaylaştırır.
- MuSGD Optimizer: Büyük Dil Modeli (LLM) eğitiminden esinlenilen bu SGD Muon (Moonshot AI'nın Kimi K2'sinden) melezi, istikrarlı eğitim dinamikleri ve daha hızlı yakınsama sağlayarak GPU saatlerini azaltır.
- ProgLoss + STAL: Programlanabilir Kayıp ve Yumuşak Hedef Atama Kayıp özelliklerinin eklenmesi, tek aşamalı dedektörlerin geleneksel zayıf noktası olan küçük nesnelerin algılanmasını büyük ölçüde iyileştirir.
- Edge-First Optimizasyonu: Dağıtım Odaklı Kayıp (DFL) özelliğinin kaldırılması, model grafiğini basitleştirerek önceki nesillere kıyasla CPU hızlarını %43'e kadar artırır.
Detaylı Karşılaştırma
Mimari ve Verimlilik
EfficientDet, EfficientNet backbone ağır yükünü backbone BiFPN'nin karmaşık füzyonunu kullanır. Bu, parametre başına yüksek doğruluk sağlasa da, ham FLOP'lar bellek erişim maliyetleri nedeniyle her zaman doğrusal olarak çıkarım hızına dönüşmez.
Buna karşılık, YOLO26 verimlilik için tasarlanmıştır. Mimarisi, mobil ve IoT cihazları için kritik bir faktör olan bellek bant genişliği kullanımını en aza indirir. "Nano" modeli (YOLO26n), EfficientDet-d0'ın 3,92 ms'lik hızına kıyasla T4 GPU 1,7 ms'lik olağanüstü bir hızda çalışırken, önemli ölçüde daha yüksek doğruluk elde eder (40,9 mAP 34,6 mAP).
Eğitim ve Kullanılabilirlik
En önemli farklardan biri ekosistemdedir. EfficientDet'i eğitmek için genellikle karmaşık araştırma depolarını veya eski TensorFlow .x/2.x kod tabanlarını incelemek gerekir.
Ultralytics , sorunsuz bir "Zero-to-Hero" deneyimi sunar. Ultralytics ile kullanıcılar veri kümelerini yönetebilir, bulutta eğitim alabilir ve tek bir tıklama ile dağıtım yapabilir. Python , basitlik için tasarlanmıştır:
from ultralytics import YOLO
# Load a pre-trained YOLO26n model
model = YOLO("yolo26n.pt")
# Run inference on a local image
results = model("path/to/image.jpg")
# Display the results
results[0].show()
Çok Yönlülük ve Görevler
EfficientDet öncelikle bir nesne algılama modelidir. Uzantılar mevcut olsa da, bunlar standartlaştırılmış değildir. YOLO26 ise çok görevli bir güç merkezidir. Yerel olarak şunları destekler:
- Örnek Segmentasyonu: Optimize edilmiş semantik segmentasyon kayıpları ile nesnelerin hassas maskelenmesi.
- Poz Tahmini: Doğru anahtar noktalar için Kalan Log-Olasılık Tahmini (RLE) kullanımı.
- Yönlendirilmiş Sınır Kutusu (OBB): Gemiler veya metinler gibi döndürülmüş nesneleri algılamak için özel açı kaybı.
- Sınıflandırma: Yüksek hızlı görüntü sınıflandırma.
Bellek Verimliliği
YOLO26 modelleri, eski mimarilere veya dönüştürücü tabanlı melezlere kıyasla genellikle eğitim sırasında daha az CUDA gerektirir, bu da tüketici sınıfı donanımlarda daha büyük parti boyutlarına olanak tanır.
Neden Ultralytics YOLO26'yı Seçmelisiniz?
2026 yılında geliştiriciler ve araştırmacılar için seçim açıktır. EfficientDet, bilgisayar görme tarihindeki önemli bir dönüm noktası olmaya devam ederken, YOLO26 daha üstün ve modern bir çözüm sunmaktadır.
- Kullanım Kolaylığı: Kapsamlı belgeler ve basit bir API, giriş engelini azaltır.
- Performans Dengesi: Otonom sürüş ve güvenlik gözetimi gibi uygulamalar için çok önemli olan yüksek doğruluk ve gerçek zamanlı hızın "altın oranını" sağlar.
- İyi Bakımlı Ekosistem: Sık güncellemeler, Discord üzerinden topluluk desteği ve Ultralytics ve Weights & Biases gibi araçlarla sorunsuz entegrasyon, projenizin geleceğe hazır olmasını sağlar.
- Dağıtım Hazır: ONNX'e yerel dışa aktarım desteği ile ONNX, OpenVINOve CoreML yerel dışa aktarım desteği sayesinde prototipten üretime geçiş zahmetsizdir.
Ultralytics ailesindeki diğer yüksek performanslı seçeneklerle ilgilenen kullanıcılar için, önceki nesil YOLO11 güçlü bir seçenek olmaya devam ederken, RT-DETR , küresel bağlamın çok önemli olduğu senaryolar için mükemmel transformatör tabanlı yetenekler sunar.