EfficientDet ve YOLOv5 Karşılaştırması: Kapsamlı Bir Teknik Karşılaştırma
Optimal sinir ağı mimarisini seçmek, herhangi bir bilgisayar görüşü girişiminde belirleyici bir adımdır. Çıkarım gecikmesi, parametre verimliliği ve algılama doğruluğu arasındaki denge, bir modelin gerçek dünyada ne kadar iyi performans göstereceğini belirler. Bu kapsamlı teknik kılavuz, iki son derece etkili nesne algılama çerçevesinin derinlemesine bir analizini sunmaktadır: Google'ın EfficientDet'i ve Ultralytics YOLOv5.
Mimari yeniliklerini, eğitim metodolojilerini ve dağıtım yeteneklerini karşılaştırarak, geliştiriciler bulut sunucularında ölçeklendirme veya kısıtlı kenar cihazlarda çalıştırma gibi kendi özel dağıtım ortamları için bilinçli kararlar verebilirler.
EfficientDet: BiFPN ile Ölçeklenebilir Mimari
Google Research tarafından tanıtılan EfficientDet, önceki son teknoloji modellere göre daha az parametreyle yüksek doğruluk elde etmek üzere hem backbone'u hem de özellik ağını sistematik olarak ölçeklendirmek için tasarlanmıştır.
Model Detayları
- Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
- Kuruluş:Google Research
- Tarih: 20 Kasım 2019
- Arxiv:EfficientDet: Ölçeklenebilir ve Verimli Nesne Algılama
- GitHub:google/automl/efficientdet
Mimari Yenilikler
EfficientDet, EfficientNet sınıflandırma modelini backbone olarak kullanır ve ağ genişliğini, derinliğini ve çözünürlüğünü tekdüze bir şekilde ölçeklendiren bileşik bir ölçeklendirme yöntemi kullanır. Nesne algılama alanındaki en önemli katkısı, Çift Yönlü Özellik Piramit Ağı (BiFPN) tanıtımıdır. Özellikleri yalnızca yukarıdan aşağıya toplayan standart Özellik Piramit Ağlarının aksine, BiFPN karmaşık, çift yönlü çapraz ölçekli bağlantılara izin verir ve farklı giriş özelliklerinin önemini belirlemek için öğrenilebilir ağırlıklar sunar.
Yüksek doğrulukta olmasına rağmen, EfficientDet büyük ölçüde TensorFlow ekosistemine ve belirli AutoML kütüphanelerine dayanır. Bu bağımlılık, bazen özel, hafif dağıtım hatlarına veya dinamik hesaplama grafiklerini tercih eden ortamlara entegrasyonu zahmetli hale getirebilir.
EfficientDet hakkında daha fazla bilgi edinin
Ultralytics YOLOv5: Gerçek Zamanlı Yapay Zekayı Demokratikleştirme
EfficientDet'ten kısa bir süre sonra piyasaya sürülen Ultralytics YOLOv5, YOLO mimarisinin inanılmaz derecede erişilebilir, yerel bir PyTorch uygulamasını sunarak sektöre devrim niteliğinde bir yenilik getirdi. Geliştirici deneyimi, eğitim verimliliği ve gerçek zamanlı dağıtım esnekliği için yeni bir standart belirledi.
Model Detayları
- Yazarlar: Glenn Jocher
- Kuruluş:Ultralytics
- Tarih: 26 Haziran 2020
- GitHub:ultralytics/yolov5
- Belgeler:YOLOv5 Belgeleri
Mimari Yenilikler
YOLOv5, önceki sürümlerine göre önemli yükseltmeler getirdi; genel parametre sayısını azaltırken gradyan akışını önemli ölçüde artıran bir CSPDarknet (Çapraz Aşama Kısmi) backbone'u kullanır. Ayrıca, YOLOv5, belirli özel eğitim verilerinize göre optimal sınırlayıcı kutu öncüllerini otomatik olarak hesaplayan Otomatik Öğrenen Anchor Kutularını içerir ve manuel hiperparametre ayarlama ihtiyacını ortadan kaldırır.
YOLOv5 ayrıca, dört farklı görüntüyü tek bir eğitim döşemesine harmanlayarak Mozaik Veri Artırma yöntemini yoğun bir şekilde kullanır. Bu, modelin küçük nesneleri detect etme yeteneğini büyük ölçüde geliştirir ve bağlamsal anlayışı genelleştirerek onu çeşitli ortamlarda oldukça sağlam hale getirir.
YOLOv5 hakkında daha fazla bilgi edinin.
Performans ve Kıyaslamalar
COCO veri kümesi gibi standart kıyaslamalarda modelleri değerlendirmek, hassasiyet ve hız arasındaki dengeleri anlamak için çok önemlidir. Aşağıdaki tablo, EfficientDet ve YOLOv5'in farklı boyutlarının standartlaştırılmış koşullar altında nasıl performans gösterdiğini göstermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Dengelerin Analizi
EfficientDet-d7 etkileyici bir 53.7'lik zirve mAP'ye ölçeklenirken, YOLO mimarilerine kıyasla GPU donanımında önemli çıkarım gecikmesi yaşar. Tersine, YOLOv5 donanım hızlandırmada üstündür. YOLOv5n varyantı, bir T4 GPU üzerinde NVIDIA TensorRT kullanarak şaşırtıcı derecede hızlı 1.12 ms çıkarım süresi elde eder, bu da onu otonom sürüş veya yüksek hızlı üretim hatları gibi gerçek zamanlı uygulamalar için çok daha üstün kılar.
Ek olarak, YOLOv5 modelleri, karmaşık bileşik ölçekli ağlara veya büyük transformer modellerine kıyasla eğitim sırasında çok daha düşük CUDA bellek gereksinimleri gösterir. Bu düşük bellek profili, son teknoloji yapay zekaya erişimi demokratikleştirerek araştırmacıların standart tüketici donanımlarında sağlam modeller eğitmesine olanak tanır.
Donanım Verimliliğini En Üst Düzeye Çıkarma
Kenar cihazlarda YOLOv5 modelinizden maksimum kare/saniye (FPS) elde etmek için, PyTorch ağırlıklarınızı NVIDIA GPU'lar için TensorRT'ye veya Intel CPU'lar için OpenVINO'ya aktarın. Bu adım genellikle çıkarım hızınızı iki katına çıkarabilir.
Eğitim Ekosistemi ve Geliştirici Deneyimi
Ultralytics ekosisteminin gerçek avantajı, kolaylaştırılmış kullanıcı deneyiminde yatmaktadır. EfficientDet, TensorFlow nesne algılama API'si hakkında derinlemesine bilgi gerektirirken, YOLOv5 tutarlı, basit bir Python API'si sunar.
İyi yönetilen Ultralytics ekosistemi, geliştiricilerin sık güncellemeler, aktif topluluk desteği ve Weights & Biases ile ClearML gibi deney takip araçlarıyla sorunsuz entegrasyonlara erişimini sağlar.
Kod Örneği: YOLOv5 ile Başlarken
Önceden eğitilmiş bir YOLOv5 modeliyle çıkarım yapmak, PyTorch Hub aracılığıyla yalnızca birkaç satır kod gerektirir:
from ultralytics import YOLO
# Load the highly efficient YOLOv5s model
model = YOLO("yolov5su.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")
# Display the detected bounding boxes
results[0].show()
Çok Yönlülük ve Gerçek Dünya Uygulamaları
EfficientDet, karmaşık görüntü işleme hatlarındaki kullanışlılığını sınırlayan katı bir nesne algılama çerçevesidir. Öte yandan, YOLOv5 birden fazla bilgisayar görüşü görevini destekleyecek şekilde evrilmiştir. Modelin modern sürümleri, yüksek doğrulukta örnek segmentasyonu ve görüntü sınıflandırmayı destekleyerek geliştiricilerin makine öğrenimi yığınlarını birleştirmesine olanak tanır.
İdeal Kullanım Senaryoları
- EfficientDet: Gecikme yerine maksimum doğruluğun önceliklendirildiği ve sunucu sınıfı TPUs veya yüksek belleğe sahip GPUs'ların bulunduğu çevrimdışı işleme, akademik araştırma ve bulut tabanlı analizler için en uygunudur.
- YOLOv5: Uç yapay zeka dağıtımları için kesin seçimdir. Düşük gecikme, küçük parametre ayak izi ve yüksek doğruluk kombinasyonu, onu drone analizi, gerçek zamanlı perakende otomasyonu ve CoreML veya TFLite aracılığıyla mobil uygulamalar için ideal kılar.
Yeni Nesil: YOLO26'ya Yükseltme
YOLOv5 sağlam ve yaygın olarak kullanılan bir model olmaya devam etse de, yapay zeka alanı hızla ilerlemektedir. Yeni projelere başlayan veya modern performansın mutlak zirvesini arayan ekipler için Ultralytics, Ocak 2026'da piyasaya sürülen YOLO26'yı tanıttı.
YOLO26, hız ve doğruluk Pareto sınırını yeniden tanımlayarak, dağıtımı kolaylaştıran ve çıkarımı hızlandıran çığır açan mimari değişiklikler sunuyor.
Önemli YOLO26 Gelişmeleri
- Uçtan Uca NMS-Serbest Tasarım: YOLO26, Non-Maximum Suppression son işleme adımını doğal olarak ortadan kaldırır. Bu, dağıtım mantığını büyük ölçüde basitleştirir ve gecikme varyansını azaltır; YOLOv10'daki erken deneylerden geliştirilen çığır açan bir yaklaşımdır.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Uç bilişim ve özel GPUs olmadan çalışan düşük güçlü IoT cihazları için özel olarak tasarlanmıştır.
- MuSGD Optimizatörü: Büyük dil modeli eğitim tekniklerinden (Moonshot AI'nin Kimi K2'si gibi) ilham alan SGD ve Muon'un bu hibriti, LLM yeniliklerini bilgisayar görüşüne taşıyarak daha hızlı yakınsama ve oldukça kararlı eğitim dinamikleri sağlıyor.
- ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, küçük nesne tanımada dikkate değer iyileşmeler sağlar; bu da hava görüntüleme ve robotik için kritik öneme sahiptir.
- DFL Kaldırma: Distribution Focal Loss'un çıkarılmasıyla, model başlığı büyük ölçüde basitleştirilir ve bu da eski veya oldukça kısıtlı uç donanımlara dışa aktarırken daha iyi uyumluluk sağlar.
Çok görevli işlem hatları dağıtan ekipler için YOLO26, segmentasyon için çok ölçekli proto ve yönlendirilmiş sınırlayıcı kutular (OBB) için özel açı kaybı gibi göreve özel yükseltmeler de sunar. Ekosistemdeki diğer modern alternatifleri keşfetmek için ayrıca YOLO11 veya YOLOv8 mimarisini de inceleyebilirsiniz.
Sonuç
EfficientDet ve YOLOv5 arasında seçim yapmak, dağıtım hedefinize büyük ölçüde bağlıdır. EfficientDet, bulut yoğun çıkarım için uygun, matematiksel olarak zarif bir ölçekleme yaklaşımı sunar. Ancak, YOLOv5'in üstün geliştirici deneyimi, son derece hızlı PyTorch eğitim döngüleri ve yüksek düzeyde optimize edilmiş uç dağıtım yetenekleri, onu gerçek dünya, gerçek zamanlı uygulamaların büyük çoğunluğu için tercih edilen seçenek haline getirir. Ultralytics tarafından sağlanan kapsamlı araçlardan yararlanarak ekipler, pazara çıkış sürelerini hızlandırabilir ve yüksek düzeyde duyarlı yapay zeka sistemleri oluşturabilir.