EfficientDet ile YOLOv5: Kapsamlı Bir Teknik Karşılaştırma
En uygun sinir ağı mimarisini seçmek, herhangi bir bilgisayarlı görü girişiminde belirleyici bir adımdır. Çıkarım gecikmesi, parametre verimliliği ve tespit doğruluğu arasındaki denge, bir modelin gerçek dünyada ne kadar iyi performans göstereceğini belirler. Bu kapsamlı teknik rehber, oldukça etkili iki nesne tespiti çerçevesinin derinlemesine analizini sunar: Google'ın EfficientDet'i ve Ultralytics YOLOv5.
Mimari yeniliklerini, eğitim metodolojilerini ve dağıtım yeteneklerini karşılaştırarak, geliştiriciler ister bulut sunucuları genelinde ölçeklendiriyor olsunlar ister kısıtlı uç cihazlarda çalıştırıyor olsunlar, kendi özel dağıtım ortamları için bilinçli kararlar alabilirler.
EfficientDet: BiFPN ile Ölçeklenebilir Mimari
Google Research tarafından sunulan EfficientDet, önceki en gelişmiş modellere kıyasla daha az parametreyle yüksek doğruluk elde etmek için hem omurgayı (backbone) hem de özellik ağını sistematik olarak ölçeklendirecek şekilde tasarlanmıştır.
Model Detayları
- Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
- Organizasyon: Google Research
- Tarih: 20 Kasım 2019
- Arxiv: EfficientDet: Scalable and Efficient Object Detection
- GitHub: google/automl/efficientdet
Mimari Yenilikler
EfficientDet, omurgası olarak EfficientNet sınıflandırma modelinden yararlanır ve ağ genişliğini, derinliğini ve çözünürlüğünü düzenli olarak ölçeklendiren bir bileşik ölçekleme yöntemi kullanır. Nesne tespiti alanına en önemli katkısı, Çift Yönlü Özellik Piramidi Ağı'nın (BiFPN) tanıtılmasıdır. Özellikleri basitçe yukarıdan aşağıya toplayan standart Özellik Piramidi Ağlarının aksine, BiFPN karmaşık, çift yönlü ölçekler arası bağlantılara izin verir ve farklı girdi özelliklerinin önemini belirlemek için öğrenilebilir ağırlıklar sunar.
Yüksek doğrulukta olmasına rağmen, EfficientDet büyük ölçüde TensorFlow ekosistemine ve belirli AutoML kütüphanelerine bağımlıdır. Bu bağımlılık, bazen onu özel, hafif dağıtım boru hatlarına veya dinamik hesaplama grafiklerini tercih eden ortamlara entegre etmeyi zahmetli hale getirebilir.
EfficientDet hakkında daha fazla bilgi edinin
Ultralytics YOLOv5: Gerçek Zamanlı Yapay Zekayı Demokratikleştirmek
EfficientDet'ten kısa bir süre sonra piyasaya sürülen Ultralytics YOLOv5, YOLO mimarisinin inanılmaz derecede erişilebilir ve yerel bir PyTorch uygulamasını sunarak endüstride devrim yarattı. Geliştirici deneyimi, eğitim verimliliği ve gerçek zamanlı dağıtım esnekliği için yeni bir standart belirledi.
Model Detayları
- Yazarlar: Glenn Jocher
- Organizasyon: Ultralytics
- Tarih: 26 Haziran 2020
- GitHub: ultralytics/yolov5
- Dokümanlar: YOLOv5 Dokümantasyonu
Mimari Yenilikler
YOLOv5, öncekilere göre önemli yükseltmeler getirdi ve toplam parametre sayısını azaltırken gradyan akışını önemli ölçüde artıran bir CSPDarknet (Cross-Stage Partial) omurga kullandı. Ayrıca YOLOv5, manuel hiperparametre ayarlama ihtiyacını ortadan kaldırarak, özel eğitim verilerine dayanarak en uygun sınırlayıcı kutu (bounding box) öncüllerini otomatik olarak hesaplayan Otomatik Öğrenen Çapa Kutuları (Auto-Learning Anchor Boxes) içerir.
YOLOv5 ayrıca, dört farklı görüntüyü tek bir eğitim döşemesinde birleştiren Mosaic Veri Artırma yöntemini yoğun bir şekilde kullanır. Bu, modelin küçük nesneleri tespit etme yeteneğini büyük ölçüde geliştirir ve bağlamsal anlayışı genelleştirerek onu çeşitli ortamlarda oldukça sağlam kılar.
YOLOv5 hakkında daha fazla bilgi edin
Performans ve Kıyaslamalar
Modelleri COCO veri kümesi gibi standart kıyaslamalarda değerlendirmek, hassasiyet ve hız arasındaki dengeyi anlamak için çok önemlidir. Aşağıdaki tablo, farklı boyutlardaki EfficientDet ve YOLOv5 modellerinin standartlaştırılmış koşullar altında nasıl performans gösterdiğini göstermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametre (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Ödünleşimlerin Analizi
EfficientDet-d7, 53.7 mAP gibi etkileyici bir tepe değerine ölçeklenebilse de, GPU donanımında YOLO mimarilerine kıyasla ciddi bir çıkarım gecikmesi sorunu yaşar. Buna karşılık, YOLOv5 donanım hızlandırmada mükemmeldir. YOLOv5n varyantı, NVIDIA TensorRT kullanılarak T4 GPU üzerinde 1.12 ms gibi şaşırtıcı derecede hızlı bir çıkarım süresine ulaşır, bu da onu otonom sürüş veya yüksek hızlı üretim hatları gibi gerçek zamanlı uygulamalar için çok daha üstün kılar.
Ek olarak, YOLOv5 modelleri, karmaşık bileşik ölçekli ağlara veya büyük Transformer modellerine kıyasla eğitim sırasında çok daha düşük CUDA bellek gereksinimleri gösterir. Bu yalın bellek profili, araştırmacıların standart tüketici donanımları üzerinde sağlam modeller eğitmelerine olanak tanıyarak en gelişmiş yapay zekaya erişimi demokratikleştirir.
YOLOv5 modelinden uç cihazlarda maksimum saniye başına kare (FPS) değerini almak için, PyTorch ağırlıklarını NVIDIA GPU'lar için TensorRT'ye veya Intel CPU'lar için OpenVINO formatına dışa aktar. Bu adım genellikle çıkarım hızını ikiye katlayabilir.
Eğitim Ekosistemi ve Geliştirici Deneyimi
Ultralytics ekosisteminin gerçek avantajı, akıcı kullanıcı deneyiminde yatar. EfficientDet, TensorFlow nesne tespiti API'si hakkında derin bilgi gerektirirken, YOLOv5 tutarlı ve basit bir Python API'si sunar.
Bakımı sürekli yapılan Ultralytics ekosistemi, geliştiricilerin sık güncellenmelere, aktif topluluk desteğine ve Weights & Biases ile ClearML gibi deney izleme araçlarıyla sorunsuz entegrasyonlara sahip olmasını sağlar.
Kod Örneği: YOLOv5 ile Başlangıç
Önceden eğitilmiş bir YOLOv5 modeliyle çıkarım çalıştırmak, PyTorch Hub aracılığıyla sadece birkaç satır kod gerektirir:
from ultralytics import YOLO
# Load the highly efficient YOLOv5s model
model = YOLO("yolov5su.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")
# Display the detected bounding boxes
results[0].show()Çok Yönlülük ve Gerçek Dünya Uygulamaları
EfficientDet kesinlikle bir nesne tespiti çerçevesidir, bu da karmaşık görü boru hatlarındaki kullanımını sınırlar. Öte yandan YOLOv5, birden fazla bilgisayarlı görü görevini destekleyecek şekilde evrimleşmiştir. Modelin modern sürümleri, son derece hassas örnek bölütleme ve görüntü sınıflandırma görevlerini destekleyerek geliştiricilerin makine öğrenimi yığınlarını konsolide etmelerine olanak tanır.
İdeal Kullanım Durumları
- EfficientDet: Maksimum doğruluğun gecikmeye göre önceliklendirildiği ve sunucu sınıfı TPU'ların veya yüksek bellekli GPU'ların mevcut olduğu çevrimdışı işleme, akademik araştırma ve bulut tabanlı analitik için en uygun olanıdır.
- YOLOv5: Uç yapay zeka dağıtımları için kesin tercihtir. Düşük gecikme süresi, küçük parametre ayak izi ve yüksek doğruluk kombinasyonu, onu dron analitiği, gerçek zamanlı perakende otomasyonu ve CoreML veya TFLite aracılığıyla mobil uygulamalar için ideal kılar.
Yeni Nesil: YOLO26'ya Yükseltme
YOLOv5 sağlam ve yaygın olarak dağıtılan bir model olmaya devam etse de, yapay zeka alanı hızla ilerlemektedir. Yeni projelere başlayan veya modern performansın zirvesini arayan ekipler için Ultralytics, Ocak 2026'da piyasaya sürülen YOLO26 modelini tanıttı.
YOLO26, hız ve doğruluk Pareto sınırını yeniden tanımlıyor ve dağıtımı daha kolay, çıkarımı daha hızlı hale getiren çığır açan mimari değişiklikler getiriyor.
Önemli YOLO26 İlerlemeleri
- Uçtan Uca NMS'siz Tasarım: YOLO26, Non-Maximum Suppression (NMS) işlem sonrası adımlarını yerel olarak ortadan kaldırır. Bu, dağıtım mantığını büyük ölçüde basitleştirir ve gecikme varyansını azaltır; bu, YOLOv10'daki erken deneylerden rafine edilmiş çığır açan bir yaklaşımdır.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Özel GPU'lar olmadan çalışan uç bilişim ve düşük güçlü IoT cihazları için özel olarak tasarlanmıştır.
- MuSGD Optimize Edici: Büyük dil modeli eğitim tekniklerinden (Moonshot AI'nın Kimi K2'si gibi) esinlenen bu SGD ve Muon melezi, LLM yeniliklerini bilgisayarlı görüye getirerek daha hızlı yakınsama ve oldukça kararlı eğitim dinamikleri sağlar.
- ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, hava görüntüleri ve robotik için kritik olan küçük nesne tanımada kayda değer iyileştirmeler sağlar.
- DFL Kaldırma: Distribution Focal Loss (DFL) çıkarılarak, model başlığı büyük ölçüde basitleştirilir, bu da eski veya oldukça kısıtlı uç donanımlara dışa aktarırken daha iyi uyumluluk sağlar.
Çok görevli boru hatları dağıtan ekipler için YOLO26, bölütleme için çok ölçekli proto ve yönlendirilmiş sınırlayıcı kutular (OBB) için özel açı kaybı gibi göreve özgü yükseltmeler de sunar. Ekosistemdeki diğer modern alternatifleri keşfetmek için YOLO11 veya YOLOv8 mimarisini de inceleyebilirsin.
Sonuç
EfficientDet ile YOLOv5 arasında seçim yapmak büyük ölçüde dağıtım hedefine bağlıdır. EfficientDet, bulut odaklı çıkarım için uygun, matematiksel olarak zarif bir ölçekleme yaklaşımı sunar. Ancak, YOLOv5'in üstün geliştirici deneyimi, son derece hızlı PyTorch eğitim döngüleri ve yüksek düzeyde optimize edilmiş uç dağıtım yetenekleri, onu gerçek dünyadaki gerçek zamanlı uygulamaların büyük çoğunluğu için tercih edilen seçenek haline getirir. Ultralytics tarafından sağlanan kapsamlı araçlardan yararlanarak ekipler, pazara sunma sürelerini kısaltabilir ve son derece duyarlı yapay zeka sistemleri oluşturabilirler.