EfficientDet ve YOLOv7: Gerçek Zamanlı Nesne Algılama Mimarilerinde Gezinmek
En etkili sinir ağı mimarisini seçmek, herhangi bir bilgisayar görüşü girişiminin başarısı için kritik öneme sahiptir. Yüksek performanslı yapay zeka çözümlerine olan talep hızlandıkça, EfficientDet ve YOLOv7 gibi köklü modelleri karşılaştırmak, hem doğruluğu hem de hesaplama verimliliğini optimize etmeyi hedefleyen geliştiriciler için vazgeçilmez hale gelmektedir.
Bu kapsamlı teknik analiz, her iki modelin mimari nüanslarını, performans metriklerini ve ideal dağıtım senaryolarını incelemektedir. Ayrıca, Ultralytics tarafından sağlanan entegre ekosistemin – en son teknoloji Ultralytics YOLO26 ile doruğa ulaşan – modern bilgisayar görüşü görevleri için neden üstün bir alternatif sunduğunu açıklayacağız.
EfficientDet'i Anlamak
EfficientDet, çeşitli kaynak kısıtlamalarında hesaplama maliyetlerini sistematik olarak yönetirken doğruluğu en üst düzeye çıkarmak için tasarlanmıştır. Bunu, ölçeklendirme ve özellik birleştirme konusunda yeni bir yaklaşımla başarmıştır.
EfficientDet Detayları:
Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
Kuruluş: Google
Tarih: 2019-11-20
Arxiv: EfficientDet: Ölçeklenebilir ve Verimli Nesne Algılama
GitHub: Google AutoML Deposu
Mimari ve Yenilikler
Özünde, EfficientDet Çift Yönlü Özellik Piramit Ağı (BiFPN) kullanır. Geleneksel FPN'lerin aksine, BiFPN, farklı giriş özelliklerinin önemini öğrenmek için öğrenilebilir ağırlıklar ekleyerek kolay ve hızlı çok ölçekli özellik füzyonuna olanak tanır. Bu, omurga, özellik ağı ve kutu/sınıf tahmin ağlarının çözünürlüğünü, derinliğini ve genişliğini eş zamanlı olarak tekdüze bir şekilde ölçeklendiren bileşik bir ölçekleme yöntemiyle birleştirilmiştir.
Güçlü ve Zayıf Yönler
EfficientDet oldukça ölçeklenebilirdir. Daha küçük varyantları (d0-d2) son derece parametre verimlidir, bu da onları katı depolama sınırlamaları olan ortamlar için uygun hale getirir. Daha büyük varyantlar (d7 gibi), üst düzey çevrimdışı işleme için ortalama Hassasiyet (mAP) sınırlarını zorlar.
Ancak, EfficientDet eski TensorFlow uygulamalarına ve karmaşık AutoML işlem hatlarına büyük ölçüde bağımlıdır. Bu eski altyapı, onu modern PyTorch merkezli iş akışlarına entegre etmeyi oldukça zorlaştırır. Ayrıca, daha yüksek doğruluk varyantlarına ölçeklendirildiğinde kenar cihazlarda önemli çıkarım gecikmesi yaşar.
EfficientDet hakkında daha fazla bilgi edinin
YOLOv7'yi Anlamak
2022'de tanıtılan YOLOv7, gerçek zamanlı uygulamalar için hız ve doğrulukta büyük bir sıçrama getirerek, o dönemde yaygın olarak popüler olan YOLO ailesi için yeni bir temel oluşturdu.
YOLOv7 Detayları:
Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş: Bilgi Bilimi Enstitüsü, Academia Sinica, Tayvan
Tarih: 2022-07-06
Arxiv: YOLOv7: Eğitilebilir 'bag-of-freebies' gerçek zamanlı nesne dedektörleri için yeni bir son teknoloji belirliyor
GitHub: Resmi YOLOv7 Deposu
Mimari ve Yenilikler
YOLOv7, Genişletilmiş Verimli Katman Birleştirme Ağı'nı (E-ELAN) tanıttı. Bu mimari iyileştirme, orijinal gradyan yolunu bozmadan ağın öğrenme yeteneğini geliştirir ve modelin daha çeşitli özellikleri verimli bir şekilde öğrenmesini sağlar. Ek olarak, planlı yeniden parametrelendirme ve dinamik etiket ataması gibi tekniklerden yararlanarak çıkarım maliyetini artırmadan doğruluğu artıran "eğitilebilir bir bag-of-freebies" uygular.
Güçlü ve Zayıf Yönler
YOLOv7, video analizi ve yüksek hızlı robotik navigasyon gibi gerçek zamanlı senaryolarda üstündür. Sunucu sınıfı GPU'larda olağanüstü iyi ölçeklenir ve yerel bir PyTorch uygulaması sunarak akademik araştırmacılar için erişilebilir kılar.
Etkileyici hızına rağmen, YOLOv7 hala işlem sonrası için Non-Maximum Suppression (NMS) kullanır, bu da kalabalık sahnelerde değişken gecikmeye neden olabilir. Ayrıca, eğitim sırasındaki bellek ayak izi yeni nesillere göre belirgin şekilde daha büyüktür ve büyük yığın boyutlarını işlemek için daha sağlam donanım gerektirir.
YOLOv7 hakkında daha fazla bilgi edinin.
Performans ve Metrik Karşılaştırması
Bu modelleri karşılaştırırken, hassasiyet, çıkarım hızı ve parametre boyutu arasındaki dengeyi incelemek hayati önem taşır. Aşağıda, çeşitli EfficientDet ve YOLOv7 konfigürasyonlarının ayrıntılı bir değerlendirmesi bulunmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Performans Çıkarımı
EfficientDet-d7 en yüksek mAP'yi elde etse de, bir T4 GPU'da yaklaşık 128 ms gerektirir. Buna karşılık, YOLOv7x, inanılmaz hızlı 11.57 ms'de karşılaştırılabilir 53.1 mAP elde ederek, gerçek zamanlı dağıtımlar için hesaplama verimliliğinde büyük bir nesilsel sıçrama sergiler.
Kullanım Durumları ve Öneriler
EfficientDet ve YOLOv7 arasında seçim yapmak, projenizin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerinize bağlıdır.
Ne Zaman EfficientDet Seçmeli
EfficientDet, aşağıdaki durumlar için güçlü bir seçimdir:
- Google Cloud ve TPU İş Akışları: EfficientDet'in yerel optimizasyona sahip olduğu Google Cloud Vision API'leri veya TPU altyapısı ile derinlemesine entegre sistemler.
- Bileşik Ölçekleme Araştırması: Dengeli ağ derinliği, genişliği ve çözünürlük ölçeklemesinin etkilerini incelemeye odaklanan akademik kıyaslama.
- TFLite aracılığıyla Mobil Dağıtım: Android veya gömülü Linux cihazları için özellikle TensorFlow Lite dışa aktarımı gerektiren projeler.
YOLOv7 Ne Zaman Tercih Edilmeli?
YOLOv7 için önerilir:
- Akademik Kıyaslama: 2022 dönemi son teknoloji sonuçlarını yeniden üretmek veya E-ELAN ve eğitilebilir 'bag-of-freebies' tekniklerinin etkilerini incelemek.
- Yeniden Parametrelendirme Araştırması: Planlı yeniden parametrelendirilmiş evrişimleri ve bileşik model ölçekleme stratejilerini araştırmak.
- Mevcut Özel İşlem Hatları: YOLOv7'nin özel mimarisi etrafında inşa edilmiş, yoğun şekilde özelleştirilmiş ve kolayca yeniden düzenlenemeyen işlem hatlarına sahip projeler.
Ultralytics (YOLO26) Ne Zaman Seçilmeli
Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Ultralytics'in Avantajı
Doğru mimariyi seçmek sadece ham metriklerin ötesine geçer; tüm makine öğrenimi yaşam döngüsünü değerlendirmeyi içerir. Ultralytics ekosistemi, eşsiz bir geliştirici deneyimi sunarak sağlam yapay zeka dağıtımları için giriş engelini önemli ölçüde düşürür.
- Kullanım Kolaylığı: Ultralytics, yüksek düzeyde birleştirilmiş bir Python API'si sunar. Geliştiriciler, yalnızca birkaç satır kodla modelleri eğitebilir, doğrulayabilir ve dışa aktarabilir; bu da EfficientDet'e özgü karmaşık, parçalanmış kod tabanlarını yönetme ihtiyacını ortadan kaldırır.
- İyi Yönetilen Ekosistem: Hızlı güncellemelerden, kapsamlı dokümantasyondan ve aktif bir topluluktan faydalanarak, Ultralytics, TensorRT ve OpenVINO gibi en yeni dağıtım çerçeveleriyle uyumluluğu sağlar.
- Bellek Gereksinimleri: Yüksek düzeyde optimize edilmiş PyTorch veri yükleyicilerini ve modernleştirilmiş ağ yapılarını kullanarak, Ultralytics YOLO modelleri, çok dallı ağlara ve transformatör ağırlıklı modellere kıyasla eğitim sırasında önemli ölçüde daha az CUDA belleği gerektirir.
- Çok Yönlülük: Sıkı bir şekilde sınırlayıcı kutu algılamaya bağlı eski mimarilerin aksine, Ultralytics modelleri, Örnek Segmentasyon, Poz Tahmini ve Yönlendirilmiş Sınırlayıcı Kutular (OBB) gibi çok görevli güç merkezleridir.
Ultralytics ile Eğitim Verimliliği
Aşağıdaki kod, Ultralytics Python paketini kullanarak son teknoloji bir modeli eğitmenin basitliğini göstermektedir; bu, eski TensorFlow işlem hatlarını yapılandırmanın aksine büyük bir fark yaratır.
from ultralytics import YOLO
# Load the highly recommended YOLO26 model
model = YOLO("yolo26s.pt")
# Train the model automatically handling hyperparameter tuning and augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the model to TensorRT for deployment
model.export(format="engine")
Yeni Standart: YOLO26
YOLOv7 ve EfficientDet modern bilgisayar görüşünün temelini atsa da, ocak 2026'da Ultralytics YOLO26'nın tanıtılmasıyla manzara önemli ölçüde değişti. Hem aşırı doğruluk hem de eşsiz kenar performansı için tasarlanan YOLO26, tüm yeni görüntü işleme projeleri için nihai öneridir.
Temel YOLO26 Yenilikleri
- Uçtan Uca NMS'siz Tasarım: YOLOv10'un attığı temeller üzerine inşa edilen YOLO26 doğal olarak uçtan uca bir yapıya sahiptir. Non-Maximum Suppression (NMS) işlem sonrası adımını tamamen ortadan kaldırarak, daha düşük, daha tutarlı gecikme sunar; bu da otonom sürüş gibi güvenliğin kritik olduğu sistemler için hayati öneme sahiptir.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Distribution Focal Loss (DFL) kaldırılması sayesinde, YOLO26 önemli ölçüde basitleştirilmiş bir dışa aktarma sürecine ve Raspberry Pi gibi uç cihazlarda eşsiz bir hıza sahiptir, bu da onu uç bilişimin tartışmasız şampiyonu yapmaktadır.
- MuSGD Optimizasyonu: YOLO26, Moonshot AI'dan LLM eğitim yeniliklerinden ilham alan SGD ve Muon'un bir hibriti olan devrim niteliğindeki MuSGD Optimizasyonunu bünyesinde barındırır. Bu, oldukça kararlı eğitim dinamiklerine ve çok daha hızlı yakınsama oranlarına yol açar.
- ProgLoss + STAL: Progressive Loss ve Scale-Targeted Alignment Loss entegrasyonu, modelin küçük nesneleri detect etme yeteneğini büyük ölçüde geliştirerek drone görüntüleri ve güvenlik alarm sistemleri için büyük bir sorun noktasını çözmektedir.
- Göreve Özel İyileştirmeler: YOLO26 sadece bir detectör değildir. Kusursuz segmentation için Semantik segmentation kaybı ve çok ölçekli protoya, hiper-doğru pose tracking için Residual Log-Likelihood Estimation (RLE)'ye ve obb sınır belirsizliklerini çözmek için özelleşmiş açı kaybına sahiptir.
YOLO26 hakkında daha fazla bilgi edinin
Alternatif Modelleri Keşfetmek
YOLO26 mevcut teknolojinin zirvesini temsil etse de, Ultralytics ekosistemi, farklı kullanım durumlarına göre uyarlanmış çeşitli modelleri destekler.
Geleneksel anchor-free ölçeklendirme gerektiren eski sistemleri yöneten geliştiriciler için YOLO11, Ultralytics platformunda sağlam, yüksek düzeyde desteklenen bir seçenek olmaya devam etmektedir. Ek olarak, açıkça transformer tabanlı mimariler gerektiren senaryolar için RT-DETR, vizyon transformerlarını kullanarak gerçek zamanlı detect sunar ve üst düzey dikkat mekanizmaları ile gerçek zamanlı yürütme hızları arasındaki boşluğu kapatır.
Sonuç olarak, EfficientDet bileşik ölçeklendirme hakkında akademik bilgiler sağlarken ve YOLOv7 güçlü temel gerçek zamanlı performans sunarken, modern işletmelerin Ultralytics Platformu'nu benimsemesi en iyi hizmeti sağlar. YOLO26'yı kullanarak ekipler, maksimum performans, minimum eğitim sürtünmesi sağlayabilir ve yapay zeka dağıtımlarını geleceğe hazır hale getirebilirler.