EfficientDet ve YOLOv9: Mimari ve Performans Karşılaştırması
Hızla gelişen bilgisayar görme alanında, doğru nesne algılama mimarisini seçmek, eğitim maliyetlerinden dağıtım gecikmesine kadar her şeyi etkileyen kritik bir karardır. Bu teknik analiz, verimli ölçeklendirmeye Google öncü mimarisi EfficientDet ile YOLOv9, üstün özellik öğrenimi için programlanabilir gradyan bilgisi sunan YOLO modern bir versiyonu.
Yönetici Özeti
EfficientDet, model ölçeklendirme ve özellik birleştirme konusunda çığır açan kavramlar getirmiş olsa da, artık eski bir mimari olarak kabul edilmektedir. Karmaşık BiFPN katmanlarına bağımlılığı, YOLO modern donanımlarda daha hızlı çalışan tasarımlarına kıyasla genellikle daha yavaş çıkarım hızlarına yol açmaktadır.
YOLOv9 önemli bir ilerlemeyi temsil eder ve çok daha üstün çıkarım hızlarıyla daha yüksek doğruluk sunar. Ayrıca, Ultralytics bir parçası olarak YOLOv9 , birleşik API, basitleştirilmiş dağıtım ve sağlam topluluk desteğinden YOLOv9 , bu da onu üretim ortamları için önerilen seçim haline getirir.
EfficientDet: Ölçeklenebilir ve Verimli Nesne Algılama
EfficientDet, nesne algılayıcılarının ölçeklendirilmesi sorununu verimli bir şekilde çözmek için tasarlanmıştır. Önceki modeller genellikle backbone suretiyle ölçeklendirme yapıyordu ve bu da çözünürlük, derinlik ve genişlik arasındaki dengeyi göz ardı ediyordu.
Temel Mimari Özellikler
- Bileşik Ölçeklendirme: EfficientDet, tüm backbone, özellik ağı ve kutu/sınıf tahmin ağları için çözünürlüğü, derinliği ve genişliği eşit şekilde ölçeklendiren bir bileşik ölçeklendirme yöntemi önerir.
- BiFPN (Çift Yönlü Özellik Piramit Ağı): Çok ölçekli özelliklerin kolayca birleştirilmesini sağlayan önemli bir yenilik. Geleneksel FPN'lerden farklı olarak, BiFPN aşağıdan yukarıya doğru yollar ekler ve yalnızca bir girişi olan düğümleri kaldırır, farklı giriş özelliklerinin önemini anlamak için öğrenilebilir ağırlıklar ekler.
- EfficientNet Backbone: Parametre verimliliği için optimize edilmiş EfficientNet'i backbone olarak kullanır.
Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
Kuruluş:Google
Tarih: 2019-11-20
Bağlantılar:Arxiv | GitHub
EfficientDet hakkında daha fazla bilgi edinin
YOLOv9: Programlanabilir Gradyan Bilgisi
YOLOv9 derin öğrenmede temel bir sorunu ele alır: bilgi darboğazları. Veriler derin sinir ağının katmanlarından geçerken, bilgi kaçınılmaz olarak kaybolur. YOLOv9 , Programlanabilir Gradyan Bilgisi (PGI) ve GELAN adlı yeni bir mimari ile bu sorunu YOLOv9 .
Temel Mimari Özellikler
- GELAN (Genelleştirilmiş Verimli Katman Toplama Ağı): Bu mimari, CSPNet ve ELAN'ın en iyi özelliklerini bir araya getirir. Gradyan iniş yollarını optimize ederek, modelin hafif ancak bilgi açısından zengin özellikleri öğrenmesini sağlar.
- PGI (Programlanabilir Gradyan Bilgisi): PGI, öğrenme sürecini yönlendiren yardımcı bir denetim dalı sağlar ve ana dalın doğru algılama için gerekli olan kritik bilgileri muhafaza etmesini sağlar. Bu, karmaşık ortamlarda zor hedefleri algılamada özellikle yararlıdır.
- Basitlik: Bu içsel karmaşıklıklara rağmen, çıkarım yapısı basitleştirilmiş kalır ve EfficientDet'te kullanılan BiFPN ile ilişkili ağır hesaplama maliyetinden kaçınılır.
Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
Kuruluş: Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
Tarih: 2024-02-21
Bağlantılar:Arxiv | GitHub
YOLOv9 hakkında daha fazla bilgi edinin.
Teknik Performans Karşılaştırması
Bu modelleri karşılaştırırken, parametre verimliliği ile gerçek çalışma süresi gecikmesi arasındaki denge açıkça ortaya çıkmaktadır. EfficientDet parametre açısından verimli olmakla birlikte, karmaşık grafik yapısı (BiFPN) YOLOv9 kullanılan standart konvolüsyonlara göre GPU daha az uygundur.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Performans Analizi
YOLOv9 , hız-doğruluk oranı açısından EfficientDet'i YOLOv9 geride bırakmaktadır. Örneğin, YOLOv9c, EfficientDet-d6 (52,6%) ile karşılaştırılabilir bir mAP 53,0%) elde ederken, T4 GPU 12 kat daha hızlı çalışır GPU 7,16 ms'ye karşı 89,29 ms). Bu, YOLOv9 gerçek zamanlı uygulamalar için üstün YOLOv9 seçim haline getirir.
Eğitim ve Ekosistem Deneyimi
Bu mimariler arasındaki en önemli fark, Ultralytics'in sunduğu kullanım kolaylığı ve ekosistem desteğidir.
EfficientDet Zorlukları
EfficientDet eğitimi genellikle TensorFlow Algılama API'sini veya eski depoları kullanmayı içerir. Bunlar, bağımlılık çakışmaları nedeniyle kurulumu zor olabilir ve genellikle otomatik karışık hassasiyetli eğitim veya kolay bulut günlüğü entegrasyonu gibi modern özellikler için destek sunmaz.
Ultralytics'in Avantajı
Ultralytics YOLOv9 kullanmak sorunsuz bir deneyim sunar. Ekosistem, veri artırma, hiperparametre evrimi ve dışa aktarmayı otomatik olarak gerçekleştirir.
- Kullanım Kolaylığı: Birkaç satır kodla eğitime başlayabilirsiniz.
- Bellek Verimliliği: Ultralytics , eğitim sırasında daha az VRAM kullanacak şekilde optimize edilmiştir, bu da karmaşık çok dallı ağlara kıyasla tüketici GPU'larında daha büyük parti boyutlarına olanak tanır.
- Çok yönlülük: Algılamanın ötesinde, Ultralytics , standart EfficientDet uygulamalarında doğal olarak bulunmayan özellikler olan örnek segmentasyonu ve poz tahminini destekler.
from ultralytics import YOLO
# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")
# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Gerçek Dünya Uygulamaları
Model seçimi, farklı uygulamaların uygulanabilirliğini önemli ölçüde etkiler.
EfficientDet için İdeal Kullanım Durumları
- Akademik Araştırma: Özellik birleştirme teknikleri ve bileşik ölçeklendirme teorilerini incelemek için yararlıdır.
- Düşük Güç/Düşük Hız Senaryoları: Eski donanımın EfficientNet omurgaları için sabit kodlanmış olduğu çok özel durumlarda (örneğin, bazı eski Coral TPU'lar), EfficientDet-Lite varyantları hala geçerli olabilir.
YOLOv9 için İdeal Kullanım Örnekleri
- Otonom Navigasyon: Yüksek çıkarım hızı, güvenliği sağlamak için girdileri milisaniyeler içinde işlemesi gereken otonom araçlar için çok önemlidir.
- Perakende Analitiği: Envanter yönetimi gibi uygulamalar için YOLOv9 , ödeme sistemlerini durdurmadan benzer ürünleri ayırt etmek için gereken doğruluğu YOLOv9 .
- Sağlık hizmetleri: Tıbbi görüntü analizinde, PGI mimarisi, X-ışınları veya MRI taramalarında küçük anomalileri tespit etmek için gerekli olan ince ayrıntıları korumaya yardımcı olur.
Gelecek: YOLO26'ya yükseltme
YOLOv9 güçlü bir araç YOLOv9 da, Ultralytics görsel yapay zeka sınırlarını zorlamaya Ultralytics . En son teknolojiyi arayan geliştiriciler için YOLO26, EfficientDet ve YOLOv9 göre önemli gelişmeler sunuyor.
YOLO26, uçtan uca NMS tasarım sunarak, Non-Maximum Suppression son işlemine olan ihtiyacı tamamen ortadan kaldırır. Bu sayede daha basit dağıtım süreçleri ve daha hızlı çıkarımlar elde edilir. Ayrıca, SGD Muon'un birleşimi olan yeni MuSGD Optimizerile YOLO26, daha istikrarlı eğitim ve daha hızlı yakınsama sağlar.
Kenar dağıtımı için YOLO26, %43'e kadar daha hızlı CPU optimize edilmiştir ve düşük güçlü cihazlarla daha iyi uyumluluk için DFL Kaldırma özelliğini içerir. İster robotik ister yüksek verimli video analizi üzerinde çalışıyor olun, YOLO26 yeni standardı temsil eder.
Diğer son teknoloji mimarilerle ilgilenen kullanıcılar için, aşağıdakileri de incelemenizi öneririz YOLO11 ve RT-DETR 'yi Ultralytics .