YOLOv9 EfficientDet: Mimari ve Performansın Teknik Karşılaştırması
Gelişen bilgisayar görme alanında, doğru nesne algılama mimarisini seçmek, sistem gecikmesi, doğruluk ve dağıtım karmaşıklığını etkileyen kritik bir karardır. Bu kılavuz, YOLOv9ve verimli ölçeklendirmesiyle Google son derece etkili mimarisi EfficientDet arasında ayrıntılı bir teknik karşılaştırma sunar. Yapısal farklılıklarını, performans ölçütlerini ve gerçek dünya uygulamaları için uygunluklarını analiz ediyoruz.
Performans Metrikleri Analizi
Aşağıdaki tablo, çeşitli model ölçeklerinin performanslarını karşılaştırmaktadır. YOLOv9 genel olarak, eski EfficientDet mimarisine kıyasla modern donanımlarda üstün doğruluk-parametre oranları ve daha hızlı çıkarım hızları sergilemektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Model Genel Bakışları
YOLOv9
Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
Kuruluş: Bilgi Bilimi Enstitüsü, Academia Sinica, Tayvan
Tarih: 2024-02-21
Bağlantılar:Arxiv | GitHub | Dokümanlar
YOLOv9 , derin ağlardaki "bilgi darboğazı" sorununu çözmek için önemli mimari yenilikler YOLOv9 . Temel katkı, derin katmanların kritik özellik bilgilerini korumalarını sağlamak için yardımcı bir denetim dalı aracılığıyla güvenilir gradyanlar üreten Programlanabilir Gradyan Bilgisi (PGI)dır. Ayrıca, parametre verimliliğini en üst düzeye çıkaran hafif bir mimari olan Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) kullanır.
YOLOv9 hakkında daha fazla bilgi edinin.
EfficientDet
Yazarlar: Mingxing Tan, Ruoming Pang, Quoc V. Le
Kuruluş:Google
Tarih: 2019-11-20
Bağlantılar:Arxiv | GitHub
EfficientDet, AutoML alanında öncü bir çalışma olup, Çift Yönlü Özellik Piramidi Ağı (BiFPN) kavramını ortaya koymuştur. Geleneksel FPN'lerden farklı olarak, BiFPN öğrenilebilir ağırlıklar getirerek çok ölçekli özelliklerin kolayca birleştirilmesini sağlar. Model ayrıca, çözünürlük, derinlik ve genişliği eşit şekilde ölçekleyen ve D0'dan D7'ye kadar geniş bir kaynak kısıtlamaları yelpazesinde mükemmel performans elde etmesini sağlayan Bileşik Ölçekleme yöntemini kullanır.
Mimari Derinlemesine İnceleme
Özellik Birleştirme: GELAN vs. BiFPN
Temel fark, bu modellerin özellikleri nasıl bir araya getirdiğinde yatmaktadır. EfficientDet, teorik olarak FLOP'larda verimli olan ancak bellek yoğunluğu yüksek ve TensorRT gibi belirli donanım hızlandırıcıları için optimize edilmesi daha zor olan karmaşık BiFPN yapısına dayanmaktadır. TensorRTgibi belirli donanım hızlandırıcılar için optimize edilmesi daha zor olabilir.
Buna karşılık, YOLOv9 GELAN mimarisi, CSPNet ve ELAN'ın en iyi özelliklerini bir araya getirir. Karmaşık füzyon bağlantıları yerine gradyan yol planlamasına öncelik verir. Bu, parametreleri daha hafif olan ve aynı zamanda "donanım dostu" bir ağ oluşturur, böylece eğitim ve çıkarım sırasında GPU artar.
Degrade Akış ve Bilgi Kaybı
EfficientDet, çok derin bir EfficientNet backbone aracılığıyla standart geri yayılım yöntemine dayanır. YOLOv9 , derin ağların girdi verilerinin ayrıntılarını "unutması" sorununu YOLOv9 . PGI aracılığıyla YOLOv9 , öğrenme sürecini yönlendiren yardımcı bir tersinir dal YOLOv9 ve ana dalın, çıkarım sırasında bu yardımcı dalları sürdürmenin hesaplama maliyetine katlanmadan sağlam anlamsal özellikleri yakalamasını sağlar.
Uyarı: PGI Avantajı
Programlanabilir Gradyan Bilgisi (PGI), YOLOv9 daha az veriyle daha iyi yakınsama YOLOv9 sağlar, bu da onu, açıklamalı örneklerin az olabileceği özel veri kümeleri için özellikle etkili kılar.
Ekosistem ve Kullanım Kolaylığı
Geliştiriciler için en önemli farklardan biri, bu modelleri çevreleyen ekosistemdir.
EfficientDet, esas olarak TensorFlow dayanmaktadır. Güçlü olmasına rağmen, onu kullanmak genellikle karmaşık bağımlılık zincirlerini veya sık güncelleme yapılmayan eski depoları incelemek gerektirir.
YOLOv9, Ultralytics entegre edilmiş olup, kolaylaştırılmış bir deneyim sunar. Geliştiriciler, basit bir Python aracılığıyla modele erişebilir ve dakikalar içinde eğitim, doğrulama ve dağıtım işlemlerini gerçekleştirebilir. Ultralytics , veri artırma, günlük kaydı (ör. MLflow veya Comet) ve dışa aktarmayı otomatik olarak gerçekleştirir.
from ultralytics import YOLO
# Load a pretrained YOLOv9c model
model = YOLO("yolov9c.pt")
# Train the model on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX for deployment
model.export(format="onnx")
Bu snippet, Ultralytics kullanım kolaylığını göstermektedir. Çerçeve ayrıca Otomatik Karışık Hassasiyet (AMP) veGPU destekleyerek eğitim verimliliğini garanti eder.
Çok Yönlülük ve Dağıtım
Görev Desteği
EfficientDet temel olarak nesne algılama için tasarlanmıştır. Segmentasyon veya poz tahmini gibi görevler için uyarlanması, önemli mimari değişiklikler ve özel kod gerektirir.
YOLOv9 onun ardılları dahil olmak üzere Ultralytics , aşağıdakileri yerel olarak destekleyen çok yönlü bir kod tabanı üzerine inşa edilmiştir:
- Nesne Algılama
- Örnek Segmentasyonu
- Poz Tahmini
- Yönlendirilmiş Sınırlayıcı Kutu (OBB)
- Sınıflandırma
Kenar Uyumluluğu ve Bellek
EfficientDet-D0 küçük olsa da, D7'ye ölçeklendirme, çözünürlük ölçeklendirme (1536x1536'ya kadar) nedeniyle büyük bellek maliyetlerine neden olur. YOLOv9 , üstün doğruluk elde ederken çoğu benchmark için standart 640x640 girişi YOLOv9 . Bu daha düşük giriş çözünürlüğü, VRAM için bellek gereksinimlerini önemli ölçüde azaltır, böylece tüketici GPU'larında daha büyük parti boyutları ve daha hızlı deneyler yapılabilir.
Ayrıca, Ultralytics tek tıklamayla aşağıdaki formatlara aktarım özelliğini destekler TFLite gibi formatlara tek tıklamayla dışa aktarımını destekler. OpenVINO ve Apple cihazlar CoreML gibi Intel tek tıklamayla Intel a aktarımını destekleyerek geniş bir Edge Uyumluluğu sağlar.
Gerçek Dünya Kullanım Durumları
Model seçimi genellikle belirli bir uygulamanın başarısını belirler:
- Perakende Analitiği: Raflardaki ürünleri saymak için, YOLOv9 , PGI'nın ince ayrıntıları koruma yeteneği sayesinde küçük nesneler üzerinde yüksek doğruluk (mAP) ile üstünlük sağlar.
- Otonom Dronlar: Gömülü donanımlarda (örneğin Jetson Orin) gerçek zamanlı çıkarım gerektiren senaryolarda, YOLOv9 verimli GELAN mimarisi, EfficientDet'in karmaşık BiFPN katmanlarının genellikle eşleşmekte zorlandığı gerekli FPS'yi sağlar.
- Eski Sistemler:EfficientDet, belirli model mimarisinin donanım boru hattına sabit olarak kodlandığı araştırma karşılaştırmalarında veya eski Google TPU hala geçerliliğini korumaktadır.
Gelecek: YOLO26
YOLOv9 olağanüstü bir performans YOLOv9 da, yapay zeka alanı hızla gelişmektedir. Ultralytics , yeni projeler için önerilen seçim olan YOLO26 ile yeniliklere Ultralytics .
YOLO26, önceki YOLO güçlü yönlerini temel alır, ancak yerel uçtan uca NMS bir tasarım sunarak, Non-Maximum Suppression son işlemlerinin gecikme süresini ve karmaşıklığını ortadan kaldırır. SGD Muon'un bir karışımı olan MuSGD Optimizerözelliğine sahiptir ve daha basit dışa aktarım için Distribution Focal Loss (DFL) özelliğini kaldırır. Bu değişiklikler, CPU %43'e varan hız artışı ve daha iyi eğitim kararlılığı sağlar.
YOLO26 hakkında daha fazla bilgi edinin
Ayrıca, YOLO26, ProgLoss + STAL (Soft-Target Anchor Loss) özelliğini de içermekte olup, robotik ve hava görüntüleme için kritik öneme sahip küçük nesnelerin tanınmasında önemli iyileştirmeler sunmaktadır. Hız, doğruluk ve kullanım kolaylığı arasında mükemmel dengeyi arayan geliştiriciler için YOLO26 yeni standarttır.
Sonuç
Her iki mimari de bilgisayar görme tarihinde yerini almıştır. EfficientDet, bileşik ölçeklemenin gücünü gösterirken, YOLOv9 programlanabilir gradyanların derin ağlarda bilgileri nasıl kurtarabileceğini gösterdi. Ancak, modern üretim ortamları için, hem YOLOv9 daha yeni olan YOLO26'yı destekleyen Ultralytics , bakım kolaylığı, eğitim hızı ve dağıtım esnekliği açısından belirgin bir avantaj sunuyor.
Ayrıca Bakınız
- YOLOv10 EfficientDet: İlk NMS YOLO ile karşılaştırma.
- YOLO26 ve YOLOv9: En yeni nesil yükseltmelere derinlemesine bir bakış.
- Ultralytics : Modellerinizi eğitmenin ve dağıtmanın en basit yolu.