DAMO-YOLO ve EfficientDet: Modern Nesne Algılamaya Teknik Bir Derin Bakış
Bilgisayar görüşünün evrimi, değişen gerçek dünya taleplerine göre uyarlanmış bir dizi güçlü mimari üretmiştir. Bazı çerçeveler büyük ölçeklenebilirliğe öncelik verirken, diğerleri gerçek zamanlı çıkarım hızına yoğunlaşmaktadır. Bu teknik karşılaştırmada, nesne algılama sorununu çözmeye yönelik farklı yaklaşımları sergileyen iki oldukça etkili model olan DAMO-YOLO ve EfficientDet'i inceliyoruz. Mimarlarını inceleyecek, kıyaslama performanslarını karşılaştıracak ve nihayetinde yeni çıkan Ultralytics YOLO26'nın modern üretim dağıtımları için neden en uygun seçim olduğunu araştıracağız.
Mimari Genel Bakış
Her iki model de verimlilik-doğruluk dengesini ele almak üzere tasarlandı, ancak hedeflerine ulaşmak için temelde farklı mekanizmalara dayanıyorlar.
DAMO-YOLO: Sinirsel Mimari Arama ile Hız
Gerçek zamanlı algılamanın sınırlarını zorlamak için geliştirilen DAMO-YOLO, düşük gecikmeli ortamlar için özel olarak tasarlanmış yüksek verimli ağlar oluşturmak için otomatik arama tekniklerinden yararlanır.
DAMO-YOLO Detayları:
Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş: Alibaba Group
Tarih: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO
DAMO-YOLO, hem hız hem de doğruluk için optimize edilmiş bir Sinirsel Mimari Arama (NAS) backbone etrafında inşa edilmiştir. Yüksek çıkarım hızlarını korurken özellik füzyonunu artıran RepGFPN (Yeniden Parametrelendirilmiş Genelleştirilmiş Özellik Piramit Ağı) sunar. Ayrıca, ZeroHead tasarımı, algılama başlıklarıyla ilişkili tipik hesaplama yükünü en aza indirir. Model ayrıca AlignedOTA (Hizalı Optimal Taşıma Ataması) ve damıtma geliştirmesinden faydalanarak en küçük varyantların bile daha büyük modellerden zengin temsiller öğrenmesini sağlar.
DAMO-YOLO hakkında daha fazla bilgi edinin
EfficientDet: Bileşik Ölçekleme ile Ölçeklenebilirlik
Hız odaklı yaklaşımla çelişerek, EfficientDet çeşitli hesaplama bütçeleri genelinde sistematik ölçeklenebilirliğe odaklanır.
EfficientDet Detayları:
Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
Kuruluş: Google Brain
Tarih: 2019-11-20
Arxiv: https://arxiv.org/abs/1911.09070
GitHub: https://github.com/google/automl/tree/master/efficientdet
EfficientDet, kolay ve hızlı çok ölçekli özellik füzyonuna olanak tanıyan BiFPN (Çift Yönlü Özellik Piramit Ağı) sunar. Katmanları veya kanalları keyfi olarak ekleyerek mimarileri ölçeklendiren geleneksel yöntemlerin aksine, EfficientDet, backbone, özellik ağı ve kutu/sınıf tahmin ağlarının çözünürlüğünü, derinliğini ve genişliğini eş zamanlı olarak tekdüze bir şekilde ölçeklendiren bileşik bir ölçekleme yöntemi kullanır. Bu, üst düzey donanımlarda son teknoloji doğruluk elde etmesini sağlarken, kısıtlı ortamlar için daha küçük varyantlar sunar.
EfficientDet hakkında daha fazla bilgi edinin
Performans ve Metrik Karşılaştırması
Bu modelleri yan yana karşılaştırdığımızda, mutlak doğruluk ve çıkarım hızı arasındaki denge açıkça ortaya çıkar. Aşağıdaki tablo, DAMO-YOLO'nun çıkarım yeteneklerinin EfficientDet model ailesine karşı nasıl bir performans sergilediğini vurgulayarak temel performans metriklerini özetlemektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Yukarıda görüldüğü gibi, EfficientDet-d7 en yüksek genel doğruluğu elde ederek zorlu bulut tabanlı uygulamalar için uygun hale gelir. Tersine, DAMO-YOLO serisi, GPU donanımında önemli ölçüde daha düşük gecikme süresi ile oldukça rekabetçi doğruluk sağlayarak gerçek zamanlı uç dağıtımlar için daha güçlü bir aday olmaktadır.
Kullanım Durumları ve Öneriler
DAMO-YOLO ve EfficientDet arasında seçim yapmak, projenizin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerinize bağlıdır.
Ne Zaman DAMO-YOLO Seçmeli
DAMO-YOLO şunlar için güçlü bir seçimdir:
- Yüksek Verimli Video Analizi: Batch-1 veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS video akışlarını işleme.
- Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite denetimi gibi özel donanımlarda katı GPU gecikme kısıtlamaları olan senaryolar.
- Sinirsel Mimari Arama Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametrelendirilmiş backboneların algılama performansı üzerindeki etkilerini inceleme.
Ne Zaman EfficientDet Seçmeli
EfficientDet şunlar için önerilir:
- Google Cloud ve TPU İş Akışları: EfficientDet'in yerel optimizasyona sahip olduğu Google Cloud Vision API'leri veya TPU altyapısı ile derinlemesine entegre sistemler.
- Bileşik Ölçekleme Araştırması: Dengeli ağ derinliği, genişliği ve çözünürlük ölçeklemesinin etkilerini incelemeye odaklanan akademik kıyaslama.
- TFLite aracılığıyla Mobil Dağıtım: Android veya gömülü Linux cihazları için özellikle TensorFlow Lite dışa aktarımı gerektiren projeler.
Ultralytics (YOLO26) Ne Zaman Seçilmeli
Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Modern Alternatif: Ultralytics YOLO26
DAMO-YOLO ve EfficientDet önemli akademik kilometre taşlarını temsil etse de, gerçek dünya dağıtımı genellikle daha dengeli, zengin özellikli ve geliştirici dostu bir yaklaşım gerektirir. İşte bu noktada Ultralytics YOLO26 yeni bir endüstri standardı belirliyor.
Ocak 2026'da piyasaya sürülen YOLO26, Ultralytics YOLO11 ve YOLOv8 dahil olmak üzere öncüllerinin mirası üzerine inşa edilmiş olup, nesne algılama yaklaşımımızda bir paradigma değişimi sunuyor.
Uçtan Uca Sadelik
YOLO26, yerel bir Uçtan Uca NMS'siz Tasarım sunar. Nesne dedektörlerini yıllardır rahatsız eden bir darboğaz olan Non-Maximum Suppression (NMS) işlemini son işlem sırasında ortadan kaldırarak, YOLO26 özellikle kenar donanımlarında daha basit, çok daha hızlı bir dağıtım hattı sunar.
Eşsiz Performans ve Çok Yönlülük
YOLO26 sadece hızı iyileştirmekle kalmaz; eğitim kararlılığını ve doğruluğunu yeniden tanımlar. LLM eğitim yeniliklerinden ilham alan SGD ve Muon'un hibriti olan MuSGD Optimizatörü'nü tanıtarak, önemli ölçüde daha hızlı yakınsama oranları ve üstün eğitim verimliliği sağlar. RT-DETR gibi ağır transformatör tabanlı alternatiflerin aksine, YOLO26 inanılmaz derecede düşük bellek gereksinimlerini koruyarak tüketici sınıfı donanımlarda eğitilebilmesini sağlar.
Ayrıca, YOLO26, drone hava görüntüleri ve robotik gibi kullanım durumları için hayati öneme sahip küçük nesne tanımayı önemli ölçüde iyileştiren ProgLoss + STAL özelliğini içerir. Düşük güç tüketen cihazlar için optimize etmek amacıyla YOLO26, Distribution Focal Loss (DFL) özelliğini kaldırmış ve önceki nesillere kıyasla %43'e kadar daha hızlı CPU çıkarımı sağlamıştır.
Ekosistem ve Kullanım Kolaylığı
EfficientDet gibi modellerdeki en büyük engellerden biri karmaşık entegrasyon sürecidir. Buna karşılık, Ultralytics Platformu iyi yönetilen, uçtan uca bir ekosistem sunar. Birleşik bir API ile kullanıcılar algılama, örnek segmentasyonu, poz tahmini, görüntü sınıflandırma ve yönlendirilmiş sınırlayıcı kutular (OBB) arasında kolayca geçiş yapabilir.
Ultralytics python paketini kullanarak YOLO26 ile eğitim yapmak ve çıkarım çalıştırmak işte bu kadar basit:
from ultralytics import YOLO
# Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on your custom dataset with minimal memory footprint
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run ultra-fast NMS-free inference
predictions = model.predict("image.jpg")
YOLO26 hakkında daha fazla bilgi edinin
Sonuç
DAMO-YOLO vs EfficientDet karşılaştırması, Sinirsel Mimari Arama ve bileşik ölçeklendirme arasındaki ödünleşimler hakkında mükemmel bilgiler sağlarken, modern geliştiriciler akademik araştırma ile üretim gerçekliği arasındaki boşluğu kapatan araçlara ihtiyaç duyar.
Kullanım kolaylığına, aktif bir açık kaynak topluluğuna ve hız ile doğruluk arasında ödün vermeyen bir dengeye öncelik veren geliştiriciler için Ultralytics YOLO26 kesin seçimdir. NMS'siz mimarisi, düşük eğitim yükü ve kapsamlı Ultralytics ekosistemi ile sorunsuz entegrasyonu, onu bir sonraki bilgisayar görüşü projeniz için nihai çerçeve haline getirir.