EfficientDet ve DAMO-YOLO: Nesne Algılama Mimarilerinin Teknik Karşılaştırması

Ölçeklenebilir bilgisayarlı görü süreçleri oluştururken, doğru model mimarisini seçmek hem dağıtımın uygulanabilirliğini hem de algılama doğruluğunu etkileyen kritik bir karardır. Bu kılavuz, görsel tanıma alanındaki iki iyi bilinen mimari olan EfficientDet ve DAMO-YOLO arasında derinlemesine ve teknik bir karşılaştırma sunmaktadır.

Her iki model de nesne algılama alanına önemli yenilikler getirmiş olsa da, görü yapay zekasındaki hızlı ilerleme daha entegre ekosistemlerin yolunu açtı. Bu analiz boyunca, Ultralytics Platform ve Ultralytics YOLO26 gibi modern çözümlerin neden üretim ortamları için endüstri standardı haline geldiğini gösterirken bu eski ağların temel mekanizmalarını inceleyeceğiz.

EfficientDet: Ölçeklenebilir ve Verimli Nesne Algılama

Google araştırmacıları tarafından tanıtılan EfficientDet, yüksek verimliliği korurken model mimarisini sistematik olarak ölçeklendirmek için tasarlanmıştır. Bunu, ağ derinliği, genişliği ve giriş çözünürlüğü genelinde bileşik ölçeklendirmeden yararlanarak başardı.

EfficientDet Detayları: Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
Kuruluş: Google Brain
Tarih: 2019-11-20
Arxiv: 1911.09070
GitHub: google/automl

Mimari Yenilikler

EfficientDet'in birincil katkısı Çift Yönlü Özellik Piramidi Ağıdır (BiFPN). Geleneksel FPN'lerin aksine BiFPN, farklı girdi özelliklerinin önemini anlamak için öğrenilebilir ağırlıklar kullanarak kolay ve hızlı çok ölçekli özellik füzyonuna olanak tanır. Bu, EfficientNet backbone ile birleştirilerek tahmin edilebilir şekilde ölçeklenen bir model ailesi (D0'dan D7'ye kadar) oluşturur.

Güçlü ve Zayıf Yönler

EfficientDet'in temel gücü, parametre verimliliğinde yatar. ortalama Hassasiyet (mAP) değerinin yoğun kısıtlamalara sahip bulut ortamlarında en üst düzeye çıkarılması gereken görevler için, bileşik ölçeklendirme yöntemi oldukça tahmin edilebilirdir. Ancak, EfficientDet'i sıfırdan eğitmek oldukça karmaşıktır ve genellikle önemli miktarda hiperparametre ayarı gerektirir. Ayrıca, belirli TensorFlow işlemlerine olan ağır bağımlılığı, ONNX veya TensorRT aracılığıyla uç birim dağıtımlarına geçişi, modern YOLO modellerinde bulunan geliştirilmiş dışa aktarma yeteneklerine kıyasla daha zahmetli hale getirir.

EfficientDet hakkında daha fazla bilgi edinin

DAMO-YOLO: Otomatik Mimari Arayışı İş Başında

DAMO-YOLO, gerçek zamanlı çıkarım için optimum ağ yapılarını otomatik olarak tasarlamak üzere Sinirsel Mimari Arayışı'nı (NAS) kullanan farklı bir yaklaşımı temsil eder.

DAMO-YOLO Detayları: Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş: Alibaba Group
Tarih: 2022-11-23
Arxiv: 2211.15444v2
GitHub: tinyvision/DAMO-YOLO

Mimari Yenilikler

DAMO-YOLO birkaç yeni teknoloji sunar. MAE-NAS adlı NAS tarafından üretilmiş bir backbone, boyun kısmı için verimli bir RepGFPN ve algılama kafasının hesaplama maliyetini önemli ölçüde azaltan bir ZeroHead tasarımı kullanır. Ayrıca, etiket ataması için AlignedOTA kullanır ve daha küçük varyantlarının performansını artırmak için bilgi damıtma iyileştirmesine büyük ölçüde güvenir.

Güçlü ve Zayıf Yönler

DAMO-YOLO, özellikle TensorRT kullanan NVIDIA mimarilerinde dağıtım için tasarlanmış GPU çıkarım hızlarıyla öne çıkar. Ağır kafa yapılarını ortadan kaldırarak model, düşük gecikmeli tahminler sunar. Bunun tersine, otomatik mimari arayışı model yapısını şeffaf olmaktan çıkarabilir ve özel uç cihazlar için manuel hata ayıklamayı veya ince ayar yapmayı zorlaştırabilir. Oldukça çok yönlü olan Ultralytics YOLO11'in aksine, DAMO-YOLO birincil olarak standart sınırlayıcı kutu algılamaya odaklanır ve kutudan çıktığı haliyle poz kestirimi veya yönlendirilmiş sınırlayıcı kutu (OBB) algılama gibi gelişmiş görevler için yerel desteğe sahip değildir.

DAMO-YOLO hakkında daha fazla bilgi edin

Performans Karşılaştırması

Ampirik ödünleşimleri anlamak, bir model seçmek için şarttır. Aşağıdaki tablo, EfficientDet ailesini DAMO-YOLO serisi ile önemli performans metrikleri genelinde karşılaştırır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
Verileri Analiz Etmek

EfficientDet-d7 en yüksek teorik doğruluğa ulaşır ancak muazzam miktarda işlem gücü gerektirir, bu da onu uç yapay zeka için uygunsuz kılar. DAMO-YOLO olağanüstü TensorRT hızları sunar, ancak benzer bir doğruluk elde etmek için genellikle alt seviye EfficientDet modellerinden daha fazla parametre gerektirir.

Kullanım Durumları ve Öneriler

EfficientDet ve DAMO-YOLO arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

Ne Zaman EfficientDet Seçilmeli?

EfficientDet şunlar için güçlü bir seçenektir:

  • Google Cloud ve TPU İş Akışları: EfficientDet'in yerel optimizasyona sahip olduğu Google Cloud Vision API'leri veya TPU altyapısı ile derinlemesine entegre edilmiş sistemler.
  • Bileşik Ölçeklendirme Araştırması: Dengeli ağ derinliği, genişliği ve çözünürlük ölçeklendirmesinin etkilerini incelemeye odaklanan akademik karşılaştırmalar.
  • TFLite ile Mobil Dağıtım: Özellikle Android veya gömülü Linux cihazları için TensorFlow Lite dışa aktarımı gerektiren projeler.

Ne Zaman DAMO-YOLO Seçilmeli

DAMO-YOLO şunlar için önerilir:

  • Yüksek Verimli Video Analitiği: Batch-1 veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS'li video akışlarını işleme.
  • Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite denetimi gibi özel donanım üzerinde katı GPU gecikme kısıtlamaları olan senaryolar.
  • Sinirsel Mimari Arama Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametrelendirilmiş ana gövdelerin tespit performansı üzerindeki etkilerini inceleme.

Ne Zaman Ultralytics (YOLO26) Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Ultralytics Avantajı: Eski Modellerin Ötesine Geçmek

EfficientDet ve DAMO-YOLO değerli akademik içgörüler sağlarken, modern geliştiriciler en son teknoloji performansı ile geliştirici ergonomisini dengeleyen çerçevelere ihtiyaç duyarlar. Ultralytics ekosistemi tam da bu noktada öne çıkar.

Benzersiz Kullanım Kolaylığı ve Ekosistem

Ayrı ve yoğun şekilde özelleştirilmiş araştırma depolarından model dağıtmak genellikle entegrasyon kabuslarına yol açar. Ultralytics, kapsamlı dokümantasyonu ve Pythonik API'si ile birleşik, derinlemesine bakımı iyi yapılan bir ekosistem sunar. Eğitim için Google Colab kullanıyor olsan da mobil çıkarım için CoreML dışa aktarıyor olsan da, süreç yalnızca birkaç satır kod gerektirir.

from ultralytics import YOLO

# Load the highly recommended YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model effortlessly on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Export the trained model to ONNX for production
model.export(format="onnx")

YOLO26 Devrimi

EfficientDet veya DAMO-YOLO'yu değerlendiren geliştiriciler için Ultralytics YOLO26 nihai evrimsel adımı temsil eder. 2026'nın başlarında piyasaya sürülen bu sürüm, paradigma değiştiren yetenekler sunar:

  • Uçtan Uca NMS-Free Tasarım: İlk olarak YOLOv10 tarafından öncülük edilen YOLO26, NMS (Non-Maximum Suppression) sonrası işleme ihtiyacını yerel olarak ortadan kaldırır. Bu, çok daha basit dağıtım mimarileri ve çeşitli donanımlarda tutarlı gecikme süreleri anlamına gelir.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Ağır GPU'lardan yoksun uç dağıtımlar için—yani DAMO-YOLO'nun zorlandığı senaryolarda—YOLO26 büyük ölçüde optimize edilmiş olup standart CPU'larda devasa hız artışları sağlar.
  • MuSGD Optimize Edici: LLM yenilikleri ile bilgisayarlı görü arasındaki boşluğu dolduran YOLO26, (Moonshot AI'dan esinlenen) MuSGD optimize ediciyi bünyesinde barındırarak, EfficientDet'in kırılgan eğitim döngülerine kıyasla inanılmaz derecede kararlı eğitim ve hızlı yakınsama sağlar.
  • DFL Kaldırma: Distribution Focal Loss'un kaldırılması, dışa aktarma sürecini basitleştirerek düşük güçlü mikro denetleyiciler ve Raspberry Pi cihazlarıyla üstün uyumluluğu garanti eder.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, eski mimarilerin geleneksel olarak başarısız olduğu küçük nesne tanımada dramatik iyileşmeler sağlar.

Bellek Verimliliği ve Görev Çok Yönlülüğü

transformer modellerinin veya yoğun şekilde birleştirilmiş NAS ağlarının aksine, Ultralytics modelleri katı bellek verimlilikleriyle karakterize edilir. Eğitim sırasında dikkat çekici derecede düşük CUDA belleği tüketerek tüketici sınıfı donanımlarda hızlı yinelemeye olanak tanır.

Dahası, EfficientDet ve DAMO-YOLO sınırlayıcı kutularla katı bir şekilde kısıtlanmışken, Ultralytics aynı sezgisel çerçeve içinde yerel olarak örnek segmentasyonu ve görüntü sınıflandırmayı destekler. Eski projeleri sürdüren kullanıcılar için Ultralytics YOLOv8, keşfetmeye değer, oldukça sağlam ve yaygın olarak kullanılan bir alternatif olmaya devam etmektedir.

Sonuç

Doğru görü mimarisini seçmek, ham teorik performansı dağıtım gerçeklerine karşı tartmayı içerir. EfficientDet matematiksel olarak zarif bir ölçeklendirme yaklaşımı sunar ve DAMO-YOLO etkileyici ham GPU hızları sağlar. Ancak, hızlı geliştirmeye, güvenilir dağıtımlara ve son teknoloji özelliklere öncelik veren ekipler için Ultralytics modelleri açıkça öndedir. NMS-free çıkarım ve MuSGD optimizasyonu gibi yenilikleri birleştiren YOLO26, bilgisayarlı görü projelerinin bugün mevcut olan en yetenekli, sürdürülebilir ve verimli temel üzerine inşa edilmesini sağlar.

Yorumlar