YOLOX ve DAMO-YOLO: Anchor-Free (Çapasız) ve NAS Destekli Nesne Dedektörlerinin Karşılaştırılması

Gerçek zamanlı nesne tespiti evrimi, çapa tabanlı mimarilerden çapa içermeyen (anchor-free) mimarilere ve manuel olarak tasarlanmış omurgalardan otomatik sinir ağı mimarisi aramaya (NAS) kadar sayısız paradigma değişimine tanık oldu. Bu kapsamlı teknik karşılaştırmada, bu yolculuktaki iki önemli dönüm noktasını analiz edeceğiz: YOLOX ve DAMO-YOLO. Modern Ultralytics YOLO26 modelinin günümüz geliştiricileri için nasıl eşsiz bir alternatif sunduğunu vurgularken, bu modellerin mimari yeniliklerini, eğitim metodolojilerini ve performans ödünleşimlerini inceleyeceğiz.

YOLOX: Çapasız Paradigmasının Öncüsü

18 Temmuz 2021'de Megvii bünyesinde Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun tarafından yayınlanan YOLOX, çapa içermeyen tasarımı YOLO ailesine başarılı bir şekilde entegre ederek kritik bir dönüm noktası oluşturdu. ArXiv üzerindeki teknik raporda detaylandırıldığı üzere YOLOX, akademik araştırmalar ile endüstriyel dağıtım arasındaki boşluğu doldurmayı amaçlıyordu.

Temel Mimari Yenilikler

YOLOX, öncüllerine kıyasla performansı ciddi ölçüde artıran çeşitli temel yapısal değişimler getirdi:

  • Anchor-Free (Çapasız) Mekanizma: Bir nesnenin merkezini ve bounding box (sınırlayıcı kutu) boyutlarını doğrudan tahmin ederek YOLOX, tasarım buluşsal yöntemlerinin sayısını azalttı ve karmaşık çapa kümeleme süreçlerini basitleştirdi. Bu da onu çeşitli computer vision senaryolarına oldukça uyumlu hale getiriyor.
  • Ayrıştırılmış (Decoupled) Başlık: Geleneksel YOLO modelleri, hem sınıflandırma hem de regresyon için tek bir birleşik başlık kullanıyordu. YOLOX, sınıflandırma ve lokalizasyonu ayrı ayrı işleyen bir ayrıştırılmış başlık yapısını uyguladı; bu da modelin çok daha hızlı yakınsamasını ve doğruluğunun artmasını sağladı.
  • SimOTA Etiket Ataması: Pozitif örnekleri dinamik olarak atamak, eğitim sürelerini kısaltmak ve merkez noktası atamalarındaki belirsizlikleri gidermek için Optimal Transport Assignment (OTA) yönteminin basitleştirilmiş bir versiyonu kullanıldı.
YOLOX'un Mirası

YOLOX'un ayrıştırılmış başlık tasarımı, sonraki nesil nesne dedektörlerini büyük ölçüde etkileyerek birçok modern modelde standart bir özellik haline geldi.

YOLOX hakkında daha fazla bilgi edin

DAMO-YOLO: Ölçeklenebilir Otomatik Mimari Arama

Xianzhe Xu ve Alibaba Group bünyesindeki araştırmacı ekibi tarafından geliştirilen DAMO-YOLO, 23 Kasım 2022'de tanıtıldı. ArXiv yayınlarında detaylandırıldığı gibi model, hız ve doğruluk açısından Pareto sınırını zorlamak için büyük ölçüde Neural Architecture Search (NAS) teknolojisinden yararlandı.

Temel Mimari Yenilikler

DAMO-YOLO'nun stratejisi, verimli yapıların tasarımını otomatikleştirmeye dayanıyordu:

  • MAE-NAS Omurgaları: Çok Amaçlı Evrimsel (Multi-Objective Evolutionary) bir algoritma kullanan DAMO-YOLO, özellikle TensorRT gibi çerçevelere aktarıldığında, belirli gecikme bütçeleri için özelleştirilmiş, oldukça verimli omurgalar keşfetti.
  • Verimli RepGFPN: Farklı uzamsal çözünürlükler arasında özellik birleştirmeyi önemli ölçüde geliştiren ağır bir boyun (neck) tasarımı; bu yapı, aerial imagery analysis ve farklı ölçeklerdeki nesnelerin tespiti için oldukça faydalıdır.
  • ZeroHead: Modelin genel ortalama Hassasiyetinden (mAP) ödün vermeden hesaplama fazlalığını azaltan basitleştirilmiş bir tahmin başlığı.
  • AlignedOTA ve Distillation: Daha küçük öğrenci modellerinden maksimum performansı elde etmek için gelişmiş etiket ataması ve öğretmen-öğrenci bilgi damıtma (distillation) yöntemlerini içerir.

DAMO-YOLO hakkında daha fazla bilgi edin

Performans ve Metrik Karşılaştırması

Bu iki modeli karşılaştırırken parametre sayılarına, gerekli FLOP değerlerine ve gecikme profillerine bakmalıyız. Aşağıda, YOLOX ve DAMO-YOLO'yu birden fazla ölçekte karşılaştıran kıyaslama verileri yer almaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Her iki model de etkileyici sonuçlar elde etse de bazı dezavantajları vardır. YOLOX'un ayrıştırılmış başlığının dikkatli bir şekilde ayarlanması gerekirken, DAMO-YOLO'nun damıtma yöntemine olan aşırı bağımlılığı, özel veri kümeleri üzerinde yeniden eğitimi oldukça yoğun kaynak gerektirir ve büyük miktarda GPU memory talep eder.

Kullanım Durumları ve Öneriler

YOLOX ve DAMO-YOLO arasında seçim yapmak, projenizin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerinize bağlıdır.

YOLOX ne zaman seçilmeli?

YOLOX şunlar için güçlü bir seçimdir:

  • Çapasız Algılama Araştırması: Yeni algılama başlıkları veya kayıp işlevleri denemek için YOLOX'un temiz, çapasız mimarisini temel olarak kullanan akademik araştırma.
  • Ultra Hafif Uç Cihazlar: YOLOX-Nano varyantının son derece küçük ayak izinin (0.91M parametre) kritik olduğu mikrodenetleyicilerde veya eski mobil donanımlarda dağıtım yapılması.
  • SimOTA Etiket Atama Çalışmaları: Optimum taşıma tabanlı etiket atama stratejilerini ve bunların eğitim yakınsaması üzerindeki etkisini araştıran araştırma projeleri.

Ne Zaman DAMO-YOLO Seçilmeli

DAMO-YOLO şunlar için önerilir:

  • Yüksek Verimli Video Analitiği: Batch-1 veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS'li video akışlarını işleme.
  • Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite denetimi gibi özel donanım üzerinde katı GPU gecikme kısıtlamaları olan senaryolar.
  • Sinirsel Mimari Arama Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametrelendirilmiş ana gövdelerin tespit performansı üzerindeki etkilerini inceleme.

Ne Zaman Ultralytics (YOLO26) Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Ultralytics Avantajı: YOLO26 ile Tanışın

YOLOX ve DAMO-YOLO önemli tarihi dönüm noktalarını temsil etse de modern geliştiriciler, son teknoloji doğruluğu eşsiz bir kullanım kolaylığı ile birleştiren bir çözüme ihtiyaç duyar. İşte Ultralytics YOLO26 tam bu noktada ortamı dönüştürüyor. Ocak 2026'da piyasaya sürülen YOLO26, hız, doğruluk ve geliştirici deneyiminin en üst düzey dengesini sağlamak için NMS-free modellerin mirasını temel alır.

Neden YOLO26 Seçmelisin?

Entegre Ultralytics ekosistemi, parçalanmış akademik depoları şu olanaklarla geride bırakır:

  • Uçtan Uca NMS-Free Tasarım: YOLO26, çıkarım (inference) sırasında Non-Maximum Suppression (NMS) gereksinimini yerel olarak ortadan kaldırır. Bu, uç cihazlarda dağıtım ve autonomous vehicles için kritik olan inanılmaz derecede hızlı ve öngörülebilir gecikme süreleri sağlar.
  • DFL Kaldırma: Distribution Focal Loss'u kaldırarak YOLO26, uç cihazlara aktarım süreçlerini basitleştirir ve hafif uygulamalar için bellek gereksinimlerini önemli ölçüde düşürür.
  • MuSGD Optimize Edici: YOLO26, hibrit SGD ve Muon optimize edicisi ile LLM eğitimindeki yeniliklerden yararlanarak kaya gibi sağlam bir eğitim kararlılığı ve ultra hızlı yakınsama sağlar.
  • %43'e Varan Daha Hızlı CPU Çıkarımı: Derin yapısal optimizasyonlar sayesinde YOLO26, pahalı GPU donanımlarına ihtiyaç duymadan CPU'larda ışık hızında çalışır.
  • Gelişmiş Kayıp Fonksiyonları: ProgLoss + STAL entegrasyonu, küçük nesne tanımada büyük iyileştirmeler sağlayarak drone inspections ve IoT izleme gibi görevler için ideal hale gelir.
  • Çok Yönlülük: Sadece bir dedektör olan DAMO-YOLO'nun aksine YOLO26; Instance Segmentation, Pose Estimation, Image Classification ve Oriented Bounding Box (OBB) görevlerini tek ve birleşik bir çerçevede destekler.
Anında Oluşturmaya Başla

Ultralytics Python API sayesinde, modelinizi dağıtmak için karmaşık damıtma işlem hatlarını manuel olarak yapılandırmanıza veya yüzlerce satır C++ kodu yazmanıza gerek yoktur.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model effortlessly on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run ultra-fast, NMS-free inference
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX or OpenVINO with a single command
model.export(format="openvino")

YOLO26 hakkında daha fazla bilgi edin

Dikkate Alınabilecek Diğer Modeller

Bilgisayarlı görü ekosistemi geniştir. Özel kısıtlamalarınıza bağlı olarak, Ultralytics ekosistemi tarafından tam olarak desteklenen diğer mimarileri de keşfetmek isteyebilirsiniz:

  • YOLO11: retail analytics ve manufacturing quality control alanlarındaki sağlamlığıyla bilinen, YOLO26'nın son derece yetenekli selefi.
  • YOLOv8: Yaygın uç dağıtımını popüler hale getiren, efsanevi ve son derece kararlı çapa içermeyen bir model.
  • RT-DETR: Baidu tarafından geliştirilen, global dikkat mekanizmalarından büyük ölçüde yararlanan görevler için mükemmel bir alternatif sunan, ancak daha yüksek eğitim belleği gereksinimi olan bir Real-Time DEtection TRansformer modeli.

Sonuç

Hem YOLOX hem de DAMO-YOLO, derin öğrenmenin ilerlemesine hayati kavramlar kattı; YOLOX, ayrıştırılmış çapa içermeyen yaklaşımı doğruladı, DAMO-YOLO ise otomatik mimari aramanın gücünü kanıtladı. Ancak gerçek dünyadaki üretim ortamlarında, orijinal araştırma kod tabanlarının karmaşıklığı çevik ekipleri yavaşlatabilir.

Kapsamlı Ultralytics Platform'dan yararlanarak geliştiriciler bu engelleri aşabilirler. YOLO26'nın uçtan uca tasarımı, üstün CPU hızları ve kapsamlı dokümantasyonu ile en son teknoloji vizyon AI'ya ulaşmak her zamankinden daha erişilebilir hale geldi. İster akıllı şehir altyapısı, ister sağlık teşhisleri veya gelişmiş robotik sistemler geliştiriyor ol, Ultralytics ham veriden sağlam, gerçek dünya dağıtımına giden en verimli yolu sağlar.

Yorumlar