YOLOX ve DAMO-YOLO: Çapa İçermeyen ve NAS Odaklı Nesne Dedektörlerini Karşılaştırma
Gerçek zamanlı nesne tespitinin evrimi, çapa tabanlıdan çapa içermeyen mimarilere ve manuel olarak tasarlanmış omurgalardan otomatik sinir ağı mimarisi aramasına (NAS) kadar çok sayıda paradigma değişimi görmüştür. Bu kapsamlı teknik karşılaştırmada, bu yolculuktaki iki önemli kilometre taşını analiz edeceğiz: YOLOX ve DAMO-YOLO. Mimari yeniliklerini, eğitim metodolojilerini ve performans dengelerini inceleyecek, aynı zamanda modern Ultralytics YOLO26'nın modern geliştiriciler için nasıl eşsiz bir alternatif sunduğunu da vurgulayacağız.
YOLOX: Çapa İçermeyen Paradigmanın Öncüsü
18 Temmuz 2021'de Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun tarafından Megvii'de yayınlanan YOLOX, YOLO ailesine çapasız (anchor-free) bir tasarım entegre ederek kritik bir dönüm noktası oldu. Ayrıntılı ArXiv teknik raporlarında açıklandığı üzere, YOLOX akademik araştırma ile endüstriyel dağıtım arasındaki boşluğu kapatmayı hedefledi.
Temel Mimari Yenilikler
YOLOX, seleflerine kıyasla önemli yapısal değişiklikler getirerek büyük iyileştirmeler sağladı:
- Çapasız Mekanizma: Bir nesnenin merkezini ve sınırlayıcı kutu boyutlarını doğrudan tahmin ederek, YOLOX tasarım sezgisellerinin sayısını azalttı ve karmaşık çapa kümeleme süreçlerini basitleştirdi. Bu, onu çeşitli bilgisayar görüşü senaryolarına yüksek düzeyde uyarlanabilir kılar.
- Ayrık Başlık: Geleneksel YOLO modelleri, hem sınıflandırma hem de regresyon için tek bir birleşik başlık kullanıyordu. YOLOX, sınıflandırma ve lokalizasyonu ayrı ayrı işleyen ayrık bir başlık uyguladı, bu da çok daha hızlı yakınsadı ve doğruluğu artırdı.
- SimOTA Etiket Ataması: Optimal Taşıma Ataması'nın (OTA) basitleştirilmiş bir versiyonu, pozitif örnekleri dinamik olarak atamak için kullanıldı, bu da eğitim sürelerini azalttı ve merkez nokta atamalarının belirsizliklerini giderdi.
YOLOX'un Mirası
YOLOX'un ayrık başlık tasarımı, nesne dedektörlerinin sonraki nesillerini büyük ölçüde etkiledi ve birçok modern modelde standart bir özellik haline geldi.
YOLOX hakkında daha fazla bilgi edinin
DAMO-YOLO: Ölçekte Otomatik Mimari Arama
Xianzhe Xu ve Alibaba Group'taki bir araştırma ekibi tarafından geliştirilen DAMO-YOLO, 23 Kasım 2022'de tanıtıldı. ArXiv yayınlarında ayrıntılı olarak belirtildiği üzere, model hız ve doğruluk Pareto sınırını zorlamak için Sinirsel Mimari Arama'yı (NAS) yoğun bir şekilde kullandı.
Temel Mimari Yenilikler
DAMO-YOLO'nun stratejisi, verimli yapıların tasarımını otomatikleştirmeye dayanıyordu:
- MAE-NAS Backbone'ları: Çok Amaçlı Evrimsel bir algoritma kullanarak, DAMO-YOLO özellikle TensorRT gibi çerçevelere aktarıldığında belirli gecikme bütçeleri için özelleştirilmiş, oldukça verimli backbone'lar keşfetti.
- Verimli RepGFPN: Farklı uzamsal çözünürlüklerde özellik füzyonunu önemli ölçüde artıran ağır bir boyun tasarımı olup, hava görüntüsü analizi ve değişen ölçeklerde nesneleri detect etmek için oldukça faydalıdır.
- ZeroHead: Modelin genel ortalama Hassasiyetini (mAP) feda etmeden hesaplama fazlalığını azaltan basitleştirilmiş bir tahmin başlığı.
- AlignedOTA ve Damıtma: Daha küçük öğrenci modellerinden maksimum performans elde etmek için gelişmiş etiket ataması ve öğretmen-öğrenci bilgi damıtmasını içerir.
DAMO-YOLO hakkında daha fazla bilgi edinin
Performans ve Metrik Karşılaştırması
Bu iki modeli karşılaştırırken, parametre sayılarına, gerekli FLOP'lara ve gecikme profillerine bakmalıyız. Aşağıda, YOLOX ve DAMO-YOLO'yu birden çok ölçekte karşılaştıran kıyaslama verileri bulunmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Her iki model de etkileyici sonuçlar elde etse de, bazı uyarılarla birlikte gelirler. YOLOX, ayrık başlığının dikkatli ayarlanmasını gerektirirken, DAMO-YOLO'nun damıtmaya yoğun bağımlılığı, özel veri kümeleri üzerinde yeniden eğitimi oldukça kaynak yoğun hale getirir ve büyük miktarda GPU belleği talep eder.
Kullanım Durumları ve Öneriler
YOLOX ve DAMO-YOLO arasında seçim yapmak, projenizin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerinize bağlıdır.
Ne Zaman YOLOX Seçmeli
YOLOX, aşağıdakiler için güçlü bir seçenektir:
- Anchor-Free Algılama Araştırması: YOLOX'un temiz, anchor-free mimarisini yeni algılama başlıkları veya kayıp fonksiyonları denemek için bir temel olarak kullanan akademik araştırmalar.
- Ultra Hafif Kenar Cihazları: YOLOX-Nano varyantının son derece küçük ayak izinin (0.91M parametre) kritik olduğu mikrodenetleyicilerde veya eski mobil donanımlarda dağıtım.
- SimOTA Etiket Atama Çalışmaları: Optimal taşıma tabanlı etiket atama stratejilerini ve bunların eğitim yakınsaması üzerindeki etkilerini araştıran projeler.
Ne Zaman DAMO-YOLO Seçmeli
DAMO-YOLO, aşağıdaki durumlar için önerilir:
- Yüksek Verimli Video Analizi: Batch-1 veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS video akışlarını işleme.
- Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite denetimi gibi özel donanımlarda katı GPU gecikme kısıtlamaları olan senaryolar.
- Sinirsel Mimari Arama Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametrelendirilmiş backboneların algılama performansı üzerindeki etkilerini inceleme.
Ultralytics (YOLO26) Ne Zaman Seçilmeli
Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Ultralytics Avantajı: YOLO26'yı Tanıtıyoruz
YOLOX ve DAMO-YOLO önemli tarihi dönüm noktalarını temsil etse de, modern geliştiriciler, son teknoloji doğruluğu benzersiz kullanım kolaylığıyla birleştiren bir çözüme ihtiyaç duyar. İşte burada Ultralytics YOLO26 bu manzarayı dönüştürüyor. Ocak 2026'da yayınlanan YOLO26, hız, doğruluk ve geliştirici deneyiminin nihai dengesini sunmak için NMS-free modellerin mirası üzerine inşa edilmiştir.
Neden YOLO26'yı Seçmelisiniz?
Entegre Ultralytics ekosistemi, parçalanmış akademik depolardan daha üstün özellikler sunarak öne çıkmaktadır:
- Uçtan Uca NMS-Free Tasarım: YOLO26, çıkarım sırasında Non-Maximum Suppression (NMS)'ı doğal olarak ortadan kaldırır. Bu, kenar dağıtımları ve otonom araçlar için kritik olan inanılmaz hızlı, öngörülebilir gecikme süresi sağlar.
- DFL Kaldırma: Distribution Focal Loss'u kaldırarak, YOLO26 kenar cihazlara aktarım süreçlerini basitleştirir ve hafif uygulamalar için bellek gereksinimlerini önemli ölçüde azaltır.
- MuSGD Optimizatörü: YOLO26, hibrit SGD ve Muon optimizatörü ile LLM eğitim yeniliklerini benimseyerek, kaya gibi sağlam eğitim kararlılığı ve ultra hızlı yakınsama sağlar.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Derin yapısal optimizasyonlar sayesinde, YOLO26 pahalı GPU donanımına ihtiyaç duymadan CPU'larda son derece hızlı çalışır.
- Gelişmiş Kayıp Fonksiyonları: ProgLoss + STAL entegrasyonu, küçük nesne tanımada büyük iyileştirmeler sağlar ve bu da onu drone denetimleri ve IoT izleme gibi görevler için ideal kılar.
- Çok Yönlülük: Kesinlikle bir dedektör olan DAMO-YOLO'nun aksine, YOLO26, tek ve birleşik bir çerçevede Örnek Segmentasyon, Poz Tahmini, Görüntü Sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) görevlerini doğal olarak destekler.
Anında Oluşturmaya Başlayın
Modelinizi dağıtmak için Ultralytics Python API ile karmaşık damıtma boru hatlarını manuel olarak yapılandırmanıza veya yüzlerce satır C++ kodu yazmanıza gerek yoktur.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model effortlessly on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run ultra-fast, NMS-free inference
results = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX or OpenVINO with a single command
model.export(format="openvino")
YOLO26 hakkında daha fazla bilgi edinin
Dikkate Alınması Gereken Diğer Modeller
Bilgisayar görüşü ekosistemi geniştir. Özel kısıtlamalarınıza bağlı olarak, Ultralytics ekosistemi tarafından tam olarak desteklenen diğer mimarileri de keşfetmek isteyebilirsiniz:
- YOLO11: Perakende analizi ve üretim kalite kontrolündeki sağlamlığıyla bilinen, YOLO26'nın oldukça yetenekli öncüsü.
- YOLOv8: Yaygın kenar dağıtımını popülerleştiren efsanevi, oldukça kararlı, anchor-free bir model.
- RT-DETR: Baidu tarafından geliştirilen, küresel dikkat mekanizmalarından büyük ölçüde faydalanan görevler için mükemmel bir alternatif sunan, ancak daha yüksek eğitim belleği gereksinimleri pahasına çalışan bir Gerçek Zamanlı Algılama Dönüştürücüsü (Real-Time DEtection TRansformer).
Sonuç
Hem YOLOX hem de DAMO-YOLO, derin öğrenmenin ilerlemesine hayati kavramlar kattı; YOLOX ayrık, anchor-free yaklaşımı doğrularken, DAMO-YOLO ise otomatik mimari aramanın gücünü gösterdi. Ancak, gerçek dünya üretiminde, orijinal araştırma kod tabanlarının karmaşıklıkları çevik ekipleri yavaşlatabilir.
Kapsamlı Ultralytics Platformu'ndan yararlanarak geliştiriciler bu engelleri aşabilir. YOLO26'nın uçtan uca tasarımı, üstün CPU hızları ve kapsamlı dokümantasyonu sayesinde, son teknoloji görüş yapay zekasına ulaşmak her zamankinden daha erişilebilir hale gelmiştir. İster akıllı şehir altyapısı, ister sağlık teşhisleri veya gelişmiş robotik sistemler inşa ediyor olun, Ultralytics ham veriden sağlam, gerçek dünya dağıtımına giden en verimli yolu sunar.