Link to this sectionYOLOX ve DAMO-YOLO#
Gerçek zamanlı nesne algılamanın evrimi, çapa tabanlı mimarilerden çapa içermeyen (anchor-free) mimarilere ve manuel tasarlanmış omurgalardan otomatik sinirsel mimari aramaya (NAS) kadar sayısız paradigma değişimine tanık olmuştur. Bu kapsamlı teknik karşılaştırmada, bu yolculuktaki iki önemli kilometre taşını analiz edeceğiz: YOLOX ve DAMO-YOLO. Bunların mimari yeniliklerini, eğitim metodolojilerini ve performans ödünleşimlerini keşfederken, modern Ultralytics YOLO26 modelinin günümüz geliştiricileri için nasıl benzersiz bir alternatif sunduğunu da vurgulayacağız.
Link to this sectionYOLOX: Çapasız Paradigmanın Öncüsü#
18 Temmuz 2021'de Megvii'den Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun tarafından yayınlanan YOLOX, çapa içermeyen bir tasarımı YOLO ailesine başarıyla entegre ederek kritik bir dönüm noktası oluşturdu. Detaylı ArXiv teknik raporlarında açıklandığı üzere YOLOX, akademik araştırmalar ile endüstriyel dağıtım arasındaki boşluğu doldurmayı amaçladı.
Link to this sectionTemel Mimari Yenilikler#
YOLOX, seleflerine göre önemli ölçüde gelişme sağlayan çeşitli temel yapısal değişiklikler getirdi:
- Çapa İçermeyen Mekanizma: Bir nesnenin merkezini ve sınırlayıcı kutu boyutlarını doğrudan tahmin ederek YOLOX, tasarım buluşsal yöntemlerinin sayısını azalttı ve karmaşık çapa kümeleme süreçlerini basitleştirdi. Bu da onu çeşitli bilgisayarlı görü senaryolarına son derece uyumlu hale getiriyor.
- Ayrıştırılmış Başlık (Decoupled Head): Geleneksel YOLO modelleri, sınıflandırma ve regresyon için tek bir birleşik başlık kullanıyordu. YOLOX, sınıflandırma ve yerelleştirmeyi ayrı ayrı işleyen ayrıştırılmış bir başlık uyguladı; bu da çok daha hızlı yakınsama sağladı ve doğruluğu artırdı.
- SimOTA Etiket Atama: Pozitif örnekleri dinamik olarak atamak için Optimal Taşıma Atamasının (OTA) basitleştirilmiş bir versiyonu kullanıldı; bu da eğitim sürelerini kısalttı ve merkez noktası atamalarındaki belirsizliklerin üstesinden geldi.
YOLOX'un ayrıştırılmış başlık tasarımı, sonraki nesil nesne algılayıcılarını büyük ölçüde etkileyerek birçok modern modelde standart bir özellik haline geldi.
YOLOX hakkında daha fazla bilgi edin
Link to this sectionDAMO-YOLO: Ölçeklenebilir Otomatik Mimari Arama#
Alibaba Group'tan Xianzhe Xu ve bir araştırmacı ekibi tarafından geliştirilen DAMO-YOLO, 23 Kasım 2022'de tanıtıldı. ArXiv yayınlarında detaylandırıldığı üzere model, hız ve doğruluk Pareto sınırını zorlamak için Sinirsel Mimari Aramadan (NAS) yoğun bir şekilde yararlandı.
Link to this sectionTemel Mimari Yenilikler#
DAMO-YOLO'nun stratejisi, verimli yapıların tasarımını otomatikleştirmek üzerine kuruluydu:
- MAE-NAS Omurgalar: Çok Amaçlı Evrimsel bir algoritma kullanan DAMO-YOLO, özellikle TensorRT gibi çerçevelere aktarıldığında, belirli gecikme bütçeleri için özelleştirilmiş, oldukça verimli omurgalar keşfetti.
- Verimli RepGFPN: Farklı uzamsal çözünürlüklerde özellik birleştirmeyi önemli ölçüde geliştiren ağır bir boyun tasarımı; bu, hava görüntüleri analizi ve değişen ölçeklerdeki nesneleri algılamak için son derece faydalıdır.
- ZeroHead: Modelin genel ortalama Hassasiyetinden (mAP) ödün vermeden hesaplama fazlalığını azaltan basitleştirilmiş bir tahmin başlığı.
- AlignedOTA ve Distilasyon: Daha küçük öğrenci modellerinden maksimum performans elde etmek için gelişmiş etiket atama ve öğretmen-öğrenci bilgi distilasyonunu (damıtma) birleştirir.
DAMO-YOLO hakkında daha fazla bilgi edinin
Link to this sectionPerformans ve Metrik Karşılaştırması#
Bu iki modeli karşılaştırırken parametre sayılarına, gerekli FLOP'lara ve gecikme profillerine bakmalıyız. Aşağıda, YOLOX ve DAMO-YOLO'yu birçok ölçekte karşılaştıran kıyaslama verileri yer almaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Her iki model de etkileyici sonuçlar elde etse de, bazı dezavantajları vardır. YOLOX'un ayrıştırılmış başlığının dikkatli bir şekilde ayarlanması gerekirken, DAMO-YOLO'nun distilasyona olan ağır bağımlılığı, özel veri setlerinde yeniden eğitimi oldukça kaynak yoğun hale getirerek büyük miktarda GPU belleği gerektirir.
Link to this sectionKullanım Durumları ve Öneriler#
YOLOX ile DAMO-YOLO arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
Link to this sectionNe Zaman YOLOX Seçilmeli#
YOLOX şunlar için güçlü bir tercihtir:
- Anchor-Free Algılama Araştırmaları: Yeni algılama başlıkları veya kayıp fonksiyonlarını denemek için YOLOX'un temiz, anchor-free mimarisini temel olarak kullanan akademik araştırmalar.
- Ultra Hafif Uç Cihazlar: YOLOX-Nano varyantının son derece küçük ayak izinin (0.91M parametre) kritik olduğu mikrodenetleyicilerde veya eski mobil donanımlarda dağıtım yapmak.
- SimOTA Etiket Atama Çalışmaları: Optimum taşıma tabanlı etiket atama stratejilerini ve bunların eğitim yakınsaması üzerindeki etkilerini araştıran araştırma projeleri.
Link to this sectionNe Zaman DAMO-YOLO Seçilmeli#
DAMO-YOLO şunlar için önerilir:
- Yüksek Verimli Video Analitiği: Toplu-1 (batch-1) veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS'li video akışlarını işleme.
- Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite kontrol gibi, özel donanımlarda katı GPU gecikme kısıtlamaları olan senaryolar.
- Neural Architecture Search Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametreleştirilmiş omurgaların algılama performansı üzerindeki etkilerini inceleme.
Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#
Çoğu yeni proje için, Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Link to this sectionUltralytics Avantajı: YOLO26 ile Tanışın#
YOLOX ve DAMO-YOLO önemli tarihi kilometre taşlarını temsil etse de, modern geliştiriciler en son doğruluk seviyesini benzersiz bir kullanım kolaylığı ile birleştiren bir çözüme ihtiyaç duyarlar. Ultralytics YOLO26 burada manzarayı değiştiriyor. Ocak 2026'da piyasaya sürülen YOLO26, hız, doğruluk ve geliştirici deneyiminin en üst düzey dengesini sunmak için NMS'siz modellerin mirasının üzerine inşa edilmiştir.
Link to this sectionNeden YOLO26 Seçmelisin?#
Entegre Ultralytics ekosistemi, şunları sunarak parçalı akademik depolardan daha üstündür:
- End-to-End NMS-Free Design: YOLO26 natively eliminates Non-Maximum Suppression (NMS) during inference. This results in incredibly fast, predictable latency critical for edge deployments and autonomous vehicles.
- DFL Kaldırma: Distribution Focal Loss'u kaldırarak YOLO26, uç cihazlara aktarım süreçlerini basitleştirir ve hafif uygulamalar için bellek gereksinimlerini önemli ölçüde düşürür.
- MuSGD Optimize Edici: YOLO26, hibrit SGD ve Muon optimize edicisi ile LLM eğitim yeniliklerinden yararlanarak kaya gibi sağlam bir eğitim kararlılığı ve ultra hızlı yakınsama sağlar.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Derin yapısal optimizasyonlar sayesinde YOLO26, pahalı GPU donanımına ihtiyaç duymadan CPU'larda ışık hızında çalışır.
- Gelişmiş Kayıp Fonksiyonları: ProgLoss + STAL entegrasyonu, küçük nesne tanımada büyük iyileştirmeler sağlayarak drone denetimleri ve IoT izleme gibi görevler için ideal hale gelir.
- Çok Yönlülük: Sadece bir algılayıcı olan DAMO-YOLO'nun aksine YOLO26, Örnek Segmentasyonu, Poz Tahmini, Görüntü Sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) görevlerini tek, birleşik bir çerçevede yerel olarak destekler.
Ultralytics Python API ile modelini dağıtmak için karmaşık distilasyon boru hatlarını manuel olarak yapılandırmana veya yüzlerce satır C++ kodu yazmana gerek yok.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model effortlessly on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run ultra-fast, NMS-free inference
results = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX or OpenVINO with a single command
model.export(format="openvino")YOLO26 hakkında daha fazla bilgi edin
Link to this sectionDikkate Alınacak Diğer Modeller#
Bilgisayarlı görü ekosistemi çok geniştir. Özel kısıtlamalarına bağlı olarak, Ultralytics ekosistemi tarafından tamamen desteklenen diğer mimarileri de keşfetmek isteyebilirsin:
- YOLO11: Perakende analitiği ve üretim kalite kontrolündeki sağlamlığıyla bilinen, YOLO26'nın son derece yetenekli selefi.
- YOLOv8: Yaygın uç cihaz dağıtımını popülerleştiren, efsanevi ve son derece kararlı çapa içermeyen bir model.
- RT-DETR: Baidu tarafından geliştirilen, daha yüksek eğitim belleği gereksinimi pahasına küresel dikkat mekanizmalarından büyük ölçüde yararlanan görevler için mükemmel bir alternatif sunan Gerçek Zamanlı DEteksiyon TRansformer'ı.
Link to this sectionSonuç#
Hem YOLOX hem de DAMO-YOLO, derin öğrenmenin ilerlemesine hayati kavramlar kattı; YOLOX, ayrıştırılmış ve çapa içermeyen yaklaşımı doğrularken, DAMO-YOLO otomatik mimari aramanın gücünü kanıtladı. Ancak gerçek dünya üretimi için, orijinal araştırma kod tabanlarının karmaşıklığı çevik ekipleri yavaşlatabilir.
Kapsamlı Ultralytics Platform'dan yararlanarak geliştiriciler bu engelleri aşabilir. YOLO26'nın uçtan uca tasarımı, üstün CPU hızları ve kapsamlı dokümantasyonu ile son teknoloji görü yapay zekasına ulaşmak her zamankinden daha erişilebilir. Akıllı şehir altyapısı, sağlık tanıları veya gelişmiş robotik inşa ediyor olsan da Ultralytics, ham veriden sağlam, gerçek dünya dağıtımına giden en verimli yolu sağlar.