Link to this sectionDAMO-YOLO ile YOLOX Karşılaştırması#
Gerçek zamanlı bilgisayarlı görü dünyası sürekli gelişiyor. Bu yolculuktaki iki önemli kilometre taşı DAMO-YOLO ve YOLOX'tur; her ikisi de yüksek hızlı ve yüksek doğruluklu nesne tespiti sorununa benzersiz yenilikler getirmiştir. Her iki model de açık kaynak topluluğuna önemli ölçüde katkıda bulunmuş olsa da, mimari farklılıklarını, eğitim metodolojilerini ve ideal dağıtım senaryolarını anlamak makine öğrenimi mühendisleri için çok önemlidir.
Bu kapsamlı rehber, her iki modelin teknik nüanslarını inceliyor ve Ultralytics YOLO26 platformu gibi modern alternatiflerin günümüzün üretim ortamları için neden üstün performans ve kullanım kolaylığı sunduğunu vurguluyor.
Link to this sectionModel Genel Bakışları#
Link to this sectionDAMO-YOLO Detayları#
Alibaba Group'taki araştırmacılardan oluşan bir ekip tarafından geliştirilen DAMO-YOLO, otomatik mimari keşfinden yararlanan, yüksek verimli bir nesne tespit yöntemi olarak tanıtılmıştır.
Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş: Alibaba Group
Tarih: 23.11.2022
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO
Dokümantasyon: DAMO-YOLO Dokümantasyonu
DAMO-YOLO hakkında daha fazla bilgi edin
Link to this sectionYOLOX Detayları#
Megvii araştırmacıları tarafından oluşturulan YOLOX, YOLO serisini çapasız (anchor-free) bir tasarıma geçerek mimariyi büyük ölçüde basitleştirmeyi ve o dönem için daha iyi performans elde etmeyi amaçlamış, böylece araştırma ve endüstri toplulukları arasındaki boşluğu kapatmayı hedeflemiştir.
Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
Kuruluş: Megvii
Tarih: 18.07.2021
Arxiv: https://arxiv.org/abs/2107.08430
GitHub: https://github.com/Megvii-BaseDetection/YOLOX
Dokümantasyon: YOLOX Dokümantasyonu
YOLOX hakkında daha fazla bilgi edinin
Link to this sectionMimari Analiz#
Link to this sectionDAMO-YOLO Mimarisi#
DAMO-YOLO, büyük ölçüde Nöral Mimari Arama (NAS) yöntemine dayanır. Temel bileşenleri şunlardır:
- MAE-NAS Omurgalar: Çıkarım hızı ve doğruluk arasında en uygun dengeyi sağlayan omurgaları keşfetmek için çok amaçlı evrimsel bir arama algoritması kullanır.
- Efficient RepGFPN: Özellik füzyonu için uyarlanmış ve modelin değişen nesne ölçeklerinde yüksek doğruluğu korumasına yardımcı olan ağır bir boyun (neck) tasarımıdır.
- ZeroHead: Son tahmin katmanlarındaki hesaplama yükünü azaltan basitleştirilmiş, hafif bir tespit kafasıdır.
Link to this sectionYOLOX Mimarisi#
YOLOX, yapısal basitliğe ve çapasız tasarıma odaklanarak farklı bir yaklaşım benimsemiştir:
- Çapasız (Anchor-Free) Mekanizma: Önceden tanımlanmış çapalar olmadan sınırlayıcı kutu koordinatlarını doğrudan tahmin ederek, YOLOX tasarım parametrelerinin sayısını ve gereken sezgisel ayarlamaları azaltır.
- Ayrıştırılmış (Decoupled) Kafa: Sınıflandırma ve regresyon görevlerini farklı özellik dallarına ayırır, bu da yakınsama hızını ve genel doğruluğu artırır.
- SimOTA Etiket Atama: Pozitif örnekleri temel gerçeklere dinamik olarak atayan ve eğitim verimliliğini artıran gelişmiş bir etiket atama stratejisidir.
DAMO-YOLO, sıkı kısıtlamalar altında en uygun mimarileri bulmak için makine odaklı NAS aramalarından yararlanırken, YOLOX nesne tespit hattını kolaylaştırmak için zarif, insan tasarımı basitleştirmeleri (çapasız kafalar gibi) kullanır.
Link to this sectionPerformans Karşılaştırması#
Bu modelleri değerlendirmek için ortalama Ortalama Hassasiyete (mAP), çıkarım hızlarına ve parametre sayılarına bakmak gerekir. Aşağıda her iki mimarinin standart ve hafif çeşitlerinin detaylı bir karşılaştırma tablosu bulunmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
YOLOXx 51.1 mAP ile en yüksek mutlak mAP değerine ulaşırken, DAMO-YOLOl yarıdan az parametre sayısı (42.1M'ye karşı 99.1M) ve önemli ölçüde daha hızlı TensorRT çalışması ile oldukça rekabetçi olan 50.8 mAP performansı sunar.
Link to this sectionEğitim Metodolojileri#
Link to this sectionDAMO-YOLO Eğitimi#
DAMO-YOLO, eğitim sırasında karmaşık damıtma (distillation) iyileştirmelerini kullanır. Genellikle önce büyük bir "öğretmen" model eğitilir ve ardından bilgisi daha küçük "öğrenci" modellere aktarılır. Ayrıca dinamik etiket atama için AlignedOTA kullanır. Çok etkili olsa da, bu çok aşamalı eğitim süreci, GPU hesaplama süresini ve gereken bellek yükünü önemli ölçüde artırır.
Link to this sectionYOLOX Eğitimi#
YOLOX, MixUp ve Mosaic gibi güçlü veri artırma stratejilerine dayanır. Ancak yazarlar, bu güçlü artırmaların son 15 dönem (epoch) için kapatılmasının modelin gerçeklik farkını kapatmasını sağladığını ve nihai doğruluk metriklerini önemli ölçüde artırdığını keşfetmişlerdir.
Link to this sectionİdeal Kullanım Senaryoları#
- DAMO-YOLO: Sunucu tarafı damıtma hatlarının desteklenebildiği ve hedef donanımın (belirli NVIDIA GPU'lar gibi) ağır boyunlu NAS mimarisinden doğrudan yararlandığı yüksek riskli endüstriyel dağıtımlar için en uygundur.
- YOLOX: Saf bir çapasız yaklaşım arayan geliştiriciler için mükemmeldir. Son derece hafif olan
YOLOXnano, eski Android cihazlar, uç bilişim ve parametre sayısının mutlak bir darboğaz olduğu çok kısıtlı IoT sensörleri için kullanılabilir kılar.
Link to this sectionUltralytics Avantajı: YOLO26 ile Tanışın#
DAMO-YOLO ve YOLOX mükemmel kilometre taşlarını temsil etse de, günümüzde geliştiriciler daha kapsamlı, çok yönlü ve kullanımı kolay çözümler talep etmektedir. İşte Ultralytics Platformu ve yeni yayınlanan Ultralytics YOLO26 burada parlıyor.
Ocak 2026'da yayınlanan YOLO26, tüm bilgisayarlı görü görevleri için en üst düzeyde önerilen modeldir. Eski mimarileri aşan bir dizi atılım sunar:
- Uçtan Uca NMS'siz Tasarım: YOLO26, NMS (Non-Maximum Suppression) son işleme adımını yerel olarak ortadan kaldırır. Bu, geleneksel tespit kafalarında bulunan gecikme darboğazlarından kaçınarak çok daha basit ve hızlı bir dağıtıma olanak tanır.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Dağılımsal Odak Kaybı'nı (DFL) stratejik olarak kaldırarak ve katmanları optimize ederek, YOLO26 CPU'lar ve uç donanımlarda benzersiz hızlar sunar.
- MuSGD İyileştirici: Büyük dil modeli (LLM) eğitim tekniklerinden esinlenen YOLO26, son derece kararlı eğitim süreçleri ve YOLOX'taki eski kurulumlara kıyasla çok daha hızlı yakınsama sağlayan (SGD ve Muon'un bir melezi olan) MuSGD iyileştiricisini tanıtır.
- ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, küçük nesne tanımada kayda değer iyileştirmeler sağlar ve YOLO26'yı drone görüntüleri ve robotik için çok daha üstün kılar.
- Çok Yönlülük: Yalnızca nesne tespitine yönelik olan DAMO-YOLO'nun aksine, YOLO26 örnek segmentasyonu, poz tahmini, sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutuları (OBB) aynı iyi bakılan ekosistem içinde yerel olarak sorunsuz bir şekilde ele alır.
YOLO26 hakkında daha fazla bilgi edin
Link to this sectionUltralytics ile Kullanım Kolaylığı#
Ultralytics Python API'si geliştirici deneyimini kolaylaştırır. En son teknoloji ürünü bir YOLO26 modelini eğitmek, çok daha az standart kod gerektirir ve DAMO-YOLO'nun karmaşık damıtma hatlarından kaçınır. Ayrıca, Ultralytics modelleri ağır transformer tabanlı modellere kıyasla eğitim sırasında son derece düşük CUDA bellek gereksinimlerine sahiptir.
from ultralytics import YOLO
# Load the latest Ultralytics YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on your custom dataset with one line of code
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run fast, NMS-free inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")Tüm veri sürümlerini ve bulut GPU tedarikini sizin için yöneten Ultralytics Platformu ile modelleri otomatik olarak etiketleyebilir, eğitebilir ve uca dağıtabilirsiniz.
Link to this sectionSonuç#
DAMO-YOLO ile YOLOX arasında seçim yapmak belirli kısıtlamalara bağlıdır: DAMO-YOLO, NAS aracılığıyla belirli GPU'larda olağanüstü hız-doğruluk oranları sunarken, YOLOX hafif uç senaryolar için ideal olan temiz, çapasız bir tasarım sağlar.
Ancak, aktif bir topluluğa sahip modern ve geleceğe dönük bir çözüm arayan ekipler için Ultralytics YOLO26 mimarisi kesin seçimdir. NMS'siz tasarımı, hızlı CPU çıkarımı ve tespit, segmentasyon ve poz görevleri için birleşik API'si, araştırmadan sağlam, gerçek dünya üretimine sorunsuz geçiş için onu benzersiz kılar.
Diğer modern mimarileri keşfetmek isteyen geliştiriciler için ayrıca Ultralytics YOLO11 veya kapsamlı Ultralytics dokümantasyonunda bulunan RT-DETR gibi transformer tabanlı modellere göz atmalarını öneririz.