YOLOX ve YOLO26: Çapasız Tespit'ten Uçtan Uca Nesne Tespitine Evrim

Bilgisayarlı görü alanı, son on yılda inanılmaz dönüşümlere tanıklık etti. Bu yolculuktaki iki önemli dönüm noktası, çapasız mimarileri popülerleştiren YOLOX'un piyasaya sürülmesi ve gerçek zamanlı performansı doğal olarak uçtan uca, NMS içermeyen bir tasarımla tamamen yeniden tanımlayan Ultralytics YOLO26'nın yakın zamanda tanıtılmasıdır. Bu kapsamlı karşılaştırma, geliştiricilerin bir sonraki yapay zeka projeleri için bilinçli kararlar almalarına yardımcı olmak amacıyla mimarilerini, performans ölçümlerini ve ideal dağıtım senaryolarını incelemektedir.

Model Genel Bakışları

Her bir modelin kökenlerini ve temel tasarım hedeflerini anlamak, ilgili teknik başarıları için temel bir bağlam sağlar.

YOLOX

Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
Organizasyon: Megvii
Tarih: 2021-07-18
Arxiv: 2107.08430
GitHub: Megvii-BaseDetection/YOLOX
Dokümanlar: YOLOX ReadTheDocs

2021 ortasında tanıtılan YOLOX, ayrıştırılmış bir baş (decoupled head) ve SimOTA olarak bilinen gelişmiş etiket atama stratejisi ile birleştirilmiş çapasız bir tasarımı benimseyerek büyük bir değişimi temsil etti. Önceki mimarilere hakim olan geleneksel çapa kutusu (anchor box) mekanizmalarından uzaklaşan YOLOX, akademik araştırma ile endüstriyel uygulama arasındaki boşluğu başarıyla kapattı ve nesne tespiti için zarif ancak son derece etkili bir çerçeve sundu.

YOLOX hakkında daha fazla bilgi edin

YOLO26

Yazarlar: Glenn Jocher ve Jing Qiu
Organizasyon: Ultralytics
Tarih: 2026-01-14
GitHub: ultralytics/ultralytics
Platform: Ultralytics Platform

2026 başında yayınlanan YOLO26, uç dağıtımı ve basitleştirilmiş eğitim hatlarına yoğun bir şekilde odaklanan, yıllarca süren yinelemeli iyileştirmelerin zirvesidir. Geleneksel Non-Maximum Suppression (NMS) sonrası işleme adımını tamamen ortadan kaldıran uçtan uca NMS içermeyen bir tasarım sunar. Bu atılım, model dağıtımını farklı donanımlarda büyük ölçüde basitleştirir. Ayrıca, Distribution Focal Loss (DFL) modülünü kaldırarak, YOLO26 önemli ölçüde daha düşük gecikme süresi elde eder ve modern bilgisayarlı görü uygulamaları için birinci tercih konumunu sağlamlaştırır.

YOLO26 hakkında daha fazla bilgi edin

Mimari Yenilikler

Bu iki modelin mimarileri, özellikle kayıp fonksiyonları ve sonrası işleme konusunda derin öğrenme metodolojilerinin hızlı ilerleyişini vurgulamaktadır.

YOLOX Yaklaşımı

YOLOX, sınıflandırma ve regresyon görevlerini tahmin başlığında ayrıştırarak, eğitim sırasında yakınsamayı önemli ölçüde hızlandırdı. Çapasız doğası, tasarım parametrelerinin sayısını azalttı ve eğitim öncesinde karmaşık çapa ayarlama ihtiyacını hafifletti. SimOTA etiket atama algoritmasıyla birleştirilen YOLOX, özellikle COCO veri seti gibi standart karşılaştırmalı değerlendirmelerde zamanının en iyi sonuçlarını elde etti.

YOLO26 Avantajı

YOLO26, mimari verimliliği bir üst seviyeye taşıyor. NMS'nin kaldırılması sadece çıkarım gecikmesini düşürmekle kalmaz, aynı zamanda otonom araçlar ve robotik için kritik bir faktör olan tutarlı, belirlenimci yürütme süreleri sağlar.

YOLO26'nın temel yenilikleri şunlardır:

  • MuSGD Optimize Edici: Büyük Dil Modeli (LLM) eğitim tekniklerinden esinlenen bu SGD ve Muon melezi, son derece kararlı eğitim süreçleri ve daha hızlı yakınsama sağlar.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: DFL'yi ortadan kaldırarak ve ağ mimarisini kolaylaştırarak, YOLO26 basit IoT sensörlerinden Raspberry Pi kartlarına kadar kaynak kısıtlı uç cihazlar için yoğun bir şekilde optimize edilmiştir.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, hava görüntüleri analizi ve üretim otomasyonunda hassas kalite kontrolü için kritik olan küçük nesne tanımada kayda değer iyileştirmeler sağlar.
Uç Öncelikli Optimizasyon

Projeniz özel GPU'lara sahip olmayan gömülü sistemleri veya mobil uygulamaları hedefliyorsa, YOLO26'nın optimize edilmiş CPU performansı büyük bir avantaj sağlar ve önceki nesil modellere göre önemli ölçüde daha az hesaplama yükü gerektirir.

Performans ve Kıyaslamalar

Üretim ortamları için modelleri değerlendirirken, hassasiyet, hız ve hesaplama karmaşıklığı arasındaki dengeyi analiz etmek çok önemlidir. Aşağıda, 640 piksel (nano/tiny varyantlar için 416) görüntü boyutunda değerlendirilen standart modellerin ayrıntılı bir karşılaştırması bulunmaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Tabloda görüldüğü gibi, YOLO26 serisi üstün bir performans dengesi sağlar. Örneğin, YOLO26x, YOLOXx modelinin parametrelerinin neredeyse yarısını kullanarak etkileyici bir 57.5 mAP elde eder, bu da doğrudan daha hızlı GPU çıkarım sürelerine (16.1 ms yerine 11.8 ms) ve çok daha üstün dağıtım esnekliğine dönüşür.

Eğitim ve Ekosistem Deneyimi

Bu mimariler arasındaki en derin farklardan biri, kullanılabilirlikleri ve ekosistem destekleridir.

YOLOX, gradyan akışını ve çapasız mekaniği inceleyen araştırmacılar için temel bir depo olarak kalsa da, kurulumu karmaşık olabilir ve genellikle bağımlılıkların ve operatörlerin manuel yapılandırılmasını gerektirir. Buna karşılık, Ultralytics ekosistemi kullanım kolaylığı konusunda endüstri standardını belirler.

Birleşik Python API'sini kullanarak geliştiriciler, YOLO26 modellerini benzersiz bir basitlikle başlatabilir, eğitebilir ve dağıtabilir. Sistem, veri seti indirme, hiperparametre ayarlama ve ONNX, TensorRT ve OpenVINO gibi formatlara sorunsuz dışa aktarma işlemlerini kendi içinde yönetir.

from ultralytics import YOLO

# Initialize the cutting-edge, end-to-end YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model efficiently with built-in MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance on the validation set
metrics = model.val()

# Export the optimized model for edge deployment
model.export(format="onnx")

Ayrıca, Ultralytics YOLO modelleri, eğitim sırasında ağır transformer tabanlı alternatiflere kıyasla önemli ölçüde daha düşük bellek gereksinimlerine sahiptir ve mühendislerin tüketici sınıfı donanımlarda bile daha büyük yığın boyutlarıyla eğitim yapmalarına olanak tanır.

Gerçek Dünya Uygulamaları

YOLOX ve YOLO26 arasında seçim yapmak, nihayetinde dağıtım kısıtlamalarınıza ve çok görevli gereksinimlerinize bağlıdır.

YOLOX'un Öne Çıktığı Noktalar

YOLOX, belirli akademik kıyaslamalar ve MegEngine çerçevesiyle derinlemesine entegre edilmiş eski sistemler için uygun bir aday olmaya devam ediyor. Tarihsel önemi, onu çapasız dedektörleri ve özel atama stratejilerini araştırmak için popüler bir temel oluşturuyor.

YOLO26'nın Öne Çıktığı Alanlar

YOLO26, temel olarak modern endüstriyel uygulamalar için tasarlanmıştır. Örnek segmentasyonu, poz tahmini ve Yönlendirilmiş Sınırlayıcı Kutuları (OBB) doğal olarak desteklediğinden, standart tespit motorlarından çok daha çok yönlüdür.

  • Akıllı Perakende ve Envanter: NMS içermeyen tasarımı kullanmak, otomatik ödeme sistemlerinin video beslemelerini ultra düşük gecikme süresiyle işlemesini garanti eder ve sonrası işleme döngülerinin darboğazı olmadan ürünleri tanır.
  • İHA ve Hava Analitiği: OBB için özel açı kaybı ve ProgLoss + STAL entegrasyonu, YOLO26'yı dönmüş nesneleri ve geniş uydu görüntülerindeki küçük eserleri tespit etmede rakipsiz kılar.
  • Uç Güvenlik Sistemleri: %43 daha hızlı CPU çıkarımı ile YOLO26, şirketlerin pahalı bulut hesaplama gerektirmeden doğrudan ucuz yerel donanım üzerinde sağlam güvenlik analitiği dağıtmalarına olanak tanır.

Kullanım Durumları ve Öneriler

YOLOX ve YOLO26 arasında seçim yapmak, özel proje gereksinimlerinize, dağıtım kısıtlamalarınıza ve ekosistem tercihlerinize bağlıdır.

YOLOX ne zaman seçilmeli?

YOLOX şunlar için güçlü bir seçimdir:

  • Çapasız Algılama Araştırması: Yeni algılama başlıkları veya kayıp işlevleri denemek için YOLOX'un temiz, çapasız mimarisini temel olarak kullanan akademik araştırma.
  • Ultra Hafif Uç Cihazlar: YOLOX-Nano varyantının son derece küçük ayak izinin (0.91M parametre) kritik olduğu mikrodenetleyicilerde veya eski mobil donanımlarda dağıtım yapılması.
  • SimOTA Etiket Atama Çalışmaları: Optimum taşıma tabanlı etiket atama stratejilerini ve bunların eğitim yakınsaması üzerindeki etkisini araştıran araştırma projeleri.

Ne Zaman YOLO26 Seçilmeli

YOLO26 şunlar için önerilir:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Diğer Ultralytics Modellerini Keşfet

Bilgisayarlı görünün evrimini keşfediyorsanız, Ultralytics ailesinde araştırmaya değer başka oldukça yetenekli modeller de vardır:

  • YOLO11: YOLO26'nın doğrudan öncüsü olup, kararlı üretim ortamları için sağlam performans ve yaygın topluluk desteği sunar.
  • YOLOv8: Binlerce gerçek dünya dağıtımında kullanım kolaylığı ve esneklik için standardı belirleyen, yoğun bir şekilde test edilmiş bir mimari.

Sonuç olarak, YOLOX nesne tespiti ortamına önemli kavramlar getirse de, yeni YOLO26 hız, doğruluk ve dağıtım basitliğinde nesiller boyu bir sıçrama sağlayarak onu ileri görüşlü geliştiriciler ve işletmeler için kesin tercih haline getiriyor.

Yorumlar