YOLOX ve YOLO26: Ankrajsızdan Uçtan Uca Nesne Algılamaya Evrim
Bilgisayar görme alanı, son beş yılda hızlı bir dönüşüm geçirdi ve karmaşık çapa tabanlı mimarilerden, sadeleştirilmiş çapasız tasarımlara geçerek, sonunda doğal olarak uçtan uca sistemlere ulaştı. Bu karşılaştırma, 2021'de piyasaya sürülen önemli bir çapa içermeyen model olan YOLOX ile Ultralytics tarafından Ultralytics piyasaya sürülen son teknoloji (SOTA) uçtan uca dedektör YOLO26 arasındaki teknik farklılıkları incelemektedir.
YOLOX, zamanında araştırma ve performans açısından yüksek bir çıtayı belirlerken, YOLO26, NMS çıkarım ve MuSGD optimizasyonu gibi çığır açan optimizasyonlar sunarak, düşük gecikme süresi ve yüksek doğruluk gerektiren modern üretim ortamları için üstün bir seçim haline gelmiştir.
YOLOX: Bağlantısız Öncü
Megvii araştırmacıları tarafından Temmuz 2021'de yayınlanan YOLOX, önceki YOLO (YOLOv4 ve YOLOv5 gibi) hakim olan çapa tabanlı mantıktan önemli ölçüde ayrıldı. Çapa kutularını ortadan kaldırarak, yazarlar tasarım sürecini basitleştirmeyi ve çapa kümelemeyle ilişkili hiperparametre ayarlama yükünü azaltmayı amaçladılar.
Temel Teknik Özellikler:
- Çapa İçermeyen Mekanizma: Nesne algılamayı bir nokta regresyon problemi olarak ele alarak, önceden tanımlanmış çapa kutularına olan ihtiyacı ortadan kaldırır.
- Ayrılmış Başlık: Sınıflandırma ve yerelleştirme görevlerini ağ başlığının farklı dallarına ayırır, bu da yakınsama hızını ve doğruluğunu artırmaya yardımcı olur.
- SimOTA: Basitleştirilmiş Optimal Transport Assignment (Basitleştirilmiş Optimal Transport Atama) adı verilen, pozitif örnekleri dinamik olarak temel gerçeklere atayan gelişmiş bir etiket atama stratejisi.
YOLOX yenilikçi olmasına rağmen, son işlem için geleneksel Non-Maximum Suppression (NMS) yöntemine dayanmaktadır. Bu adım, yinelenen sınırlayıcı kutuları kaldırır, ancak gecikme değişkenliği ve hesaplama yükü getirir, bu da tamamen gerçek zamanlı uygulamalarda bir darboğaz oluşturabilir.
Model Detayları:
- Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
- Kuruluş: Megvii
- Tarih: 2021-07-18
- Bağlantılar:YOLOX Arxiv | YOLOX GitHub
YOLOX hakkında daha fazla bilgi edinin
YOLO26: Uçtan Uca Standart
Ocak 2026'da Ultralyticstarafından piyasaya sürülen YOLO26, bilgisayar görüşünde verimliliğin zirvesini temsil ediyor. Geleneksel NMS boru hattını tamamen terk ederek, yerel olarak uçtan uca NMS bir tasarım benimsiyor. Bu mimari, modelin algılanan nesnelerin son setini doğrudan çıktısını almasını sağlayarak gecikmeyi önemli ölçüde azaltıyor ve dağıtım mantığını basitleştiriyor.
Temel Teknik Özellikler:
- NMS Mimari: Binlerce aday kutuyu sıralama ve filtreleme işlemlerinin hesaplama maliyetini ortadan kaldırarak, istikrarlı ve öngörülebilir çıkarım süreleri sağlar.
- MuSGD Optimizer: SGD Muon'u birleştiren hibrit bir optimizer (Moonshot AI'nın Kimi K2 gibi Büyük Dil Modeli eğitimindeki yeniliklerden esinlenmiştir). Bu, daha istikrarlı bir eğitim dinamiği ve daha hızlı yakınsama sağlar.
- DFL Kaldırma: Dağıtım Odak Kaybının (DFL) kaldırılması, model başlığını basitleştirerek kenar cihazları ve niceleme araçlarıyla daha uyumlu hale getirir.
- ProgLoss + STAL: Küçük nesnelerin tanınmasınıönemli ölçüde iyileştiren gelişmiş kayıp fonksiyonları (Programatik Kayıp ve Ölçek Teorik Hizalama Kayıp) — drone görüntüleme ve endüstriyel denetim için kritik bir yetenek.
Model Detayları:
- Yazarlar: Glenn Jocher ve Jing Qiu
- Kuruluş: Ultralytics
- Tarih: 2026-01-14
- Bağlantılar:YOLO26 Belgeleri | Ultralytics
YOLO26 hakkında daha fazla bilgi edinin
Neden Uçtan Uca Yaklaşım Önemlidir
YOLOX gibi eski modeller, Non-Maximum Suppression (NMS) kullanılarak filtrelenmesi gereken binlerce gereksiz kutu üretir. Bu işlem CPU ve TPU veya NPU gibi donanım hızlandırıcılarında optimize edilmesi zordur. YOLO26'nın uçtan uca tasarımı bu adımı ortadan kaldırarak sinir ağının doğrudan nihai cevabı vermesini sağlar. Bu, önceki nesillere kıyasla CPU'larda %43'e varan daha hızlı çıkarım yapılmasını mümkün kılar.
Performans Karşılaştırması
Aşağıdaki tablo, iki mimari arasındaki performans farkını göstermektedir. YOLO26, özellikle kenar AI uygulamaları için kullanılan Nano ve Small varyantlarında üstün doğruluk (mAP) ve verimlilik sergilemektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Not: YOLOX hızları, NMS nedeniyle modern donanımlarda genellikle daha yavaştır, oysa YOLO26 metrikleri tüm son işlem süresini içerir.
Mimari Derinlemesine İnceleme
Backbone Baş
YOLOX, algılama başlığını ayırmaya backbone değiştirilmiş bir CSPDarknet backbone kullanır. Etkili olmasına rağmen, bu ayırma işlemi, önceki modellerin paylaşımlı başlık tasarımlarına kıyasla parametre sayısını önemli ölçüde artırır.
Buna karşılık, YOLO26, Neural Architecture Search (NAS) kavramları ile backbone , yüksek düzeyde optimize edilmiş bir backbone kullanır. Baş yapısı, DFL'nin kaldırılmasıyla sadeleştirilmiştir. Bu, model boyutunu küçültmekle kalmaz, aynı zamanda karmaşık çıktı katmanlarıyla zorlanan donanım hızlandırıcılarıyla da mükemmel uyum sağlar. Bu , TensorRT veya ONNX 'e sorunsuz bir şekilde dışa aktarılmasını sağlar.
Kayıp Fonksiyonları ve Eğitim
YOLOX, etiket atama sorununu dinamik olarak çözmek için SimOTA'yı tanıttı. Ancak, hala standart kayıp fonksiyonlarına dayanmaktadır. YOLO26, ProgLoss (Programatik Kayıp) ve STAL (Ölçek Teorik Hizalama Kayıp) fonksiyonlarını dahil ederek bunu daha da geliştirmiştir. Bu kayıplar, nesne boyutu ve eğitim aşamasına göre sınırlayıcı kutu hataları için cezayı dinamik olarak ayarlar ve uzak yayalar veya üretim hataları gibi küçük nesneleri algılamada YOLO tarihsel zayıflığını giderir.
Ayrıca, YOLO26'daki MuSGD optimizer, LLM dünyasındaki stabilite tekniklerini görme alanına getiriyor. Katmanlar arasında güncellemeleri standart SGD daha etkili bir şekilde normalleştirerek, YOLO26 daha az eğitim dönemi ile daha yüksek doğruluk elde ediyor.
İdeal Kullanım Senaryoları
YOLOX ne zaman kullanılır?
YOLOX, akademik çevrelerde değerli bir referans noktası olmaya devam ediyor.
- Araştırma Temelleri: Net ve sabit olmayan yapısı, etiket atama stratejilerini inceleyen araştırmacılar için mükemmel bir temel oluşturur.
- Eski Projeler: MegEngine veya belirli YOLOX çatallarıyla zaten büyük ölçüde entegre olan sistemler için, hemen geçiş yapmak maliyetli olabilir.
YOLO26 Ne Zaman Kullanılmalı
YOLO26, neredeyse tüm yeni ticari ve endüstriyel uygulamalar için önerilen seçimdir.
- Edge Computing: %43'e varan daha hızlı CPU YOLO26, GPU'ların kullanılamadığı Raspberry Pi, Jetson Nano ve mobil cihazlar için idealdir.
- Robotik ve Otonom Sistemler: NMS tasarım, karmaşık sahnelerin (örneğin, kalabalık bir depoda hareket eden bir robot) neden olduğu gecikme artışlarını ortadan kaldırarak belirleyici tepki süreleri sağlar.
- Yüksek Hassasiyetli Denetim: ProgLoss + STAL kombinasyonu, YOLO26'yı küçük kusurları içeren kalite kontrol görevlerinde üstün kılar.
- Çoklu Görev Uygulamaları: Öncelikle bir algılayıcı olan YOLOX'un aksine, Ultralytics Örnek Segmentasyonu, Poz Tahmini ve Yönlendirilmiş Sınırlayıcı Kutular (OBB) için YOLO26'yı destekler.
Ultralytics'in Avantajı
YOLO26'yı seçmek, aynı zamanda kapsamlı Ultralytics ekosistemine erişim elde etmek anlamına gelir. YOLOX bağımsız bir depo sunarken, Ultralytics tüm AI yaşam döngüsünü basitleştiren birleşik bir çerçeve Ultralytics .
- Kullanım Kolaylığı: Tutarlı bir Python , görevler (detect, segment, poz) ve modeller (YOLO26, YOLO11, RT-DETR) arasında tek bir kod satırı değiştirerek geçiş yapmanızı sağlar.
- Eğitim Verimliliği: Ultralytics , eğitim sırasında bellek verimliliği için optimize edilmiştir. Eski mimarilere veya ağır dönüştürücülere kıyasla, tüketici GPU'larında daha büyük gruplar üzerinde eğitim yapabilirsiniz.
- Ultralytics : Ultralytics , veri kümesi yönetimi, otomatik açıklama ekleme ve tek tıklamayla model eğitimi için web tabanlı bir arayüz sunarak ekipler arasındaki işbirliğini kolaylaştırır.
- İyi Bakımlı Ekosistem: Sık güncellemeler, kapsamlı belgeler ve aktif topluluk desteği sayesinde, geliştiriciler hata ayıklama konusunda asla yalnız kalmazlar.
Kod Örneği
YOLO26'yı çalıştırmak, ultralytics paketi. Aşağıdaki örnek, önceden eğitilmiş bir modeli yüklemeyi ve bir görüntü üzerinde çıkarım yapmayı göstermektedir.
from ultralytics import YOLO
# Load the YOLO26 Nano model (highly efficient for CPU)
model = YOLO("yolo26n.pt")
# Perform object detection on an image
# The model handles preprocessing and post-processing internally
results = model.predict("https://ultralytics.com/images/bus.jpg", save=True)
# Display the results
for result in results:
result.show() # Show image in a window
# Print boxes to console
for box in result.boxes:
print(f"Class: {box.cls}, Confidence: {box.conf}, Coordinates: {box.xywh}")
Sonuç
Hem YOLOX hem de YOLO26, nesne algılama tarihindeki önemli dönüm noktalarını temsil ediyor. YOLOX, 2021 yılında çapa tabanlı paradigmaya başarıyla meydan okuyarak, çapa içermeyen modellerin en üst düzey performansa ulaşabileceğini kanıtladı. Ancak YOLO26, çıkarımın "son aşama" sorununu, yani NMS çözerek 2026 yılı için standardı yeniden tanımlıyor.
Uçtan uca mimarisi, MuSGD optimizörü ve özel kayıp fonksiyonları ile YOLO26, hız, doğruluk ve kullanım kolaylığı arasında eşsiz bir denge sunar. Güçlü bulut sunucularında veya kaynakları sınırlı uç cihazlarda sağlam bilgisayar görme çözümleri dağıtmak isteyen geliştiriciler içinYOLO26 kesin seçimdir.
Diğer modern mimarileri keşfetmek isteyenler için, aşağıdaki makaleyi incelemeyi düşünebilirsiniz YOLO11 genel amaçlı algılama veya RT-DETR 'yi gözden geçirmeyi düşünün.