İçeriğe geç

YOLO26 ve YOLOX: Gerçek Zamanlı Nesne Algılamanın Evrimi

Bilgisayar görüşü alanı son beş yılda hızla gelişerek karmaşık, bağlantı noktası tabanlı mimarilerden modern, yüksek performanslı modellere geçiş yapmıştır. Bu karşılaştırma, bu zaman çizelgesindeki iki önemli modeli incelemektedir: 2021'de piyasaya sürülen çığır açan çapa içermeyen dedektör YOLOX ve Ultralytics tarafından Ocak Ultralytics piyasaya sürülen son teknoloji görme modeli YOLO26. YOLOX birçok modern mimari kararın önünü açarken, YOLO26 bu gelişmelerin doruk noktasını temsil ederek üstün hız, doğruluk ve dağıtım kolaylığı sunmaktadır.

Modele Genel Bakış

Ultralytics YOLO26

2026 yılının Ocak ayında piyasaya sürülen YOLO26, yeni nesil Edge AI için tasarlanmıştır. Yerel uçtan uca (NMS) bir mimari sunarak, genellikle dağıtımı yavaşlatan son işlem adımlarına olan ihtiyacı ortadan kaldırır. Dağıtım Odak Kaybını (DFL) ortadan kaldırarak ve büyük dil modeli eğitiminden esinlenerek MuSGD optimizasyonunu sunan YOLO26, önceki nesillere kıyasla %43'e varan daha hızlı CPU hızları elde ederek IoT uygulamaları ve robotik için en iyi seçim haline gelmiştir.

Glenn Jocher ve Jing Qiu
Ultralytics
14 Ocak 2026
GitHub | Dokümanlar

YOLO26 hakkında daha fazla bilgi edinin

YOLOX

Megvii tarafından 2021 yılında piyasaya sürülen YOLOX, ayrıştırılmış kafa ve SimOTA etiket atamasına geçiş yapan ilk yüksek performanslı "ankrajsız" dedektörlerden biriydi. O dönemde akademik araştırma ile endüstriyel uygulama arasındaki boşluğu başarıyla dolduran bu cihaz, eğitim istikrarı için çapa kutularını ve NMS ortadan kaldırarak öncekilerden (YOLOv4 ve YOLOv5 gibi) daha temiz bir tasarım sunsa da, çıkarım NMS hala NMS gerektiriyordu.

Zheng Ge, Songtao Liu, et al.
Megvii
18 Temmuz 2021
ArXiv | GitHub

Teknik Performans Karşılaştırması

Aşağıdaki tablo, iki model arasındaki performans farklarını göstermektedir. YOLO26, özellikle mimarisi düşük gecikmeli yürütme için optimize edilmiş CPU , hem doğruluk (mAP) hem de verimlilik açısından önemli kazanımlar göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Performans Bağlamı

YOLOXnano daha düşük parametrelere ve FLOP'lara sahip olmakla birlikte, YOLO26n'ye (640 mAP 40,9 mAP ) kıyasla önemli ölçüde daha düşük çözünürlük (416 px) ve doğruluk (25, mAP) ile çalışır. Etkili doğruluk için normalleştirildiğinde, YOLO26 çok daha üstün bir çıkarım gecikmesi sunar.

Mimari Yenilikler

Uçtan Uca vs. Son İşleme

En önemli fark, dağıtım sürecinde yatmaktadır. YOLOX, sabit noktaya bağlı değildir ancak yine de yinelenen sınırlayıcı kutuları filtrelemek için Non-Maximum Suppression (NMS) yöntemine dayanır. NMS , sıralama ve sıralı işlemler içerdiğinden, hesaplama açısından NMS ve kenar donanımlarında (FPGA veya NPU gibi) optimize edilmesi zordur.

YOLO26, YOLOv1'de öncülüğünü yaptığı bir konsept olan yerel uçtan uca tasarımı benimser. YOLOv10tarafından başlatılan bir konsept olan, yerel olarak uçtan uca bir tasarım benimser. Bu tasarım, NMS olmadan ağdan doğrudan nihai algılamayı çıkarır. Bunun sonucunda:

  1. Daha düşük gecikme süresi: Son işlem yükü yoktur.
  2. Belirleyici Gecikme: Nesne yoğunluğundan bağımsız olarak çıkarım süresi sabittir.
  3. Basitleştirilmiş Dağıtım: ONNX veya TensorRT 'e dışa aktarma işlemi, özel NMS gerek olmadığı için oldukça basittir.

Eğitim Kararlılığı: MuSGD ile SGD Karşılaştırması

YOLOX, 2021 için geliştirilmiş olan, ayrıştırılmış başlıklara sahip standart Stokastik Gradyan İnişi (SGD) kullanır. Ancak YOLO26, SGD Muon optimizer'ın (Moonshot AI'nın Kimi K2'sinden esinlenerek) bir karışımı olan MuSGD Optimizer'ı sunar. Bu yenilik, Büyük Dil Modeli (LLM) eğitiminden gelen istikrar özelliklerini bilgisayar görüşüne getirerek, eğitim süreci sırasında daha hızlı yakınsama ve daha sağlam özellik çıkarma sağlar.

Kayıp Fonksiyonları

YOLOX, IoU ve ayrıştırılmış baş stratejisi kullanır. YOLO26, bunu ProgLoss + STAL (Yumuşak Hedef Atama Kaybı) ile geliştirir. Bu kombinasyon, tek aşamalı dedektörlerin geleneksel zayıflığı olan küçük nesne algılama sorununu özel olarak ele alır. ProgLoss, eğitim sırasında kayıp ağırlığını dinamik olarak ayarlar ve modelin eğitim ilerledikçe daha zor örnekler (genellikle küçük veya örtülü nesneler) üzerine odaklanmasını sağlar.

Ekosistem ve Kullanım Kolaylığı

İki çerçeve arasındaki belirleyici farklardan biri, onları çevreleyen ekosistemdir.

Ultralytics'in Avantajı

YOLO26 kullanarak, veri yönetimi, açıklama ve model eğitimi için kapsamlı bir araç seti olan Ultralytics erişim sağlanır.

from ultralytics import YOLO

# Load the model
model = YOLO("yolo26n.pt")

# Train on custom data
model.train(data="coco8.yaml", epochs=100)

# Export for deployment
model.export(format="onnx")

YOLOX Karmaşıklığı

YOLOX öncelikle bir araştırma deposudur. Güçlü olmasına rağmen, veri kümeleri ve eğitim boru hatları için daha fazla manuel yapılandırma gerektirir. Aynı depo içinde standart algılama dışındaki görevler (poz veya segmentasyon gibi) için yerel destekten yoksundur ve kenar formatlarına dışa aktarma genellikle harici komut dosyaları veya üçüncü taraf araçları (gibi) gerektirir. onnx-simplifier).

Gerçek Dünya Uygulamaları

Akıllı Perakendecilik ve Envanter

Envanter yönetimi gerektiren perakende ortamları için YOLO26 en üstün seçimdir. DFL (Dağıtım Odak Kaybı) özelliğinin kaldırılması ve uçtan uca mimarisi, akıllı raf kameralarında bulunan düşük güçlü ARM CPU'larda verimli bir şekilde çalışmasını sağlar. YOLO26'nın YOLOX'a (40,5 mAP) göre geliştirilmiş doğruluğu (48,6 mAP), daha az yanlış negatifle daha iyi stok doğruluğu sağlar.

Otonom Drone Navigasyonu

Dronlar, minimum gecikmeyle yüksek çözünürlüklü görüntüleri işlemek zorundadır. YOLO26, havadan görüntülerde uzaktaki araçlar veya elektrik hatları gibi küçük nesnelerin algılanmasını geliştiren ProgLoss sayesinde bu alanda üstünlük sağlar. NMS çıktı, drone'un kontrol döngüsünün tutarlı bir hızda veri almasını sağlar ve bu, çarpışma önleme sistemleri için çok önemlidir. Tersine, YOLOX'un NMS bağımlılığı, karmaşık ortamlarda (örneğin, orman veya kalabalık üzerinde uçarken) gecikme artışlarına neden NMS ve bu da uçuş stabilitesini tehlikeye atabilir.

Endüstriyel Robotik

Üretimde, robotik kollar genellikle alma ve yerleştirme görevleri için görme özelliğini kullanır. YOLO26 ekosistemi, eksenle hizalanmamış nesneleri kavramak için çok önemli olan nesnelerin açısını sağlayan OBB (Oriented Bounding Boxes) özelliğini destekler. YOLOX, OBB'yi desteklemek için önemli değişiklikler gerektirirken, YOLO26 bu özelliği kullanıma hazır olarak destekler.

Sonuç

YOLOX, çapa içermeyen algılamayı popüler hale getiren önemli bir dönüm noktası olsa da, YOLO26 verimli bilgisayar görüşünün geleceğini temsil ediyor. Uçtan uca tasarımı, üstün doğruluk-gecikme oranı ve Ultralytics sağlam desteği ile YOLO26, 2026 yılında hem akademik araştırma hem de ticari kullanım için önerilen seçimdir.

Farklı mimari ödünleşmeler gerektiren geliştiriciler için, YOLO11 kanıtlanmış bir alternatif sunar ve RT-DETR gibi dönüştürücü tabanlı modeller GPU ortamlar için yüksek doğruluk sağlar.


Yorumlar