İçeriğe geç

YOLOX vs YOLO26: Anchor-Free'den Uçtan Uca Nesne detect'e Evrim

Bilgisayar görüşü alanı, son on yılda inanılmaz dönüşümlere tanık oldu. Bu yolculuktaki iki önemli kilometre taşı, çapa içermeyen mimarileri popülerleştiren YOLOX'un piyasaya sürülmesi ve yerel olarak uçtan uca, NMS içermeyen bir tasarımla gerçek zamanlı performansı tamamen yeniden tanımlayan Ultralytics YOLO26'nın yakın zamanda tanıtılmasıdır. Bu kapsamlı karşılaştırma, geliştiricilerin bir sonraki yapay zeka projeleri için bilinçli kararlar almalarına yardımcı olmak amacıyla bu modellerin mimarilerini, performans metriklerini ve ideal dağıtım senaryolarını incelemektedir.

Model Genel Bakışları

Her modelin kökenlerini ve birincil tasarım hedeflerini anlamak, ilgili teknik başarıları için temel bir bağlam sağlar.

YOLOX

Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
Kuruluş: Megvii
Tarih: 2021-07-18
Arxiv: 2107.08430
GitHub: Megvii-BaseDetection/YOLOX
Belgeler: YOLOX ReadTheDocs

2021 ortalarında tanıtılan YOLOX, ayrık bir başlık ve SimOTA olarak bilinen gelişmiş etiket atama stratejisiyle birleşen çapa içermeyen bir tasarım benimseyerek önemli bir değişim temsil etti. Önceki mimarilere hakim olan geleneksel çapa kutusu mekanizmalarından uzaklaşarak, YOLOX akademik araştırma ile endüstriyel uygulama arasındaki boşluğu başarıyla kapattı ve nesne algılama için zarif ama son derece etkili bir çerçeve sundu.

YOLOX hakkında daha fazla bilgi edinin

YOLO26

Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş: Ultralytics
Tarih: 2026-01-14
GitHub: ultralytics/ultralytics
Platform: Ultralytics Platform

2026 başlarında piyasaya sürülen YOLO26, yıllarca süren yinelemeli iyileştirmelerin doruk noktasıdır ve büyük ölçüde uç cihaz dağıtımına ve basitleştirilmiş eğitim işlem hatlarına odaklanmıştır. Geleneksel Non-Maximum Suppression (NMS) ön işleme sonrası adımını tamamen ortadan kaldıran uçtan uca NMS içermeyen bir tasarım sunar. Bu çığır açan gelişme, modelin farklı donanımlara dağıtımını önemli ölçüde basitleştirir. Ayrıca, Distribution Focal Loss (DFL) modülünü kaldırarak, YOLO26 önemli ölçüde daha düşük gecikme süresi elde eder ve modern bilgisayar görüşü uygulamaları için önde gelen bir seçenek olarak konumunu sağlamlaştırır.

YOLO26 hakkında daha fazla bilgi edinin

Mimari Yenilikler

Bu iki modelin mimarileri, özellikle kayıp fonksiyonları ve ön işleme sonrası açısından derin öğrenme metodolojilerinin hızlı ilerlemesini vurgulamaktadır.

YOLOX Yaklaşımı

YOLOX, tahmin başlığındaki sınıflandırma ve regresyon görevlerini ayırarak eğitim sırasında yakınsamayı önemli ölçüde hızlandırdı. Çapa içermeyen yapısı, tasarım parametrelerinin sayısını azaltarak eğitim öncesinde karmaşık çapa ayarlamasına olan ihtiyacı azalttı. SimOTA etiket atama algoritmasıyla birleştiğinde, YOLOX zamanının en iyi sonuçlarını, özellikle COCO veri kümesi gibi standart kıyaslamalarda elde etti.

YOLO26 Avantajı

YOLO26, mimari verimliliği bir sonraki seviyeye taşıyor. NMS'nin kaldırılması, yalnızca çıkarım gecikmesini azaltmakla kalmaz, aynı zamanda otonom araçlar ve robotik için kritik bir faktör olan tutarlı, deterministik yürütme süreleri sağlar.

Temel YOLO26 yenilikleri şunlardır:

  • MuSGD Optimizasyoncu: Büyük Dil Modeli (LLM) eğitim tekniklerinden esinlenilen bu SGD ve Muon hibriti, olağanüstü kararlı eğitim süreçleri ve daha hızlı yakınsama sağlar.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: DFL'yi ortadan kaldırarak ve ağ mimarisini kolaylaştırarak, YOLO26 basit IoT sensörlerinden Raspberry Pi kartlarına kadar kaynak kısıtlı uç cihazlar için yoğun bir şekilde optimize edilmiştir.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, hava görüntülerini analiz etmek ve üretim otomasyonunda hassas kalite kontrolü yapmak için kritik öneme sahip olan küçük nesne tanımada önemli iyileştirmeler sağlar.

Uç Cihaz Odaklı Optimizasyon

Projeniz, özel GPU'ları olmayan gömülü sistemleri veya mobil uygulamaları hedefliyorsa, YOLO26'nın optimize edilmiş CPU performansı, önceki nesil modellere göre önemli ölçüde daha az hesaplama yükü gerektirerek büyük bir avantaj sağlar.

Performans ve Kıyaslamalar

Üretim ortamları için modelleri değerlendirirken, hassasiyet, hız ve hesaplama karmaşıklığı arasındaki dengeyi analiz etmek çok önemlidir. Aşağıda, 640 piksel (ve nano/tiny varyantları için 416) görüntü boyutunda değerlendirilen standart modellerin detaylı bir karşılaştırması yer almaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Tablonun gösterdiği gibi, YOLO26 serisi üstün bir performans dengesi sağlar. Örneğin, YOLO26x modelin neredeyse yarısı kadar parametre kullanırken etkileyici bir 57.5 mAP elde eder, YOLOXx bu da doğrudan daha hızlı GPU çıkarım sürelerine (11.8 ms'ye karşı 16.1 ms) ve çok daha üstün dağıtım esnekliğine dönüşür.

Eğitim ve Ekosistem Deneyimi

Bu mimariler arasındaki en derin farklılıklardan biri, kullanılabilirliği ve ekosistem desteğinde yatmaktadır.

YOLOX, gradyan akışı ve çapa içermeyen mekanikleri inceleyen araştırmacılar için temel bir depo olmaya devam etse de, kurulumu karmaşık olabilir ve genellikle bağımlılıkların ve operatörlerin manuel yapılandırmasını gerektirir. Aksine, Ultralytics ekosistemi kullanım kolaylığı için endüstri standardını belirler.

Geliştiriciler, birleşik Python API'sini kullanarak YOLO26 modellerini eşsiz bir basitlikle başlatabilir, eğitebilir ve dağıtabilir. Sistem, veri kümesi indirme, hiperparametre ayarlama ve ONNX, TensorRT ve OpenVINO gibi formatlara sorunsuz dışa aktarma işlemlerini doğal olarak yönetir.

from ultralytics import YOLO

# Initialize the cutting-edge, end-to-end YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model efficiently with built-in MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance on the validation set
metrics = model.val()

# Export the optimized model for edge deployment
model.export(format="onnx")

Ayrıca, Ultralytics YOLO modelleri, ağır transformatör tabanlı alternatiflere kıyasla eğitim sırasında önemli ölçüde daha düşük bellek gereksinimlerine sahiptir, bu da mühendislerin tüketici sınıfı donanımlarda bile daha büyük toplu iş boyutları eğitmesine olanak tanır.

Gerçek Dünya Uygulamaları

YOLOX ve YOLO26 arasında seçim yapmak nihayetinde dağıtım kısıtlamalarınıza ve çok görevli gereksinimlerinize bağlıdır.

YOLOX'un Üstün Olduğu Alanlar

YOLOX, belirli akademik kıyaslamalar ve MegEngine çerçevesiyle derinden entegre olmuş eski sistemler için uygun bir aday olmaya devam etmektedir. Tarihsel önemi, onu çapa içermeyen detect'örleri ve özel atama stratejilerini araştırmak için popüler bir temel haline getirir.

YOLO26'nın Üstün Olduğu Alanlar

YOLO26, temelde modern endüstriyel uygulamalar için tasarlanmıştır. Doğal olarak örnek segmentasyonunu, poz tahmini ve Yönlendirilmiş Sınırlayıcı Kutuları (OBB) desteklediği için standart detect motorlarından çok daha çok yönlüdür.

  • Akıllı Perakende ve Envanter: NMS-free tasarımın kullanılması, otomatik ödeme sistemlerinin video akışlarını ultra düşük gecikmeyle işlemesini ve ürünleri işlem sonrası döngülerin darboğazına takılmadan tanımasını garanti eder.
  • Drone ve Hava Analizleri: obb için özel açı kaybı ve ProgLoss + STAL entegrasyonu, YOLO26'yı geniş uydu görüntülerindeki dönen nesneleri ve küçük artefaktları detect etmede rakipsiz kılar.
  • Uç Güvenlik Sistemleri: %43 daha hızlı CPU çıkarımı ile YOLO26, şirketlerin sağlam güvenlik analizlerini pahalı bulut bilişim gerektirmeden doğrudan uygun maliyetli yerel donanıma dağıtmasına olanak tanır.

Kullanım Durumları ve Öneriler

YOLOX ve YOLO26 arasında seçim yapmak, projenizin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerinize bağlıdır.

Ne Zaman YOLOX Seçmeli

YOLOX, aşağıdakiler için güçlü bir seçenektir:

  • Anchor-Free Algılama Araştırması: YOLOX'un temiz, anchor-free mimarisini yeni algılama başlıkları veya kayıp fonksiyonları denemek için bir temel olarak kullanan akademik araştırmalar.
  • Ultra Hafif Kenar Cihazları: YOLOX-Nano varyantının son derece küçük ayak izinin (0.91M parametre) kritik olduğu mikrodenetleyicilerde veya eski mobil donanımlarda dağıtım.
  • SimOTA Etiket Atama Çalışmaları: Optimal taşıma tabanlı etiket atama stratejilerini ve bunların eğitim yakınsaması üzerindeki etkilerini araştıran projeler.

YOLO26 Ne Zaman Seçilmeli

YOLO26 şunlar için önerilir:

  • NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Diğer Ultralytics Modellerini Keşfetmek

Bilgisayar görüşünün evrimini araştırıyorsanız, Ultralytics ailesinde incelenmeye değer başka yüksek yetenekli modeller de bulunmaktadır:

  • YOLO11: YOLO26'nın hemen önceki sürümü olup, kararlı üretim ortamları için sağlam performans ve geniş topluluk desteği sunar.
  • YOLOv8: Binlerce gerçek dünya dağıtımında kullanım kolaylığı ve esneklik standardını belirleyen, yoğun bir şekilde test edilmiş bir mimari.

Sonuç olarak, YOLOX nesne detect etme alanına önemli kavramlar getirmiş olsa da, yeni YOLO26 hız, doğruluk ve dağıtım basitliğinde nesiller arası bir sıçrama sağlayarak ileri görüşlü geliştiriciler ve işletmeler için kesin bir tercih haline gelmektedir.


Yorumlar