YOLOX ve YOLO11: Yüksek Performanslı Nesne Algılamaya Derinlemesine Bir Bakış

Bilgisayarlı görüdeki gelişim, yüksek doğruluk ile çıkarım hızını dengeleyen gerçek zamanlı nesne algılama çerçeveleri arayışıyla büyük ölçüde hız kazandı. Bu yolculuktaki en önemli kilometre taşları arasında YOLOX ve Ultralytics YOLO11 yer alır. Her iki model de alana önemli katkılarda bulunmuş olsa da, temel mimarileri, tasarım felsefeleri ve geliştirici ekosistemleri önemli ölçüde farklılık gösterir.

Bu kapsamlı teknik karşılaştırma, bir sonraki yapay zeka projen için bilinçli bir karar vermene yardımcı olmak amacıyla mimarilerini, performans metriklerini, eğitim metodolojilerini ve ideal dağıtım senaryolarını inceliyor.

YOLOX'a Genel Bakış

18 Temmuz 2021'de Megvii bünyesindeki araştırmacılar Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun tarafından tanıtılan YOLOX, YOLO serisinde önemli bir değişimi temsil ediyordu. Çapa içermeyen (anchor-free) bir tasarım sunarak akademik araştırma ile endüstriyel uygulama arasındaki boşluğu başarıyla kapattı.

Daha fazla teknik altyapı için orijinal YOLOX Arxiv makalesini inceleyebilirsin.

Temel Mimari Özellikler

YOLOX, ayrıştırılmış bir başlık (decoupled head) ve çapa içermeyen bir mekanizma benimseyerek geleneksel çapa tabanlı (anchor-based) algılamadan ayrıldı. Bu tasarım, tasarım parametrelerinin sayısını azalttı ve modelin çeşitli kıyaslamalardaki performansını iyileştirdi. Ayrıca, eğitim sürecini hızlandırmak ve yakınsamayı geliştirmek için SimOTA gibi gelişmiş etiket atama stratejileri getirdi.

YOLOX zamanına göre mükemmel bir doğruluk sunsa da, birincil olarak sınırlayıcı kutu (bounding box) nesne algılamaya odaklanır ve diğer karmaşık görü görevleri için kutudan çıktığı gibi yerel bir destek sunmaz.

YOLOX hakkında daha fazla bilgi edin

Çapa İçermeyen Tasarım

Önceden tanımlanmış çapa kutularını ortadan kaldırarak YOLOX, farklı veri kümeleri için gereken sezgisel ayarlamaları önemli ölçüde azalttı ve çapa içermeyen metodolojiler üzerine araştırmalar için güçlü bir temel oluşturdu.

Ultralytics YOLO11'e Genel Bakış

27 Eylül 2024'te Ultralytics bünyesinde Glenn Jocher ve Jing Qiu tarafından yayınlanan YOLO11, bilgisayarlı görüde çok yönlülüğü ve kullanım kolaylığını yeniden tanımlayan en gelişmiş (state-of-the-art) modeldir. Yıllara dayanan temel araştırmalar üzerine inşa edilmiştir ve çok sayıda görevde üstünlük sağlayan, üretime hazır, yüksek düzeyde rafine edilmiş bir çözüm sunar.

Ultralytics Avantajı

YOLO11 sadece bir nesne dedektörü değil; örnek bölümleme, görüntü sınıflandırma, poz tahmini ve yönlendirilmiş sınırlayıcı kutu (OBB) algılamayı destekleyen birleşik bir çerçevedir. Hız, parametre sayısı ve doğruluk arasında sorunsuz bir dengeye öncelik veren yüksek verimli bir mimariye sahiptir.

Dahası YOLO11, veri etiketleme, model eğitimi ve dağıtım için modern bir ekosistem sağlayan Ultralytics Platform ile tam entegredir.

YOLO11 hakkında daha fazla bilgi edin

Performans ve Metrik Karşılaştırması

Bu modelleri karşılaştırdığında, performans dengesi netleşir. YOLO11, çoğu boyut kategorisinde YOLOX muadillerine kıyasla önemli ölçüde daha az parametre ve FLOP ile daha yüksek ortalama Hassasiyet (mAP) elde eder.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Gösterildiği gibi, YOLO11 modelleri daha yalın bir parametre ayak izini korurken doğruluk konusunda sürekli olarak YOLOX'u geride bırakır. Örneğin, YOLO11m sadece 20.1M parametre ile 51.5 mAP elde ederken, YOLOXx benzer bir 51.1 mAP değerine ulaşır ancak devasa bir 99.1M parametre gerektirir. Eğitim ve çıkarım sırasındaki bu bellek verimliliği, YOLO11'i RT-DETR gibi eski veya Transformer tabanlı modeller için tipik olan ağır CUDA bellek gereksinimlerinden kaçınarak uç yapay zeka (edge AI) cihazlarında dağıtım için oldukça uygun hale getirir.

Verimli Eğitim

Ultralytics modelleri, eğitim sırasında YOLOX ve Transformer tabanlı mimarilere kıyasla önemli ölçüde daha az GPU belleği gerektirir, bu da araştırmacıların standart tüketici donanımlarında güçlü modeller eğitmelerine olanak tanır.

Ekosistem ve Kullanım Kolaylığı

İki çerçeve arasındaki en çarpıcı farklardan biri geliştirici deneyimidir.

YOLOX genellikle depoları klonlamayı, karmaşık ortamlar kurmayı ve modelleri ONNX veya TensorRT gibi biçimlere eğitip dışa aktarmak için uzun komut satırı argümanları çalıştırmayı gerektirir.

Buna karşılık, Ultralytics YOLO11 inanılmaz derecede basit bir Python API ve CLI sunar. Ultralytics kütüphanesi veri artırma, hiperparametre ayarlama ve dışa aktarma işlemlerini otomatik olarak yönetir.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model effortlessly on custom data
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to TensorRT for optimized deployment
model.export(format="engine")

This well-maintained ecosystem is backed by extensive documentation and seamless integration with tools like Weights & Biases for experiment tracking.

İdeal Kullanım Durumları

Bu modeller arasında seçim yapmak genellikle dağıtım ortamının özelliklerine bağlıdır.

YOLOX ne zaman kullanılır

  • Eski Sistemler: MegEngine çerçevesi veya 2021 başı nesne algılama paradigmaları üzerine açıkça kurulmuş yerleşik bir hattın varsa.
  • Akademik Temeller: 2021 döneminden kalma çapa içermeyen temel mimarilere karşı doğrudan kıyaslama gerektiren araştırmalar yürütürken.

YOLO11 ne zaman kullanılır

  • Üretim Dağıtımları: Sağlam, bakımlı kodun ve yüksek doğruluğun vazgeçilmez olduğu akıllı perakende veya güvenlik alarm sistemleri gibi ticari uygulamalar için.
  • Çok Görevli Hatlar: Bir projenin nesneleri takip etmeyi, insan pozlarını tahmin etmeyi ve örnekleri bölümlere ayırmayı tek bir birleşik çerçeve kullanarak gerçekleştirmesi gerektiğinde.
  • Resource-Constrained Edge Devices: Because of its low parameter count and high throughput, YOLO11 is ideal for deployment on Raspberry Pi or mobile edge nodes via CoreML and NCNN.

Geleceğe Bakış: YOLO26 Avantajı

YOLO11, YOLOX'a göre devasa bir sıçramayı temsil etse de bilgisayarlı görü alanı hızla ilerliyor. Bugün yeni projelere başlayan geliştiriciler için kesin öneri Ultralytics YOLO26'dır.

Ocak 2026'da piyasaya sürülen YOLO26, YOLO11'in mimari dehasını alır ve birkaç çığır açan özellik sunar:

  • Uçtan Uca NMS-Free Tasarım: YOLO26, Non-Maximum Suppression (NMS) işlem sonrası adımlarını ortadan kaldırır ve daha hızlı, daha basit dağıtım hatları için çıkarımı yerel olarak yayınlar (ilk olarak YOLOv10 içinde keşfedilen bir konsept).
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Distribution Focal Loss (DFL) kaldırılması sayesinde YOLO26, CPU'larda ve düşük güçlü uç cihazlarda çok daha verimlidir.
  • MuSGD Optimize Edici: Moonshot AI'ın LLM eğitim yeniliklerinden esinlenen MuSGD optimize edici, oldukça kararlı eğitim çalışmaları ve hızlı yakınsama sağlar.
  • Gelişmiş Kayıp Fonksiyonları: ProgLoss + STAL kullanan YOLO26, drone görüntüleri ve otonom robotik için kritik olan küçük nesne tanımada önemli iyileştirmeler elde eder.

Günümüzdeki modern bilgisayarlı görü görevlerinin büyük çoğunluğu için hattını YOLO26 kullanacak şekilde yükseltmek, sana mutlak en iyi hız, doğruluk ve dağıtım basitliği dengesini sağlayacaktır.

Yorumlar