İçeriğe geç

YOLOX vs YOLO11: Yüksek Performanslı Nesne Algılamaya Derinlemesine Bir Bakış

Bilgisayar görüşünün evrimi, yüksek doğruluğu çıkarım hızıyla dengeleyen gerçek zamanlı nesne algılama çerçevelerinin arayışıyla büyük ölçüde yönlendirilmiştir. Bu yolculuktaki en dikkat çekici kilometre taşları arasında YOLOX ve Ultralytics YOLO11 yer almaktadır. Her iki model de alana önemli katkılar sağlamış olsa da, temel mimarileri, tasarım felsefeleri ve geliştirici ekosistemleri önemli ölçüde farklılık göstermektedir.

Bu kapsamlı teknik karşılaştırma, bir sonraki yapay zeka projeniz için bilinçli bir karar vermenize yardımcı olmak amacıyla mimarilerini, performans metriklerini, eğitim metodolojilerini ve ideal dağıtım senaryolarını incelemektedir.

YOLOX'e Genel Bakış

18 Temmuz 2021'de Megvii'de araştırmacılar Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun tarafından tanıtılan YOLOX, YOLO serisinde önemli bir değişimi temsil etti. Anchor-free bir tasarım sunarak akademik araştırma ile endüstriyel uygulama arasındaki boşluğu başarıyla doldurdu.

Daha fazla teknik bilgi için, orijinal YOLOX Arxiv makalesini inceleyebilirsiniz.

Temel Mimari Özellikler

YOLOX, ayrık bir başlık ve anchor-free bir mekanizma benimseyerek geleneksel anchor tabanlı algılamadan ayrıldı. Bu tasarım, tasarım parametrelerinin sayısını azalttı ve modelin çeşitli kıyaslamalardaki performansını iyileştirdi. Ek olarak, eğitim sürecini hızlandırmak ve yakınsamayı iyileştirmek için SimOTA gibi gelişmiş etiket atama stratejileri sundu.

YOLOX kendi zamanı için mükemmel doğruluk sunsa da, öncelikli olarak sınırlayıcı kutu nesne algılamaya odaklanır ve kutudan çıktığı haliyle diğer karmaşık görme görevleri için yerel desteğe sahip değildir.

YOLOX hakkında daha fazla bilgi edinin

Anchorsız Tasarım

Önceden tanımlanmış anchor kutularını ortadan kaldırarak YOLOX, farklı veri kümeleri için gereken sezgisel ayarlamayı önemli ölçüde azalttı; bu da onu anchor-free metodolojileri araştırması için güçlü bir temel haline getirdi.

Ultralytics YOLO11'e Genel Bakış

27 Eylül 2024'te Glenn Jocher ve Jing Qiu tarafından Ultralytics'te piyasaya sürülen YOLO11, bilgisayar görüşünde çok yönlülüğü ve kullanım kolaylığını yeniden tanımlayan son teknoloji bir modeldir. Yıllarca süren temel araştırmalar üzerine inşa edilen bu model, çok sayıda görevde üstün performans gösteren, son derece gelişmiş, üretime hazır bir çözüm sunar.

Ultralytics'in Avantajı

YOLO11 sadece bir nesne dedektörü değil; örnek segmentasyonu, görüntü sınıflandırması, poz tahmini ve yönlendirilmiş sınırlayıcı kutu (obb) algılamayı destekleyen birleşik bir çerçevedir. Hız, parametre sayısı ve doğruluk arasında sorunsuz bir dengeyi ön planda tutan son derece verimli bir mimariye sahiptir.

Ayrıca, YOLO11, veri açıklama, model eğitimi ve dağıtımı için kolaylaştırılmış bir ekosistem sağlayan Ultralytics Platformu'na tamamen entegre edilmiştir.

YOLO11 hakkında daha fazla bilgi edinin

Performans ve Metrik Karşılaştırması

Bu modelleri karşılaştırdığımızda, performans dengesi netleşir. YOLO11, çoğu boyut kategorisinde YOLOX muadillerine kıyasla önemli ölçüde daha az parametre ve FLOP ile daha yüksek ortalama Hassasiyet (mAP) elde eder.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Gösterildiği gibi, YOLO11 modelleri daha az parametre ayak izini korurken doğrulukta YOLOX'u sürekli olarak geride bırakır. Örneğin, YOLO11m yalnızca 20.1M parametre ile 51.5 mAP elde ederken, YOLOXx benzer bir 51.1 mAP elde eder ancak devasa 99.1M parametre gerektirir. Eğitim ve çıkarım sırasındaki bu bellek verimliliği, YOLO11'i kenar AI cihazlarında dağıtım için son derece uygun hale getirir ve RT-DETR gibi eski veya dönüştürücü tabanlı modellerin tipik ağır CUDA bellek gereksinimlerinden kaçınır.

Verimli Eğitim

Ultralytics modelleri, YOLOX ve dönüştürücü tabanlı mimarilere kıyasla eğitim sırasında önemli ölçüde daha az GPU belleği gerektirir, bu da araştırmacıların standart tüketici donanımlarında güçlü modeller eğitmesine olanak tanır.

Ekosistem ve Kullanım Kolaylığı

İki çerçeve arasındaki en çarpıcı farklardan biri geliştirici deneyimidir.

YOLOX genellikle depoları klonlamayı, karmaşık ortamlar kurmayı ve modelleri ONNX veya TensorRT gibi formatlara eğitmek ve dışa aktarmak için ayrıntılı komut satırı argümanları çalıştırmayı gerektirir.

Buna karşılık, Ultralytics YOLO11 inanılmaz derecede basit bir python API ve CLI sunar. Ultralytics kütüphanesi veri artırma, hiperparametre ayarlama ve dışa aktarmayı otomatik olarak yönetir.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model effortlessly on custom data
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to TensorRT for optimized deployment
model.export(format="engine")

Bu iyi yönetilen ekosistem, kapsamlı dokümantasyon ve deney takibi için Weights & Biases gibi araçlarla sorunsuz entegrasyon ile desteklenmektedir.

İdeal Kullanım Senaryoları

Bu modeller arasında seçim yapmak genellikle dağıtım ortamının özelliklerine bağlıdır.

YOLOX Ne Zaman Kullanılır

  • Eski Sistemler: MegEngine çerçevesi veya 2021 başlarındaki nesne detect paradigmaları etrafında açıkça inşa edilmiş yerleşik bir hattınız varsa.
  • Akademik Temeller: 2021 döneminden temel çapa içermeyen mimarilere karşı doğrudan kıyaslama gerektiren araştırmalar yaparken.

YOLO11 Ne Zaman Kullanılmalı

  • Üretim Dağıtımları: Sağlam, bakımı yapılmış kod ve yüksek doğruluğun vazgeçilmez olduğu akıllı perakende veya güvenlik alarm sistemlerindeki ticari uygulamalar için.
  • Çok Görevli İş Akışları: Bir projenin tek, birleşik bir çerçeve kullanarak nesneleri track etmeyi, insan pozlarını tahmin etmeyi ve örnekleri segment etmeyi gerektirmesi durumunda.
  • Kaynak Kısıtlı Kenar Cihazları: Düşük parametre sayısı ve yüksek verimliliği nedeniyle YOLO11, Raspberry Pi veya mobil kenar düğümlerine CoreML ve NCNN aracılığıyla dağıtım için idealdir.

Geleceğe Bakış: YOLO26 Avantajı

YOLO11, YOLOX'a göre büyük bir sıçramayı temsil etse de, bilgisayar görüşü alanı hızla ilerlemektedir. Bugün yeni projelere başlayan geliştiriciler için Ultralytics YOLO26 kesin bir öneridir.

Ocak 2026'da piyasaya sürülen YOLO26, YOLO11'in mimari dehasını alarak birkaç çığır açan özellik sunar:

  • Uçtan Uca NMS-Free Tasarım: YOLO26, Non-Maximum Suppression (NMS) son işlemeyi ortadan kaldırarak, daha hızlı, daha basit dağıtım hatları için çıkarımı doğal olarak akışa alır (ilk olarak YOLOv10'da keşfedilen bir konsept).
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Distribution Focal Loss (DFL) kaldırılmasıyla YOLO26, CPU'larda ve düşük güçlü kenar cihazlarda çok daha verimlidir.
  • MuSGD Optimize Edici: Moonshot AI'dan LLM eğitim yeniliklerinden esinlenen MuSGD optimize edici, son derece kararlı eğitim çalışmalarını ve hızlı yakınsamayı garanti eder.
  • Gelişmiş Kayıp Fonksiyonları: ProgLoss + STAL kullanarak, YOLO26 küçük nesne tanımada önemli iyileştirmeler sağlar; bu da drone görüntüleri ve otonom robotik için kritik öneme sahiptir.

Modern bilgisayar görüşü görevlerinin büyük çoğunluğu için, hattınızı YOLO26'dan yararlanacak şekilde yükseltmek, hız, doğruluk ve dağıtım basitliğinin mutlak en iyi dengesini sağlayacaktır.


Yorumlar