İçeriğe geç

YOLO11 YOLOX: Mimari Evrim ve Performans Analizi

Hızla gelişen bilgisayar görme alanında, doğru nesne algılama modelini seçmek projenin başarısı için çok önemlidir. Bu yolculuktaki iki önemli dönüm noktası şunlardır YOLO11 ve YOLOX'tur. YOLOX, 2021 yılında çığır açan ankarsız kavramları tanıtmışken, YOLO11 2024'ün sonlarında piyasaya sürüldü) bu fikirleri modern mimari iyileştirmeler, üstün verimlilik ve Ultralytics sağlam desteği ile daha da geliştirmiştir.

Bu kılavuz, geliştiricilerin, araştırmacıların ve mühendislerin gerçek zamanlı uç dağıtımdan yüksek hassasiyetli sunucu tarafı analizine kadar özel ihtiyaçlarına en uygun modeli seçmelerine yardımcı olmak için ayrıntılı bir teknik karşılaştırma sunar.

Yönetici Özeti

YOLO11Ultralytics tarafından yıllarca süren tekrarlı iyileştirme çalışmalarının sonucudur. Çok yönlülük açısından mükemmeldir ve algılama, segmentasyon, poz tahmini ve yönlendirilmiş sınırlayıcı kutular (OBB) için yerel destek sunar. Mimarisi modern donanımlar için optimize edilmiştir ve eski modellere kıyasla FLOP başına daha yüksek doğruluk sağlar.

Megvii tarafından 2021 yılında geliştirilen YOLOX, çapa içermeyen algılama paradigmasını popüler hale getiren önemli bir sürümdü. Çapa kutularını kaldırarak eğitim sürecini basitleştirdi ve MixUp Mosaic gibi gelişmiş artırma tekniklerini tanıttı. Hala yetenekli bir algılayıcı olsa da, yeni Ultralytics karakterize eden çoklu görev yeteneklerinden ve sorunsuz dağıtım boru hattından yoksundur.

Bugün yeni projeler başlatan geliştiriciler için, YOLO11 veya son teknoloji ürünü YOLO26, üstün performans-verimlilik oranı ve kullanım kolaylığı nedeniyle genellikle tavsiye edilmektedir.

Teknik Karşılaştırma Ölçütleri

Aşağıdaki tablo, çeşitli model boyutlarında iki mimari arasındaki performans farklarını göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Performans Analizi

YOLO11m, en büyük YOLOXx'ten (51,1%) daha yüksek bir mAP 51,5%) elde ederken, yaklaşık 5 kat daha az parametre (20,1 milyon karşı 99,1 milyon) kullanır ve T4 GPU'larda neredeyse 3 kat daha hızlı çalışır. Bu çarpıcı verimlilik artışı, YOLO11 büyük ölçekte dağıtımını YOLO11 daha ucuz hale getirir.

Mimari Derinlemesine İnceleme

YOLO11: Gelişmiş Verimlilik ve Çok Yönlülük

Yazarlar: Glenn Jocher, Jing Qiu (Ultralytics)
Tarih: Eylül 2024

YOLO11 , önceki sürümlerde tanıtılan C2f (2 konvolüsyonlu CSP Bottleneck) modüllerini YOLO11 , ancak daha iyi gradyan akışı ve özellik çıkarma için bunları geliştirir.

  • Backbone: Derinlik ve genişliği backbone hesaplama yükünü en aza indirirken alıcı alanları en üst düzeye çıkaran backbone optimize edilmiş CSP tabanlı backbone .
  • Başlık: Önemli mimari değişiklikler gerektirmeden nesne algılama, örnek segmentasyonu ve poz tahminigibi birden fazla görevi destekleyen birleşik bir algılama başlığı.
  • Çapa içermez: YOLOX gibi, YOLO11 çapa içermeyen bir yaklaşım YOLO11 , bu da tasarım parametrelerinin sayısını (çapa boyutları ve oranları gibi) azaltır ve modelin karmaşıklığını basitleştirir.
  • Eğitim Dinamikleri: Ultralytics sürecine gelişmiş veri artırma stratejileri dahil ederek, çeşitli ışıklandırma ve örtülme durumlarına karşı sağlamlık sağlar.

YOLO11 hakkında daha fazla bilgi edinin

YOLOX: Bağlantısız Öncü

Yazarlar: Zheng Ge, et al. (Megvii)
Tarih: Temmuz 2021

YOLOX, araştırma topluluğu ile endüstriyel uygulamalar arasındaki boşluğu doldurmak için tasarlanmıştır.

  • Ayrıştırılmış Başlık: YOLOX, sınıflandırma ve regresyon görevlerinin ayrı dallar tarafından gerçekleştirildiği ayrıştırılmış bir başlık yapısı tanıttı. Bunun yakınsama hızını ve doğruluğunu artırdığı görüldü.
  • SimOTA: Etiket ataması için "Basitleştirilmiş Optimal Taşıma Ataması" (SimOTA) önemli bir yenilikti. Bu dinamik strateji, sabit IoU daha etkili bir şekilde tahminlere gerçek nesneleri atar.
  • Çapa Yok Mekanizması: Çapa kutularını kaldırarak, YOLOX önceki YOLO (v2-v5) sıkça karşılaşılan bir sorun olan manuel çapa ayarlaması ihtiyacını ortadan kaldırdı.
  • Güçlü Artırma: Mosaic ve MixUp yoğun kullanımı, YOLOX'un sıfırdan etkili bir şekilde eğitilmesini sağladı.

YOLOX hakkında daha fazla bilgi edinin

Ekosistem ve Kullanım Kolaylığı

Geliştiriciler için en önemli faktörlerden biri, modeli çevreleyen yazılım ekosistemidir. Bu, modelin ne kadar kolay eğitilebileceğini, doğrulanabileceğini ve uygulanabileceğini belirler.

Ultralytics'in Avantajı

YOLO11 , olgun ve aktif olarak sürdürülen Ultralytics YOLO11 . Bu entegrasyon, birkaç belirgin avantaj sunar:

  1. Birleştirilmiş API: Görevler arasında geçiş yapmak çok kolaydır. Python veya CLI tek bir parametreyi değiştirerek, araç algılamadan tümör segmentasyonuna geçebilirsiniz.
  2. Dağıtım Esnekliği: Çerçeve, aşağıdaki formatlara yerleşik dışa aktarma işlevselliği içerir ONNX, TensorRT, CoreML ve OpenVINO gibi formatlara. Bu, geliştiricilerin tek bir kod satırı ile modelleri üretim ortamlarına dağıtmasına olanak tanır.
  3. Platform Desteği: Ultralytics , veri kümesi açıklamalarından bulut eğitimi ve model yönetimine kadar tüm yaşam döngüsünü basitleştirir.
from ultralytics import YOLO

# Load a model (YOLO11n)
model = YOLO("yolo11n.pt")

# Train on a custom dataset
# The system automatically handles data downloading and preparation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export for deployment
path = model.export(format="onnx")

YOLOX Ekosistemi

YOLOX, öncelikle bir araştırma deposu olarak barındırılmaktadır. Kod açık kaynaklı ve yüksek kaliteli olmakla birlikte, genellikle daha fazla manuel yapılandırma gerektirir. Kullanıcılar genellikle kendi veri yükleyicilerini yönetmek, belirli donanımlar için özel dışa aktarma komut dosyaları yazmak ve Ultralytics kıyasla daha az sıklıkla güncellenen bir kod tabanında gezinmek zorundadır.

Gerçek Dünya Uygulamaları

Bu modeller arasında seçim yapmak, genellikle uygulama ortamının belirli kısıtlamalarına bağlıdır.

YOLO11 İçin İdeal Kullanım Durumları

  • Gerçek Zamanlı Video Analizi: 1,5 ms'ye kadar düşük T4 çıkarım hızları ile YOLO11n, trafik yönetimi veya spor analizi için yüksek FPS video akışlarını işlemek için mükemmeldir.
  • Çoklu Görev Sistemleri: Bir uygulama eşzamanlı nesne izleme ve poz tahmini gerektiriyorsa (örneğin, spor salonu egzersiz analizi), YOLO11 çok yönlü baş mimarisi, birden fazla ağır modele olan ihtiyacı azaltır.
  • Ticari Kenar Dağıtımı: NVIDIA veya Raspberry Pi'ye sorunsuz dışa aktarım, YOLO11 ticari IoT ürünleri için YOLO11 getirir.

YOLOX için İdeal Kullanım Örnekleri

  • Akademik Karşılaştırma: YOLOX, 2021-2022 dönemindeki çapa içermeyen algılama yöntemlerini karşılaştıran araştırmacılar için sağlam bir temel olmaya devam ediyor.
  • Eski Sistemler: YOLOX kod tabanına ve özel entegrasyon boru hatlarına zaten büyük yatırım yapmış olan projeler, geçiş yapmak yerine mevcut sistemi korumayı daha uygun maliyetli bulabilirler.
  • Özel Mobil Kısıtlamalar: YOLOX-Nano modeli son derece hafiftir (0,91M parametre), bu da onu çok kısıtlı mobil donanımlar için kullanışlı hale getirir, ancak YOLO26n gibi daha yeni modeller artık çok daha üstün doğrulukla rekabetçi boyutlar sunmaktadır.

Gelecek: YOLO26'ya girin

En son teknolojiyi arayan geliştiriciler için Ultralytics YOLO26'yı (Ocak 2026) piyasaya sürdü. Bu model, çoğu kullanım durumunda YOLO11 YOLOX'u etkili bir şekilde geride bırakarak önemli bir ilerlemeyi temsil ediyor.

YOLO26, birkaç önemli yenilik sunuyor:

  • Yerel olarak uçtan uca: Çıkarım hızını genellikle yavaşlatan bir son işlem adımı olan Maksimum Baskılama (NMS) uygulamasını ortadan kaldırır. Bu sayede daha hızlı ve belirleyici çıktılar elde edilir.
  • MuSGD Optimizer: LLM eğitim tekniklerinden esinlenerek geliştirilen bu optimizer, istikrarlı bir yakınsama sağlar ve eğitim süresini kısaltır.
  • Verimlilik: YOLO26, önceki nesillere kıyasla %43'e kadar daha hızlı CPU sahip olup,GPU için güçlü bir çözüm sunar.

Yeni bir projeye başlıyorsanız, YOLO11 ile birlikte YOLO26'yı da değerlendirmenizi şiddetle tavsiye ederiz.

YOLO26 hakkında daha fazla bilgi edinin

Sonuç

Hem YOLO11 YOLOX, bilgisayar görme tarihinde yerlerini almıştır. YOLOX, çapa içermeyen algılamanın uygulanabilirliğini kanıtlayan bir öncüydü. Ancak, YOLO11 günümüzün geliştiricileri için daha cazip bir paket sunmaktadır: daha hızlı, daha doğru, daha geniş bir görev yelpazesini desteklemekte ve geliştirme süresini önemli ölçüde azaltan bir ekosistem tarafından desteklenmektedir.

Keşfedilecek Diğer Modeller

  • YOLO26: Ultralytics en son teknoloji ürünü modeli, uçtan uca NMS algılama özelliğine sahiptir.
  • RT-DETR: Yüksek doğruluk sunan, GPU bol olduğu senaryolar için ideal olan transformatör tabanlı bir dedektör.
  • YOLOv9: Programlanabilir Gradyan Bilgisi (PGI) ve GELAN mimarisi ile tanınır.
  • YOLOv8: YOLO ailesinde güvenilir, yaygın olarak benimsenmiş bir klasik.

Yorumlar