İçeriğe geç

YOLO11 ve YOLOX: Yüksek Performanslı Nesne Algılamanın Evrimi

Bilgisayar görüşü alanı, son birkaç yılda gerçek zamanlı nesne algılama modellerinin giderek daha karmaşık hale gelmesiyle hızlı ilerlemelere tanık olmuştur. Bir üretim ortamı veya akademik araştırma için mimari seçerken, geliştiriciler genellikle eski dönüm noktaları ile son teknoloji yenilikler arasındaki ödünleşimleri değerlendirirler. Bu kapsamlı karşılaştırma, Ultralytics YOLO11 ve Megvii'nin YOLOX'u arasındaki farklılıkları inceleyerek mimarileri, performans metrikleri ve ideal dağıtım senaryoları hakkında derinlemesine bilgiler sunmaktadır.

Mimari Genel Bakış

Her iki model de nesne algılamada önemli ilerlemeleri temsil etmektedir, ancak farklı tasarım felsefelerinden kaynaklanmakta ve farklı geliştirici deneyimlerini hedeflemektedir.

YOLO11: Çok Yönlü Çok Görevli Motor

Eylül 2024'te Glenn Jocher ve Jing Qiu tarafından Ultralytics'te piyasaya sürülen YOLO11, yüksek doğruluk ile aşırı verimliliği dengeleyen birleşik bir çerçeve olarak tasarlanmıştır.

YOLO11, standart sınırlayıcı kutuların ötesine geçerek örnek segmentasyon, görüntü sınıflandırma, poz tahmini ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) algılamayı doğal olarak desteklemektedir. Rafine mimarisi, karmaşık uzamsal hiyerarşilerde daha iyi özellik tutmayı sağlamak için özellik çıkarımını optimize eder.

YOLO11 hakkında daha fazla bilgi edinin

YOLOX: Bağlantısız Öncü

Megvii'deki araştırmacılar tarafından geliştirilen YOLOX, 2021'de tamamen çapa içermeyen bir yaklaşımla araştırma ve endüstriyel uygulamalar arasındaki boşluğu kapatarak önemli ilgi gördü.

YOLOX, ayrık bir kafa ve çapa içermeyen bir paradigma tanıttı; bu, tasarım parametrelerinin sayısını önemli ölçüde azalttı ve piyasaya sürüldüğü dönemde akademik kıyaslamalarda performansı artırdı.

YOLOX hakkında daha fazla bilgi edinin

Biliyor muydunuz?

YOLOX tarafından popülerleştirilen çapa içermeyen tasarım, birçok sonraki mimariye ilham verdi. Ultralytics, üstün doğruluk ve dağıtım esnekliği sağlamak için bu çapa içermeyen konseptleri YOLOv8 ve YOLO11 gibi sonraki yinelemelerde birleştirdi ve büyük ölçüde geliştirdi.

Performans ve Metrikler

Algılama modellerini değerlendirirken, parametrelerin, hesaplama maliyetinin (FLOPs) ve ortalama Hassasiyetin (mAP) dengesini incelemek, gerçek dünya model dağıtımı için çok önemlidir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Tabloda görüldüğü gibi, YOLO11x, mutlak doğrulukta (54.7 mAP'e karşı 51.1 mAP) YOLOXx'ten önemli ölçüde daha iyi performans gösterirken, yaklaşık olarak yarısı kadar parametre (56.9M'ye karşı 99.1M) gerektirir. Bu verimlilik, hem eğitim hem de çıkarım sırasında daha düşük bellek gereksinimlerine dönüşür ki bu, üretim ortamları için büyük bir avantajdır.

Ekosistem ve Geliştirici Deneyimi

Ultralytics'in Avantajı

YOLO11 ve YOLOX arasındaki en önemli farklılıklardan biri kullanılabilirlikte yatmaktadır. YOLOX, öncelikli olarak bir araştırma kod tabanı olarak işlev görür ve özel veri kümesi eğitimini başlatmak için karmaşık ortam yapılandırması, C++ operatörlerinin manuel derlenmesi ve ayrıntılı komut satırı argümanları gerektirir.

Buna karşılık, YOLO11, Ultralytics python paketine tamamen entegre edilmiş olup, kolaylaştırılmış, "sıfırdan kahramana" bir iş akışı sağlar. Ultralytics Platformu, veri etiketleme, deney takibi ve bulut tabanlı eğitim için kapsamlı araçlar sunarak, tekrar eden işleri soyutlar ve böylece mühendisler model performansına odaklanabilir.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model effortlessly using the Ultralytics API
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")

Ayrıca, bir Ultralytics modelini TensorRT, CoreML veya OpenVINO gibi formatlara aktarmak yalnızca tek bir komut gerektirirken, eski depolar genellikle karmaşık üçüncü taraf araçları veya manuel grafik müdahaleleri gerektirir.

Gerçek Dünya Kullanım Durumları

Ne Zaman YOLOX Düşünülmeli

YOLOX, geliştiricilerin zaten özel ayrık kafa tensor çıktıları etrafında yoğun bir şekilde özelleştirilmiş C++ çıkarım hatları oluşturduğu uzmanlaşmış, eski dağıtımlar için geçerli bir seçenek olmaya devam etmektedir. Ayrıca, 2021'in son teknoloji mimarilerine karşı karşılaştırmalı çalışmalar yürüten araştırmacılar, YOLOX'u bir kıyaslama veri kümesi taban çizgisi olarak kullanmaya devam edecektir.

YOLO11'in Üstün Olduğu Alanlar

Modern üretim senaryolarının neredeyse tamamı için YOLO11 çok daha üstün bir deneyim sunar:

  • Akıllı Şehirler ve Perakende: Olağanüstü hız-doğruluk oranı sayesinde YOLO11, kalabalık sahneleri zahmetsizce işler ve büyük GPU kümeleri gerektirmeden otomatik perakende analitiği ile trafik yönetim sistemlerine güç verir.
  • Uç Bilişim: Yüksek bellek verimliliği ve sağlam dışa aktarma seçenekleri, YOLO11'i Raspberry Pi veya NVIDIA Jetson platformları gibi cihazlardaki uç yapay zeka dağıtımları için mükemmel kılar.
  • Karmaşık İş Akışları: Bir proje, nesne algılamayı duruş anahtar noktaları (örn. spor analizi) veya hassas örnek segmentasyonu (örn. tıbbi görüntüleme) ile birleştirmeyi gerektiriyorsa, YOLO11 tüm görevleri tek bir birleşik API aracılığıyla doğal olarak yönetir.

Kullanım Durumları ve Öneriler

YOLO11 ve YOLOX arasında seçim yapmak, belirli proje gereksinimlerinize, dağıtım kısıtlamalarınıza ve ekosistem tercihlerinize bağlıdır.

Ne Zaman YOLO11 Seçmeli

YOLO11 için güçlü bir seçenektir:

  • Üretim Uç Cihaz Dağıtımı: Güvenilirliğin ve aktif bakımın çok önemli olduğu Raspberry Pi veya NVIDIA Jetson gibi cihazlardaki ticari uygulamalar.
  • Çok Görevli Görüntü İşleme Uygulamaları: Tek bir birleşik çerçeve içinde detect, segment, poz tahmini ve obb gerektiren projeler.
  • Hızlı Prototipleme ve Dağıtım: Basitleştirilmiş Ultralytics python API'sini kullanarak veri toplama aşamasından üretime hızla geçmesi gereken ekipler.

Ne Zaman YOLOX Seçmeli

YOLOX şunlar için önerilir:

  • Anchor-Free Algılama Araştırması: YOLOX'un temiz, anchor-free mimarisini yeni algılama başlıkları veya kayıp fonksiyonları denemek için bir temel olarak kullanan akademik araştırmalar.
  • Ultra Hafif Kenar Cihazları: YOLOX-Nano varyantının son derece küçük ayak izinin (0.91M parametre) kritik olduğu mikrodenetleyicilerde veya eski mobil donanımlarda dağıtım.
  • SimOTA Etiket Atama Çalışmaları: Optimal taşıma tabanlı etiket atama stratejilerini ve bunların eğitim yakınsaması üzerindeki etkilerini araştıran projeler.

Ultralytics (YOLO26) Ne Zaman Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

İleriye Bakış: YOLO26'nın Gücü

YOLO11 olağanüstü bir seçenek olsa da, yapay zeka alanı sürekli hızlanmaktadır. Verimlilik ve kararlılığın mutlak zirvesini arayan ekipler için, YOLO26 (Ocak 2026'da yayınlandı) yeni bilgisayar görüşü projeleri için nihai öneridir.

YOLO26, Uçtan Uca NMS-Free Tasarım uygulayarak büyük bir ilerlemeyi temsil eder. Non-Maximum Suppression (NMS) işlem sonrası aşamasını ortadan kaldırarak, gecikme değişkenliğini tamamen ortadan kaldırır ve dağıtım mantığını önemli ölçüde basitleştirir; bu, ilk olarak YOLOv10'da öncülük edilen bir konsepttir.

Ayrıca, YOLO26, DFL Kaldırma (Distribution Focal Loss) özelliğine sahiptir; mimarisi, %43'e kadar daha hızlı CPU çıkarımı elde etmek üzere optimize edilmiştir, bu da onu düşük güçlü ve uç cihazlar için tartışmasız şampiyon yapar. Eğitim kararlılığı da MuSGD Optimizer aracılığıyla süper şarj edilmiştir; bu, SGD ve Muon'un LLM'den ilham alan, yakınsamayı hızlandıran hibrit bir optimizatörüdür. ProgLoss + STAL gibi gelişmiş kayıp fonksiyonlarıyla birleştiğinde, YOLO26, drone görüntüleri ve IoT uç sensörleri gibi zorlu ortamlarda küçük nesneleri detect etmede üstündür.

Daha Fazla Keşif

Nesne algılama mimarileri hakkındaki bilginizi genişletmek mi istiyorsunuz? YOLO-World'ün açık kelime haznesi yeteneklerini keşfedin veya Ultralytics ekosisteminde belgelenen transformer tabanlı RT-DETR modeline dalın.

Sonuç olarak, YOLOX 2021'de önemli mimari konseptler sunmuş olsa da, YOLO11'in kapsamlı araç seti, bellek verimliliği ve son teknoloji performansı — ve özellikle YOLO26'nın devrim niteliğindeki mimarisi — Ultralytics ekosistemini günümüz araştırmacıları ve kurumsal geliştiriciler için açık ara tercih haline getirmektedir.


Yorumlar