YOLO11 ile YOLOX: Yüksek Performanslı Nesne Algılamanın Evrimi

Bilgisayarlı görü alanı son birkaç yılda hızlı ilerlemelere sahne oldu ve gerçek zamanlı nesne algılama modelleri giderek daha sofistike hale geldi. Üretim ortamı veya akademik araştırma için bir mimari seçerken, geliştiriciler genellikle eski mihenk taşları ile en son yenilikler arasındaki ödünleşimleri değerlendirirler. Bu kapsamlı karşılaştırma, Ultralytics YOLO11 ile Megvii'nin YOLOX'u arasındaki farkları inceleyerek mimarileri, performans metrikleri ve ideal dağıtım senaryoları hakkında derinlemesine bilgiler sunar.

Mimari Genel Bakış

Her iki model de nesne algılamada önemli sıçramaları temsil eder, ancak farklı tasarım felsefelerinden kaynaklanırlar ve farklı geliştirici deneyimlerini hedeflerler.

YOLO11: Çok Yönlü Çok Görevli Motor

Eylül 2024'te Glenn Jocher ve Jing Qiu tarafından Ultralytics bünyesinde piyasaya sürülen YOLO11, yüksek doğruluğu aşırı verimlilikle dengeleyen birleşik bir çerçeve olarak tasarlanmıştır.

YOLO11, standart sınırlayıcı kutuların ötesine geçerek örnek bölümleme, görüntü sınıflandırma, poz tahmini ve Yönelimli Sınırlayıcı Kutu (OBB) algılamasını yerel olarak destekler. Geliştirilmiş mimarisi, karmaşık mekansal hiyerarşilerde daha iyi özellik tutma sağlamak için özellik çıkarımını optimize eder.

YOLO11 hakkında daha fazla bilgi edin

YOLOX: Çapasız Öncü

Megvii araştırmacıları tarafından geliştirilen YOLOX, 2021 yılında tamamen çapasız bir yaklaşımla araştırma ve endüstriyel uygulamalar arasındaki boşluğu doldurarak büyük ilgi gördü.

YOLOX, ayrıştırılmış bir başlık ve çapasız bir paradigma sunarak, tasarım parametrelerinin sayısını önemli ölçüde azalttı ve piyasaya sürüldüğü dönemdeki akademik kıyaslamalarda performansı iyileştirdi.

YOLOX hakkında daha fazla bilgi edin

Biliyor muydun?

YOLOX tarafından popüler hale getirilen çapasız tasarım, sonraki birçok mimariye ilham verdi. Ultralytics, üstün doğruluk ve dağıtım esnekliği sağlamak için bu çapasız kavramları YOLOv8 ve YOLO11 gibi daha sonraki yinelemelere dahil etti ve büyük ölçüde geliştirdi.

Performans ve Metrikler

Algılama modellerini değerlendirirken, parametre dengesini, hesaplama maliyetini (FLOPs) ve ortalama Hassasiyeti (mAP) incelemek, gerçek dünya model dağıtımı için kritiktir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Tabloda görüldüğü gibi, YOLO11x, mutlak doğrulukta (54.7 mAP'ye karşı 51.1 mAP) YOLOXx'ten önemli ölçüde daha iyi performans gösterirken, yaklaşık olarak yarısı kadar parametre (56.9M'ye karşı 99.1M) gerektirir. Bu verimlilik, hem eğitim hem de çıkarım sırasında daha düşük bellek gereksinimlerine dönüşür ki bu da üretim ortamları için büyük bir avantajdır.

Ekosistem ve Geliştirici Deneyimi

Ultralytics Avantajı

YOLO11 ile YOLOX arasındaki en derin farklardan biri kullanabilirliktir. YOLOX, karmaşık ortam yapılandırması, C++ operatörlerinin manuel derlenmesi ve özel veri kümesi eğitimi başlatmak için ayrıntılı komut satırı bağımsız değişkenleri gerektiren bir araştırma kod tabanı olarak çalışır.

Buna karşılık, YOLO11, Ultralytics Python paketine tamamen entegredir ve akıcı, "sıfırdan uzmanlığa" bir iş akışı sağlar. Ultralytics Platformu, veri etiketleme, deney takibi ve bulut tabanlı eğitim için geniş kapsamlı araçlar sunar ve mühendislerin model performansına odaklanabilmesi için gereksiz kod yığınlarını ortadan kaldırır.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model effortlessly using the Ultralytics API
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")

Ayrıca, bir Ultralytics modelini TensorRT, CoreML veya OpenVINO gibi biçimlere aktarmak yalnızca tek bir komut gerektirirken, eski depolar genellikle karmaşık üçüncü taraf araçları veya manuel grafik düzenlemelerini zorunlu kılar.

Gerçek Dünya Kullanım Durumları

YOLOX ne zaman düşünülmeli?

YOLOX, geliştiricilerin belirli ayrıştırılmış başlık tensör çıktıları etrafında yoğun şekilde özelleştirilmiş C++ çıkarım boru hatları oluşturduğu özel, eski dağıtımlar için geçerli bir seçenek olmaya devam etmektedir. Ayrıca, 2021'in en gelişmiş mimarilerine karşı karşılaştırmalı çalışmalar yürüten araştırmacılar, YOLOX'u bir kıyaslama veri kümesi temeli olarak kullanmaya devam edeceklerdir.

YOLO11'in Öne Çıktığı Alanlar

Hemen hemen tüm modern üretim senaryoları için YOLO11 çok daha üstün bir deneyim sağlar:

  • Akıllı Şehirler ve Perakende: Olağanüstü hız/doğruluk oranı sayesinde YOLO11, kalabalık sahneleri zahmetsizce yönetir, devasa GPU kümelerine ihtiyaç duymadan otomatik perakende analitiğini ve trafik yönetim sistemlerini destekler.
  • Edge Computing: The high memory efficiency and robust export options make YOLO11 perfect for edge AI deployments on devices like Raspberry Pi or NVIDIA Jetson platforms.
  • Karmaşık Boru Hatları: Bir proje, nesne algılamayı poz anahtar noktaları (örneğin spor analitiği) veya hassas örnek bölümleme (örneğin tıbbi görüntüleme) ile birleştirmeyi gerektiriyorsa, YOLO11 tüm görevleri tek bir birleşik API aracılığıyla yerel olarak gerçekleştirir.

Kullanım Durumları ve Öneriler

YOLO11 ile YOLOX arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

Ne Zaman YOLO11 Seçilmeli

YOLO11 şunlar için güçlü bir tercihtir:

  • Üretim Uç Dağıtımı: Güvenilirlik ve aktif bakımın çok önemli olduğu Raspberry Pi veya NVIDIA Jetson gibi cihazlardaki ticari uygulamalar.
  • Çok Görevli Görü Uygulamaları: Tek bir birleşik çerçeve içinde algılama, segmentasyon, poz tahmini ve OBB gerektiren projeler.
  • Hızlı Prototipleme ve Dağıtım: Kolaylaştırılmış Ultralytics Python API kullanarak veri toplamadan üretime hızlı bir şekilde geçmesi gereken ekipler.

YOLOX ne zaman seçilmeli?

YOLOX şunlar için önerilir:

  • Çapasız Algılama Araştırması: Yeni algılama başlıkları veya kayıp işlevleri denemek için YOLOX'un temiz, çapasız mimarisini temel olarak kullanan akademik araştırma.
  • Ultra Hafif Uç Cihazlar: YOLOX-Nano varyantının son derece küçük ayak izinin (0.91M parametre) kritik olduğu mikrodenetleyicilerde veya eski mobil donanımlarda dağıtım yapılması.
  • SimOTA Etiket Atama Çalışmaları: Optimum taşıma tabanlı etiket atama stratejilerini ve bunların eğitim yakınsaması üzerindeki etkisini araştıran araştırma projeleri.

Ne Zaman Ultralytics (YOLO26) Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Geleceğe Bakış: YOLO26'nın Gücü

YOLO11 olağanüstü bir seçenek olsa da, yapay zeka dünyası sürekli hızlanmaktadır. Mutlak verimlilik ve istikrar zirvesini arayan ekipler için YOLO26 (Ocak 2026'da piyasaya sürüldü), yeni bilgisayarlı görü projeleri için nihai öneridir.

YOLO26, Uçtan Uca NMS'siz Tasarım uygulayarak büyük bir ileri sıçramayı temsil eder. Maksimum Olmayan Bastırma (NMS) işlem sonrası adımını ortadan kaldırarak, gecikme değişkenliğini tamamen kaldırır ve dağıtım mantığını önemli ölçüde basitleştirir; bu, ilk olarak YOLOv10'da öncülük edilen bir kavramdır.

Ayrıca YOLO26, mimariyi %43'e kadar daha hızlı CPU çıkarımı elde edecek şekilde optimize eden DFL Kaldırma (Dağılımsal Odak Kaybı) özelliğine sahiptir ve onu düşük güçlü ve uç cihazlar için tartışmasız şampiyon yapar. Eğitim istikrarı da, yakınsamayı hızlandıran SGD ve Muon'un LLM'den esinlenen bir melezi olan MuSGD Optimize Edici ile süper şarj edilmiştir. ProgLoss + STAL gibi gelişmiş kayıp işlevleriyle birleştiğinde, YOLO26 drone görüntüleri ve IoT uç sensörleri gibi zorlu ortamlardaki küçük nesneleri algılamada üstün performans gösterir.

Daha Fazla Keşif

Nesne algılama mimarileri hakkındaki bilgini genişletmek mi istiyorsun? YOLO-World'ün açık kelime dağarcığı özelliklerini keşfet veya Ultralytics ekosisteminde belgelenen transformer tabanlı RT-DETR modeline dal.

Sonuç olarak, YOLOX 2021'de önemli mimari kavramlar sunmuş olsa da, YOLO11'in kapsamlı araç seti, bellek verimliliği ve en son performansı—ve özellikle YOLO26'nın devrim niteliğindeki mimarisi—Ultralytics ekosistemini bugün araştırmacılar ve kurumsal geliştiriciler için açık ara en iyi seçenek haline getirmektedir.

Yorumlar