İçeriğe geç

YOLOX vs. YOLO11: Nesne Algılama Evrimine Teknik Bir Derin Dalış

Doğruluk, gecikme süresi ve hesaplama verimliliği arasında denge kurmayı amaçlayan geliştiriciler için en uygun nesne algılama mimarisini seçmek çok önemlidir. Bu kapsamlı analiz, Megvii'nin öncü çapasız modeli YOLOX ile Ultralytics YOLO11Ultralytics'in en son teknoloji ürünü yinelemesi. YOLOX 2021'de önemli yenilikler getirirken, YOLO11 2024'te bilgisayarla görmenin en ileri noktasını temsil ediyor ve algılamadan örnek segmentasyonuna kadar çeşitli görevler için birleşik bir çerçeve sunuyor.

YOLOX: Araştırma ve Sanayi Arasında Köprü Kuruyor

2021 yılında piyasaya sürülen YOLOX, ankrajsız bir mekanizma benimseyerek ve tahmin başlığını ayırarak YOLO ailesinde önemli bir değişime işaret etti. Akademik araştırma ve endüstriyel uygulama arasındaki boşluğu doldurmak için tasarlanmıştır.

Mimari ve Yenilikler

YOLOX, aşağıdaki gibi önceki iterasyonlardan ayrılmıştır YOLOv5 Çapa kutularını kaldırarak tasarım karmaşıklığını ve sezgisel hiperparametrelerin sayısını azaltmıştır. Mimarisi, sınıflandırma ve regresyon görevlerini farklı dallara ayırarak yakınsama hızını ve doğruluğunu artıran ayrıştırılmış bir kafaya sahiptir. Ayrıca, pozitif örnekleri dinamik olarak atayan ve performansı daha da artıran gelişmiş bir etiket atama stratejisi olan SimOTA'yı tanıttı.

Güçlü ve Zayıf Yönler

Güçlü Yönler:

  • Çapasız Tasarım: Manuel çapa kutusu kümeleme ihtiyacını ortadan kaldırarak eğitim hattını basitleştirir.
  • Ayrılmış Kafa: Sınıflandırma ve regresyonu bağımsız olarak optimize ederek yerelleştirme doğruluğunu artırır.
  • Araştırma Temeli: Ankrajsız dedektörleri incelemek için güçlü bir referans noktası olarak hizmet eder.

Zayıflıklar:

  • Sınırlı Görev Desteği: Öncelikle nesne algılamaya odaklanmıştır; segmentasyon, poz tahmini veya yönlendirilmiş sınırlayıcı kutular (OBB) için yerel destekten yoksundur.
  • Parçalanmış Ekosistem: Modern çerçevelere kıyasla dağıtım, izleme ve MLOps için birleşik, aktif olarak sürdürülen bir araç setinden yoksundur.
  • Daha Düşük Verimlilik: YOLO11 gibi daha yeni modellerle karşılaştırılabilir doğruluk elde etmek için genellikle daha fazla parametre ve FLOP gerektirir.

YOLOX hakkında daha fazla bilgi edinin

Ultralytics YOLO11: Görsel Yapay Zeka için Yeni Standart

Ultralytics YOLO11 verimlilik, esneklik ve kullanım kolaylığına odaklanarak gerçek zamanlı nesne algılama mirasını geliştirir. Hem hızlı prototipleme hem de büyük ölçekli üretim dağıtımları için başvurulacak bir çözüm olarak tasarlanmıştır.

Mimari ve Ekosistem Avantajları

YOLO11 , hesaplama yükünü en aza indirirken özellik çıkarımını geliştiren son derece optimize edilmiş, çapasız bir mimari kullanır. YOLOX'un aksine, YOLO11 sadece bir model değil, kapsamlı bir ekosistemin parçasıdır. Sınıflandırma, segmentasyon, poz tahmini ve izleme dahil olmak üzere çok çeşitli bilgisayarla görme görevlerinitek ve kullanıcı dostu bir API ile destekler.

Entegre MLOps

YOLO11 Ultralytics HUB ve aşağıdaki gibi üçüncü taraf araçlarla sorunsuz bir şekilde entegre olur Weights & Biases ve Cometdeneyleri görselleştirmenize ve veri kümelerini zahmetsizce yönetmenize olanak tanır.

Neden YOLO11'i Seçmelisiniz?

  • Çok yönlülük: Nesne algılama, örnek segmentasyonu, poz tahmini ve görüntü sınıflandırması için tek bir çerçeve.
  • Kullanım Kolaylığı: Kolaylaştırılmış Python API ve CLI , geliştiricilerin modelleri yalnızca birkaç satır kodla eğitmesine ve dağıtmasına olanak tanır.
  • Performans Dengesi: Üstün başarı elde eder mAP Hem CPU'larda hem de GPU'larda öncekilere ve rakiplere kıyasla daha yüksek çıkarım hızları ile.
  • Bellek Verimliliği: Eğitim ve çıkarım sırasında daha düşük bellek gereksinimleri ile tasarlanmıştır, bu da onu aşağıdaki gibi dönüştürücü tabanlı modellerden daha erişilebilir kılar RT-DETR.
  • Dağıtıma Hazır: Gibi formatlara dışa aktarma için yerel destek ONNX, TensorRT, CoreML ve TFLite , NVIDIA Jetson 'dan mobil cihazlara kadar çeşitli donanımlarla uyumluluk sağlar.

YOLO11 hakkında daha fazla bilgi edinin

Performans Analizi

Aşağıdaki tablo YOLOX ve YOLO11 arasındaki performans farklarını vurgulamaktadır. YOLO11 , daha az parametre ve FLOP ile sürekli olarak daha yüksek doğrulukmAP) göstermekte ve bu da daha yüksek çıkarım hızlarına dönüşmektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Temel Çıkarımlar

  1. Verimlilik Üstünlüğü: YOLO11 modelleri, hız ve doğruluk arasında önemli ölçüde daha iyi bir denge sağlar. Örneğin, YOLO11m sadece 20,1 milyon parametre ile 51,5 mAP 'ye ulaşarak devasa YOLOX-x 'ten (51,1 mAP, 99,1 milyon parametre) yaklaşık 5 kat daha küçük olmasına rağmen daha iyi performans gösterir.
  2. Çıkarım Hızı: Bir T4 GPU üzerinde TensorRTYOLO11n 1,5 ms'de çalışarak gecikme süresinin kritik olduğu gerçek zamanlı çıkarım uygulamaları için olağanüstü bir seçimdir.
  3. CPU Performansı: Ultralytics , YOLO11'in özel hızlandırıcıları olmayan cihazlarda dağıtım için uygulanabilirliğini gösteren şeffaf CPU kıyaslamaları sağlar.
  4. Eğitim Verimliliği: YOLO11'in mimarisi, eğitim sırasında daha hızlı yakınsama sağlayarak değerli hesaplama zamanından ve kaynaklarından tasarruf sağlar.

Gerçek Dünya Uygulamaları

YOLO11 'in Üstün Olduğu Noktalar

  • Akıllı Şehirler: Yüksek hızı ve doğruluğu ile YOLO11 , trafik yönetim sistemleri ve yaya güvenliği izleme için idealdir.
  • Üretim: Segmentasyon ve OBB tespiti yapabilme özelliği, kalite kontrol ve montaj hatlarındaki yönlendirilmiş parçalardaki kusurları tespit etmek için mükemmeldir.
  • Sağlık hizmetleri: Verimli kaynak kullanımı ile yüksek doğruluk, klinik ortamlarda uç cihazlarda tıbbi görüntü analizi sağlar.

YOLOX'un Kullanıldığı Yerler

  • Eski Sistemler: 2021-2022 civarında kurulan ve henüz daha yeni mimarilere geçmemiş projeler.
  • Akademik Araştırma: Özellikle ayrılmış kafaların veya çapasız mekanizmaların etkilerini izole olarak araştıran çalışmalar.

Kullanıcı Deneyimi ve Kod Karşılaştırması

Ultralytics , kolaylaştırılmış bir kullanıcı deneyimine öncelik verir. YOLOX genellikle karmaşık yapılandırma dosyaları ve manuel kurulum gerektirirken, YOLO11 minimum kodla kullanılabilir.

Ultralytics YOLO11i Kullanma

Geliştiriciler birkaç satır Python ile önceden eğitilmiş bir modeli yükleyebilir, çıkarım yapabilir ve hatta özel veriler üzerinde eğitebilirler:

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

Eğitim Kolaylığı

Bir YOLO11 modelini özel bir veri kümesi üzerinde eğitmek de aynı derecede basittir. Kütüphane, veri artırma, hiperparametre ayarlama ve günlüğe kaydetme işlemlerini otomatik olarak gerçekleştirir.

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

Sonuç

YOLOX, çapasız nesne algılamanın popülerleşmesinde önemli bir rol oynamış olsa da Ultralytics YOLO11 , modern yapay zeka gelişimi için üstün bir seçimdir.

YOLO11 , sağlam ve bakımlı bir ekosistem sunarken doğruluk, hız ve verimlilik açısından YOLOX'tan daha iyi performans gösterir. Algılama, segmentasyon ve poz tahmini için farklı kütüphanelerle uğraşma ihtiyacını ortadan kaldıran çoklu görüş görevlerinde çok yönlülüğü, geliştirme karmaşıklığını önemli ölçüde azaltır. Aktif topluluk desteği ve kapsamlı belgelerle desteklenen geleceğe dönük, yüksek performanslı bir çözüm arayan geliştiriciler için YOLO11 önerilen YOLO11 .

Daha Fazla Model Keşfedin

Özel ihtiyaçlarınıza en uygun olanı bulmak için YOLO11 'in diğer önde gelen mimarilerle nasıl karşılaştırıldığını keşfedin:


Yorumlar