İçeriğe geç

YOLO11 vs YOLOX: Kapsamlı Bir Teknik Karşılaştırma

Optimum nesne algılama modelini seçmek, geliştiriciler ve araştırmacılar için doğruluk, çıkarım hızı ve dağıtım kolaylığı arasında denge kurmayı amaçlayan çok önemli bir karardır. Bu teknik analiz, aşağıdakiler arasında derinlemesine bir karşılaştırma sağlar Ultralytics YOLO11ve Megvii'den öncü bir çapasız dedektör olan YOLOX. YOLOX 2021'de önemli yenilikler getirirken, YOLO11 gelişmiş çok yönlülük, üstün performans ölçütleri ve birleşik bir geliştirme ekosistemi sunarak yeni nesil bilgisayarla görmeyi temsil ediyor.

Ultralytics YOLO11: Görsel Yapay Zeka Alanında Yeni Standart

YOLO11 , Ultralytics tarafından gerçek zamanlı bilgisayarla görmede nelerin mümkün olduğunu yeniden tanımlamak için piyasaya sürülen ünlü YOLO serisinin en yeni amiral gemisi modelidir. Seleflerinin mirası üzerine inşa edilen YOLO11 , özellik çıkarma yeteneklerini ve işleme verimliliğini önemli ölçüde artıran mimari iyileştirmeler sunar.

Mimari ve Temel Yetenekler

YOLO11 , hesaplama maliyeti ile tespit doğruluğu arasındaki dengeyi optimize eden son teknoloji ürünü, çapasız bir mimari kullanır. Yalnızca sınırlayıcı kutu regresyonuna dayanan geleneksel modellerin aksine, YOLO11 çok görevli bir çerçevedir. Nesne algılama, örnek segmentasyonu, poz tahmini, görüntü sınıflandırma ve yönlendirilmiş sınırlayıcı kutu (OBB) algılama dahil olmak üzere çok çeşitli görme görevlerini yerel olarak destekler.

Tüm Görevler için Birleştirilmiş API

YOLO11 , desteklenen tüm görevler için tek bir Python arayüzü kullanarak geliştirme iş akışını basitleştirir. Algılamadan segmentasyona geçmek, farklı bir model ağırlık dosyası yüklemek kadar basittir (örn, yolo11n-seg.pt).

Temel Avantajlar

  • Son Teknoloji Performans: YOLO11 daha yüksek başarı elde etti mAPCOCO kıyaslama ölçütünde önceki yinelemelere ve rakiplere kıyasla daha az parametre kullanarak daha yüksek puanlar elde etmiştir.
  • Geniş Çok Yönlülük: Segmentasyon, sınıflandırma ve poz tahminini aynı kod tabanında gerçekleştirme yeteneği, birden fazla çerçeve öğrenme ihtiyacını ortadan kaldırır.
  • Dağıtım Esnekliği: Model, aşağıdaki gibi formatlara sorunsuz bir şekilde aktarılır ONNX, TensorRT, CoreML ve TFLite ile uç cihazlardan bulut GPU'larına kadar çeşitli donanımlarla uyumluluk sağlar.
  • Kullanıcı Merkezli Tasarım: Kullanım kolaylığına odaklanan geliştiriciler, modelleri minimum kodla eğitebilir, doğrulayabilir ve dağıtabilir.

YOLO11 hakkında daha fazla bilgi edinin

YOLOX: Çapasız Öncü

2021 yılında Megvii tarafından piyasaya sürülen YOLOX, nesne algılama alanında dönüştürücü bir giriş oldu. O dönemde yaygın olan çapa tabanlı yaklaşımlardan (YOLOv4 ve YOLOv5 gibi) çapasız bir mekanizma ve ayrık bir kafa yapısı benimseyerek ayrıldı.

Mimari Öne Çıkanlar

YOLOX, sınıflandırma ve regresyon görevlerini farklı dallara ayırarak ayrıştırılmış bir kafa ile kendini ayırır. Bu tasarım, SimOTA etiket atama stratejisiyle birleştiğinde, bağlantı kutusu hiperparametrelerini manuel olarak ayarlama karmaşıklığı olmadan güçlü performans elde etmesini sağlamıştır.

Güçlü Yönler ve Sınırlamalar

  • Çapasız Tasarım: YOLOX, çapaları kaldırarak eğitim hattını basitleştirdi ve farklı nesne şekilleri arasında genelleştirmeyi geliştirdi.
  • Sağlam Temel: Çapasız tespit yöntemlerine yönelik araştırmalar için değerli bir referans noktası olmaya devam etmektedir.
  • Sınırlı Kapsam: YOLO11'in aksine, YOLOX öncelikle bir nesne algılayıcıdır ve segmentasyon veya poz tahmini gibi karmaşık aşağı akış görevleri için yerel destekten yoksundur.
  • Ekosistem Parçalanması: Açık kaynaklı olmasına rağmen, Ultralytics ekosisteminde bulunan birleşik, aktif olarak sürdürülen araçlardan yoksundur ve genellikle entegrasyon ve dağıtım için daha fazla manuel çaba gerektirir.

YOLOX hakkında daha fazla bilgi edinin

Performans Analizi

Aşağıdaki tabloda COCO veri setindeki temel performans ölçümlerinin doğrudan bir karşılaştırması sunulmaktadır. YOLO11 , karşılaştırılabilir veya azaltılmış hesaplama gereksinimleri ile önemli ölçüde daha yüksek doğrulukmAP) sağlayarak verimlilikte açık bir avantaj göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Metrik Dağılım

  1. Doğruluk (mAP): YOLO11 , tüm model ölçeklerinde YOLOX'tan daha iyi performans göstermektedir. Örneğin, YOLO11s, YOLOX-m'nin neredeyse 3 kat daha fazla FLOP'a sahip daha büyük bir model sınıfı olmasına rağmen YOLOX-m'yi (46,9 mAP) geçerek 47,0 mAP 'ye ulaşır.
  2. Çıkarım Hızı: YOLO11 modern donanım hızlandırması için optimize edilmiştir. Bir T4 GPU üzerinde TensorRTYOLO11n, 1,5 ms gibi etkileyici bir hızda çalışarak yüksek hızlı gerçek zamanlı çıkarımlar için idealdir.
  3. Verimlilik: YOLO11m sadece 20,1 milyon parametre ile 51,5 mAP gibi yüksek bir doğruluğa ulaşmaktadır. Buna karşılık, en büyük YOLOX-x modeli daha düşük bir 51.1 mAP'ye ulaşmak için 99.1M parametre gerektirir ve bu da YOLO11 'in parametre verimliliğindeki mimari üstünlüğünü vurgular.

Teknik Derin Dalış

Eğitim Metodolojisi ve Ekosistem

En önemli farklardan biri eğitim ve geliştirme deneyiminde yatmaktadır. Ultralytics , makine öğrenimi yaşam döngüsünün her aşamasını basitleştiren kapsamlı bir ekosistem sunarak kolaylaştırılmış bir kullanıcı deneyimine öncelik verir.

  • Kullanım Kolaylığı: YOLO11 birkaç satır kod ile eğitilebilir ultralytics Python paketi veya sağlam komut satırı arayüzüCLI). Bu erişilebilirlik, genellikle depoların klonlanmasını ve karmaşık yapılandırma kurulumlarını gerektiren YOLOX'un aksine durmaktadır.
  • Eğitim Verimliliği: Ultralytics , transfer öğrenimini hızlandıran yüksek kaliteli, önceden eğitilmiş ağırlıklar sağlar. Eğitim hattı, otomatik parti boyutu ayarı ve kutudan çıkar çıkmaz çoklu GPU dağıtılmış eğitim gibi özellikleri destekleyerek son derece optimize edilmiştir.
  • Bellek Kullanımı: YOLO11 modelleri hem eğitim hem de çıkarım sırasında bellek açısından verimli olacak şekilde tasarlanmıştır. Bu, eski mimarilere ve ağır transformatör tabanlı modellere göre çok önemli bir avantajdır ve YOLO11 'in CUDA belleğinin sınırlı olduğu tüketici sınıfı donanımlarda ve uç cihazlarda çalışmasına olanak tanır.
from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

Çok Yönlülük ve Gerçek Dünya Uygulamaları

YOLOX özel bir nesne dedektörü iken, YOLO11 kapsamlı bir görüş platformu olarak hizmet vermektedir.

  • Çok Modlu Yetenekler: Geliştiriciler görevleri birleştirerek karmaşık sorunların üstesinden gelebilir. Örneğin, bir robotik uygulaması bir nesneyi bulmak için nesne algılamayı ve kavrama için yönünü belirlemek için poz tahminini kullanabilir - hepsi tek bir YOLO11 çerçevesi içinde.
  • İyi Korunan Ekosistem: Ultralytics modelleri aktif bir topluluktan ve sık güncellemelerden yararlanır. Ultralytics HUB gibi özellikler, veri yönetimini, model eğitimini ve dağıtımını kolaylaştırarak, parçalanmış açık kaynaklı projelerin karşılayamayacağı bir destek düzeyi sağlar.

İdeal Kullanım Senaryoları

Ultralytics YOLO11 Ne Zaman Seçilir

YOLO11 , performans dengesi ve ekosistem desteği nedeniyle ticari ve araştırma uygulamalarının büyük çoğunluğu için önerilen seçimdir.

  • Gerçek Zamanlı Edge AI: Düşük gecikme süresi ve yüksek verimliliği, NVIDIA Jetson, Raspberry Pi veya cep telefonları gibi cihazlarda dağıtım için mükemmeldir.
  • Karmaşık Görme Sistemleri: Algılamanın yanı sıra segmentasyon, izleme veya poz tahmini gerektiren projeler birleşik çerçeveden faydalanacaktır.
  • Kurumsal Çözümler: Güvenilirlik, kapsamlı dokümantasyon ve aktif bakım, üretim sınıfı yazılım için istikrarlı bir temel sağlar.

YOLOX Ne Zaman Düşünülmeli

YOLOX belirli niş senaryolarda geçerliliğini korumaktadır:

  • Akademik Araştırma: Çapasız dedektörlerde ayrılmış kafaların spesifik etkilerini inceleyen araştırmacılar YOLOX'u temel karşılaştırma olarak kullanabilir.
  • Eski Sistemler: Belirli YOLOX kod tabanı ile yoğun bir şekilde entegre edilmiş mevcut boru hatları (örneğin, MegEngine uygulamaları), yeniden düzenleme maliyetlerinden kaçınmak için bunu kullanmaya devam edebilir.

Sonuç

YOLOX, çapasız nesne algılamanın yaygınlaşmasında önemli bir rol oynamış olsa da Ultralytics YOLO11 , modern bilgisayarla görme gelişimi için üstün bir seçimdir.

YOLO11 , her kritik ölçütte YOLOX'u geride bırakıyor: daha doğru, önemli ölçüde daha hızlı ve çok daha parametre verimli. Ultralytics ekosistemi, ham performansın ötesinde, geliştiricileri benzersiz kullanım kolaylığı, sağlam dokümantasyon ve çok yönlü çoklu görev yetenekleri ile güçlendirir. İster hızlı prototip oluşturma ister büyük ölçekli endüstriyel dağıtım için olsun, YOLO11 en yeni yapay zeka çözümlerini oluşturmak için gerekli araçları ve performansı sağlar.

Diğer Model Karşılaştırmaları

YOLO11 'in alandaki diğer önde gelen modellerle karşılaştırmasını keşfedin:


Yorumlar