YOLOX - YOLO11 Karşılaştırması: Teknik Bir İnceleme
Doğru nesne algılama modelini seçmek, doğruluk, hız ve hesaplama kaynaklarının taleplerini dengeleyen kritik bir karardır. Bu sayfa, Megvii'den yüksek performanslı, ankrajsız bir model olan YOLOX ile Ultralytics'in en son teknoloji ürünü modeli olan Ultralytics YOLO11 arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Bilgisayarla görü projeniz için en iyi modeli seçmenize yardımcı olmak için mimari farklılıklarını, performans metriklerini ve ideal kullanım durumlarını inceleyeceğiz.
YOLOX: Ankrajsız Yüksek Performanslı Bir Dedektör
YOLOX, güçlü performans elde ederken algılama hattını basitleştirmek için tasarlanmış, YOLO'nun anchor-free (bağlantısız) bir sürümü olarak Megvii tarafından tanıtıldı. Önceden tanımlanmış bağlantı kutularının karmaşıklığını ortadan kaldırarak akademik araştırma ve endüstriyel uygulamalar arasındaki boşluğu doldurmayı amaçladı.
Teknik Detaylar:
- Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
- Kuruluş: Megvii
- Tarih: 2021-07-18
- Arxiv: https://arxiv.org/abs/2107.08430
- GitHub: https://github.com/Megvii-BaseDetection/YOLOX
- Belgeler: https://yolox.readthedocs.io/en/latest/
Mimari ve Temel Özellikler
YOLOX, YOLO ailesine çeşitli önemli yenilikler getirmiştir:
- Anchor'sız Tasarım: YOLOX, anchor kutularını ortadan kaldırarak tasarım parametrelerinin sayısını azaltır ve daha iyi genellemeye yol açabilecek eğitim sürecini basitleştirir.
- Ayrıştırılmış Kafa: Sınıflandırma ve regresyon görevleri için ayrı tahmin kafaları kullanır. Bu ayrım, yakınsama hızını artırabilir ve önceki YOLO sürümlerinde kullanılan birleşik kafalara kıyasla model doğruluğunu artırabilir.
- Gelişmiş Eğitim Stratejileri: YOLOX, eğitim sırasında dinamik etiket ataması için SimOTA (basitleştirilmiş bir Optimal Taşıma Atama stratejisi) gibi gelişmiş tekniklerin yanı sıra güçlü veri artırma yöntemlerini de içerir.
Güçlü ve Zayıf Yönler
Güçlü Yönler:
- Yüksek Doğruluk: YOLOX modelleri, özellikle daha büyük varyantlar, COCO veri kümesi gibi standart kıyaslama testlerinde rekabetçi mAP skorları elde eder.
- Anchor-Free Basitlik: Tasarım, diğer dedektörlerde yaygın bir sorun olan anchor kutularını yapılandırma ihtiyacını ortadan kaldırarak algılama hattını basitleştirir.
- Yerleşik Model: 2021'de piyasaya sürülen bir model olarak, çeşitli dağıtım örneklerinin bulunduğu bir topluluk takipçisine sahiptir.
Zayıflıklar:
- Güncel Olmayan Performans: Zamanı için güçlü olsa da, hem hız hem de doğruluk açısından performansı YOLO11 gibi daha yeni modeller tarafından aşılmıştır.
- Sınırlı Çok Yönlülük: YOLOX öncelikle nesne tespiti'ne odaklanmıştır. Ultralytics gibi modern çerçevelerde standart olan örnek segmentasyonu, poz tahmini veya sınıflandırma gibi diğer görme görevleri için yerleşik desteği yoktur.
- Harici Ekosistem: Entegre Ultralytics ekosisteminin bir parçası değildir, yani kullanıcılar eğitim, doğrulama ve dağıtım için kolaylaştırılmış araçları, sürekli güncellemeleri ve kapsamlı desteği kaçırır.
İdeal Kullanım Senaryoları
YOLOX, şunlar için uygun bir seçenektir:
- Araştırma Temelleri: Ankraj içermeyen tespit yöntemlerini araştıran araştırmacılar için mükemmel bir temel oluşturur.
- Endüstriyel Uygulamalar: Sağlam, iyi anlaşılmış bir dedektörün yeterli olduğu üretimde kalite kontrolü gibi görevler için uygundur.
YOLOX hakkında daha fazla bilgi edinin
Ultralytics YOLO11: Son Teknoloji Çok Yönlülük ve Performans
Ultralytics YOLO11, Ultralytics'in en son amiral gemisi modelidir ve YOLO serisinin zirvesini temsil eder. YOLOv8 gibi önceki modellerin başarıları üzerine inşa edilmiştir ve son teknoloji performans, benzersiz çok yönlülük ve olağanüstü bir kullanıcı deneyimi sunar.
Teknik Detaylar:
- Yazarlar: Glenn Jocher, Jing Qiu
- Kuruluş: Ultralytics
- Tarih: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Belgeler: https://docs.ultralytics.com/models/yolo11/
Mimari ve Temel Özellikler
YOLO11, maksimum verimlilik ve doğruluk için tasarlanmış, yüksek düzeyde optimize edilmiş, tek aşamalı, bağlantısız (anchor-free) bir mimariye sahiptir.
- Performans Dengesi: YOLO11, hız ve doğruluk arasında olağanüstü bir denge sağlar ve bu da onu uç cihazlarda gerçek zamanlı işlemeden bulut sunucularında yüksek verimli analize kadar çok çeşitli uygulamalar için uygun hale getirir.
- Çok Yönlülük: YOLO11'in temel avantajlarından biri, çoklu görev yeteneğidir. Tek ve birleşik bir çerçeve içinde nesne algılama, örnek segmentasyonu, görüntü sınıflandırması, poz tahmini ve yönlendirilmiş sınırlayıcı kutu (OBB) algılamayı destekler.
- Kullanım Kolaylığı: YOLO11, basit bir Python API, güçlü bir CLI ve kapsamlı belgeler içeren, iyi yönetilen bir ekosisteme entegre edilmiştir. Bu, hem yeni başlayanlar hem de uzmanlar için inanılmaz derecede erişilebilir olmasını sağlar.
- Eğitim Verimliliği: Model, verimli eğitim süreçlerinden, kolayca erişilebilen önceden eğitilmiş ağırlıklardan ve daha düşük bellek gereksinimlerinden yararlanarak daha hızlı geliştirme döngülerine olanak tanır.
- İyi Yönetilen Ekosistem: Ultralytics, aktif geliştirme, güçlü topluluk desteği ve veri kümesi yönetiminden üretim dağıtımına kadar uçtan uca MLOps için Ultralytics HUB gibi araçlarla sorunsuz entegrasyon sağlar.
Güçlü ve Zayıf Yönler
Güçlü Yönler:
- Son Teknoloji Performans: Yüksek çıkarım hızlarını korurken en üst düzey mAP skorları sunar.
- Üstün Verimlilik: Optimize edilmiş mimari, YOLOX'a kıyasla belirli bir doğruluk düzeyi için daha az parametre ve FLOP ile sonuçlanır.
- Çoklu Görev Desteği: Tek bir YOLO11 modeli, çeşitli görüntü işleme görevleri için eğitilebilir ve benzersiz bir esneklik sunar.
- Kullanıcı Dostu Çerçeve: Ultralytics ekosistemi, tüm geliştirme yaşam döngüsünü basitleştirir.
- Aktif Geliştirme ve Destek: Ultralytics'ten sürekli güncellemeler, geniş bir topluluk ve profesyonel destekten yararlanır.
Zayıflıklar:
- Tek aşamalı bir tespit aracı olarak, yoğun sahnelerde aşırı küçük veya yoğun şekilde örtüşen nesneleri tespit etmede zorluklarla karşılaşabilir; bu, bu model sınıfı için yaygın bir sınırlamadır.
- YOLO11x gibi en büyük modeller, maksimum doğruluğu elde etmek için önemli miktarda hesaplama kaynağı gerektirir, ancak performans seviyeleri için oldukça verimli kalırlar.
İdeal Kullanım Senaryoları
YOLO11, çok çeşitli modern uygulamalar için ideal seçimdir:
- Otonom Sistemler: Gerçek zamanlı algılama ile robotik ve kendi kendine giden arabalara güç verme.
- Akıllı Güvenlik: Gelişmiş gözetim sistemleri ve hırsızlık önleme olanağı sağlar.
- Endüstriyel Otomasyon: Kalite kontrolünü otomatikleştirmek ve geri dönüşüm verimliliğini artırmak.
- Perakende Analitiği: Envanter yönetimini optimize etme ve müşteri davranışını analiz etme.
YOLO11 hakkında daha fazla bilgi edinin
Performans Karşılaştırması: YOLOX - YOLO11
COCO veri kümesindeki performansı karşılaştırırken, YOLO11'deki gelişmeler belirginleşir.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLOX-Nano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOX-Tiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOX-s | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOX-m | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOX-l | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOX-x | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLO11, genel olarak üstün performans sergiler. Örneğin, YOLO11s, YOLOX-m'den (46.9) daha yüksek bir mAP'ye (47.0) daha az parametre ve önemli ölçüde daha az FLOP ile ulaşır. Daha da etkileyici bir şekilde, YOLO11m, en büyük YOLOX-x modelini doğrulukta (51.5 mAP'ye karşı 51.1 mAP) aşarken çok daha verimlidir (20.1M parametreye karşı 99.1M).
Hız açısından, YOLO11 modelleri özellikle TensorRT optimizasyonu ile GPU'da son derece hızlıdır. YOLO11n, yalnızca 1,5 ms'lik bir çıkarım süresiyle hafif modeller için yeni bir standart belirler. Ayrıca, Ultralytics, YOLOX kıyaslamalarının eksik olduğu birçok gerçek dünya dağıtımı için kritik bir faktör olan net CPU performans kıyaslamaları sağlar.
Sonuç: Hangi Modeli Seçmelisiniz?
YOLOX, anchor-free nesne tespit araçlarının geliştirilmesine önemli bir katkı sağlarken, Ultralytics YOLO11 neredeyse tüm modern kullanım durumları için açık ara kazanan modeldir. Üstün bir doğruluk, hız ve hesaplama verimliliği kombinasyonu sunar.
YOLO11'in avantajları, ham metriklerin çok ötesine uzanır. Kapsamlı Ultralytics ekosistemine entegrasyonu, üretkenliğe önemli bir destek sağlar. Çoklu görev çok yönlülüğü, kullanım kolaylığı, aktif bakımı ve kapsamlı desteği ile YOLO11, geliştiricilerin ve araştırmacıların gelişmiş bilgisayar görüşü çözümlerini daha hızlı ve daha etkili bir şekilde oluşturmasını ve dağıtmasını sağlar. Son teknoloji performans ve sorunsuz bir geliştirme deneyimi gerektiren herhangi bir yeni proje için YOLO11 önerilen seçimdir.
Diğer Model Karşılaştırmaları
YOLOX ve YOLO11'in diğer önde gelen modellerle nasıl karşılaştırıldığını merak ediyorsanız, bu diğer karşılaştırma sayfalarına göz atın:
- YOLOv10 - YOLOX Karşılaştırması
- YOLOv8 - YOLOX karşılaştırması
- RT-DETR - YOLOX Karşılaştırması
- YOLO11 - YOLOv10 Karşılaştırması
- YOLO11 - YOLOv8 karşılaştırması
- YOLO11 - EfficientDet Karşılaştırması
- YOLO11 - RT-DETR Karşılaştırması