YOLO11 ve YOLOX: Teknik Bir Karşılaştırma
Doğru nesne algılama modelini seçmek, doğruluk, hız ve uygulama kolaylığını dengeleyen kritik bir karardır. Bu sayfa, Ultralytics'in en son teknoloji ürünü modeli olan Ultralytics YOLO11 ile Megvii'den önemli bir ankrajsız model olan YOLOX arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Her iki model de gerçek zamanlı nesne algılama alanını geliştirmiş olsa da, YOLO11 sağlam ve aktif olarak sürdürülen bir ekosistem tarafından desteklenen daha kapsamlı, çok yönlü ve kullanıcı dostu bir çözüm sunmaktadır.
Ultralytics YOLO11: Son Teknoloji Performans ve Çok Yönlülük
Ultralytics YOLO11, Ultralytics'in en yeni amiral gemisi modelidir ve çok çeşitli bilgisayar görüşü görevlerinde benzersiz performans ve esneklik sunmak üzere tasarlanmıştır. Glenn Jocher ve Jing Qiu tarafından yazılan bu model, YOLOv8 gibi önceki modellerin başarılı temeli üzerine inşa edilmiştir ve üstün doğruluk ve verimlilik için önemli mimari iyileştirmeler sunar.
- Yazarlar: Glenn Jocher, Jing Qiu
- Kuruluş: Ultralytics
- Tarih: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Belgeler: https://docs.ultralytics.com/models/yolo11/
Mimari ve Temel Özellikler
YOLO11, özellik çıkarmayı geliştiren ve algılama sürecini kolaylaştıran, yüksek düzeyde optimize edilmiş, bağlantısız (anchor-free) bir mimariye sahiptir. Bu tasarım, diğer modellere kıyasla genellikle daha az parametre ve daha düşük hesaplama maliyetiyle daha yüksek mAP puanları elde ederek hız ve doğruluk arasında daha iyi bir dengeye yol açar.
YOLO11'in temel avantajlarından biri çok yönlülüğüdür. Sadece bir nesne tespit aracı değil, aynı zamanda örnek segmentasyonu, görüntü sınıflandırması, poz tahmini ve yönlendirilmiş sınırlayıcı kutu (OBB) tespiti dahil olmak üzere kutudan çıkar çıkmaz birden fazla görevi destekleyen kapsamlı bir yapay görme yapay zeka çerçevesidir.
Güçlü Yönler
- Üstün Performans: Benzer model boyutlarında birçok rakibinden daha iyi performans göstererek, en son teknoloji ürünü doğruluk ve hıza ulaşır.
- Kullanım Kolaylığı: Basit bir Python API'si ve CLI, kapsamlı dokümantasyon ve hem yeni başlayanlar hem de uzmanlar için erişilebilir kılan çok sayıda eğitim ile birlikte gelir.
- İyi Yönetilen Ekosistem: Sürekli geliştirme, GitHub ve Discord'da güçlü bir topluluk ve sık güncellemelerden yararlanır. Ultralytics HUB gibi araçlarla entegrasyon, sorunsuz bir MLOps deneyimi sağlar.
- Eğitim Verimliliği: Hızlı yakınsama sağlayan, kolayca erişilebilen önceden eğitilmiş ağırlıklar ile verimli eğitim süreçleri sunar. Ayrıca, transformatörler gibi daha karmaşık mimarilere kıyasla eğitim ve çıkarım sırasında daha düşük bellek gereksinimlerine sahiptir.
- Çoklu Görev Çok Yönlülüğü: Tek bir çerçeve, çok çeşitli görüntü işleme görevleri için kullanılabilir, bu da geliştirme karmaşıklığını ve süresini azaltır.
- Dağıtım Esnekliği: Uç cihazlardan bulut sunucularına kadar çeşitli donanımlar için optimize edilmiştir ve ONNX ve TensorRT gibi çok sayıda dışa aktarma formatını destekler.
Zayıflıklar
- En son model olarak, YOLO11x gibi daha büyük varyantlar, gerçek zamanlı performans için güçlü donanım gerektiren, işlem açısından yoğun olabilir.
- Ekosistem sağlam olmasına rağmen, bazı niş üçüncü taraf araç entegrasyonları daha eski, daha yerleşik modeller için daha olgun olabilir.
İdeal Kullanım Senaryoları
YOLO11'in yüksek doğruluk, hız ve çok yönlülük kombinasyonu, onu geniş bir uygulama yelpazesi için ideal bir seçim haline getirir:
- Endüstriyel Otomasyon: Üretim hatlarında kalite kontrolü ve kusur tespiti için.
- Akıllı Şehirler: Trafik yönetim sistemlerini ve kamu güvenliği gözetimini güçlendirme.
- Sağlık Hizmetleri: Tümör tespiti gibi tıbbi görüntü analizine yardımcı olma.
- Perakende: Envanter yönetimini ve müşteri analizini geliştirmek.
YOLO11 hakkında daha fazla bilgi edinin
YOLOX: Ankrajsız Bir Yaklaşım
Megvii tarafından geliştirilen YOLOX, algılama hattını basitleştirmek ve önceki sürümlerine göre performansı artırmak için anchor-free (bağlantısız) bir tasarım sunan YOLO ailesine önemli bir katkı olmuştur.
- Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
- Kuruluş: Megvii
- Tarih: 2021-07-18
- Arxiv: https://arxiv.org/abs/2107.08430
- GitHub: https://github.com/Megvii-BaseDetection/YOLOX
- Belgeler: https://yolox.readthedocs.io/en/latest/
Mimari ve Temel Özellikler
YOLOX'un temel yenilikleri arasında anchor-free (bağlantısız) dedektörü, sınıflandırma ve regresyon için ayrıştırılmış bir başlık ve SimOTA adı verilen gelişmiş bir etiket atama stratejisi yer almaktadır. Bu değişiklikler, daha akıcı ve etkili bir nesne dedektörü oluşturmayı amaçlamıştır.
Güçlü Yönler
- Yüksek Doğruluk: YOLOX, özellikle daha büyük model varyantlarıyla rekabetçi mAP skorları sunar.
- Anchor-Free (Çapa Kutusu Olmayan) Basitlik: Önceden tanımlanmış çapa kutularını ortadan kaldırarak, ayarlanması gereken hiperparametrelerin sayısını azaltır, bu da genellemeyi iyileştirebilir.
- Yerleşik Model: 2021'de piyasaya sürüldüğü için bir topluluğa sahiptir ve çeşitli projelerde uyarlanmıştır.
Zayıflıklar
- Sınırlı Çok Yönlülük: YOLOX öncelikle nesne tespiti için tasarlanmıştır. YOLO11'de standart olan segmentasyon, poz tahmini ve OBB gibi diğer görevler için yerleşik desteği yoktur.
- Parçalı Ekosistem: Açık kaynaklı olmasına rağmen, Ultralytics'in sağladığı birleşik ve iyi yönetilen ekosisteme sahip değildir. Kullanıcıların MLOps araçlarıyla entegre etmek ve dağıtım için daha fazla çaba göstermesi gerekebilir.
- Performans Açıkları: Performans tablosunda gösterildiği gibi, YOLOX modelleri YOLO11 muadillerinden daha yavaş ve daha az doğru olabilir. Örneğin, YOLOX-l, önemli ölçüde daha fazla parametreye ve FLOP'a sahipken mAP'de YOLO11l'den daha düşük performans gösterir.
- CPU Performansı: CPU çıkarımı için kıyaslamalar kolayca bulunamaz, bu da YOLO11'in net metrikler sağladığı CPU ile sınırlı senaryolardaki performansını değerlendirmeyi zorlaştırır.
İdeal Kullanım Senaryoları
YOLOX, özellikle şunları gerektiren projeler için sağlam bir seçimdir:
- Yüksek Performanslı Nesne Algılama: Temel amacın salt nesne algılama doğruluğu olduğu senaryolarda.
- Araştırma Temeli: Ankrajsız algılama yöntemleri üzerine yapılan araştırmalar için temel bir model olarak.
- Endüstriyel Uygulamalar: Özel bir nesne dedektörünün yeterli olduğu kalite kontrolü gibi görevler için.
YOLOX hakkında daha fazla bilgi edinin
Performans Analizi: YOLO11 - YOLOX Karşılaştırması
Performans karşılaştırması, Ultralytics YOLO11 tarafından kaydedilen gelişmeleri açıkça göstermektedir. YOLO11, tüm model boyutlarında sürekli olarak daha iyi bir doğruluk ve verimlilik dengesi sunmaktadır.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
- Doğruluk: YOLO11 modelleri, YOLOX muadillerine göre sürekli olarak daha yüksek mAP skorları elde eder. Örneğin, YOLO11m, daha az parametreyle YOLOXm'nin 46.9 mAP'sini önemli ölçüde geride bırakarak 51.5 mAP'ye ulaşır.
- Verimlilik: YOLO11 üstün verimlilik gösterir. YOLO11l, yalnızca 25,3M parametre ile 53,4 mAP elde ederken, YOLOXl daha düşük olan 49,7 mAP'ye ulaşmak için 54,2M parametre gerektirir.
- Hız: YOLO11, hem CPU hem de GPU çıkarımı için optimize edilmiştir. En küçük modeli olan YOLO11n, bir T4 GPU'da etkileyici bir 1,5 ms gecikme süresine sahiptir ve bu da onu gerçek zamanlı uygulamalar için ideal kılar. YOLOX'un bildirilen hızları, karşılaştırılabilir modeller için daha yavaştır.
Sonuç ve Öneri
YOLOX, anchor-free nesne algılamada önemli bir gelişme olmasına rağmen, Ultralytics YOLO11, performans, çok yönlülük ve kullanılabilirlik açısından en iyi kombinasyonu arayan geliştiriciler ve araştırmacılar için açık ara kazanan modeldir.
YOLO11, doğruluk ve verimlilik gibi temel metriklerde YOLOX'u aşmakla kalmaz, aynı zamanda çok daha kapsamlı ve destekleyici bir ekosistem sunar. Tek, kullanımı kolay bir çerçeve içinde birden fazla görüntü işleme görevini işleme yeteneği, onu modern yapay zeka çözümleri oluşturmak için daha pratik ve güçlü bir seçim haline getirir. Hızlı prototiplemeden üretim ölçekli dağıtıma kadar herhangi bir yeni proje için Ultralytics YOLO11 önerilen modeldir.
Diğer Model Karşılaştırmaları
YOLO11 ve YOLOX'un diğer modellere karşı nasıl bir performans sergilediğini merak ediyorsanız, bu karşılaştırma sayfalarına göz atın:
- YOLO11 - YOLOv10 Karşılaştırması
- YOLO11 - YOLOv9 karşılaştırması
- YOLO11 - YOLOv8 karşılaştırması
- YOLOv8 - YOLOX karşılaştırması
- YOLOv5 - YOLOX Karşılaştırması
- RT-DETR - YOLOX Karşılaştırması
- YOLO11 - EfficientDet Karşılaştırması