YOLOv6.0 vs YOLOX: Endüstriyel Hız ve Çapasız Hassasiyet Üzerine Derin Bir Dalış
En uygun nesne algılama mimarisinin seçilmesi, bilgisayarla görme sistemlerinin verimliliğini ve kapasitesini etkileyen kritik bir karardır. Bu teknik karşılaştırma, gerçek zamanlı algılama ortamını şekillendiren iki etkili model olan YOLOv6.0 ve YOLOX'u incelemektedir. Mimari yeniliklerini, performans ölçütlerini ve çeşitli dağıtım senaryoları için uygunluklarını analiz ediyoruz.
YOLOv6.0: Endüstriyel Verimlilik için Tasarlandı
Yazarlar Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Organizasyon: Meituan
Tarih: 2023-01-13
Arxiv: YOLOv6 v3.0: Tam Ölçekli Bir Yeniden Yükleme
GitHub: YOLOv6
Dokümanlar: Ultralytics YOLOv6 Dokümantasyonu
Meituan'daki Vision AI Departmanı tarafından geliştirilen YOLOv6.0, donanım kaynaklarının genellikle kısıtlı olduğu, ancak gerçek zamanlı hızın tartışılmaz olduğu endüstriyel uygulamalar için özel olarak tasarlanmıştır. Standart GPU donanımında nesne algılama işlem hatlarının verimini en üst düzeye çıkarmaya odaklanır.
Mimari ve Temel Özellikler
YOLOv6.0, çıkarım maliyetini artırmadan doğruluğu artırmak için bir dizi "ücretsiz torba" sunar.
- Yeniden Parametrelendirilebilir Backbone: Eğitim sırasında karmaşık, çok dallı bir yapıya izin veren (zengin özellikleri yakalayan) ve çıkarım sırasında basit, hızlı tek yollu bir yapıya dönüşen bir EfficientRep backbone kullanır.
- Çapa Destekli Eğitim (AAT): Model, çıkarım sırasında çapasız bir dedektör olarak çalışırken, yakınsamayı stabilize etmek ve performansı artırmak için eğitim sırasında çapa tabanlı yardımcı dallar kullanır.
- Kendi Kendine Damıtma: Öğrenci modelinin kendi öğretmen modeli tahminlerinden öğrendiği ve dış bağımlılıklar olmadan doğruluğunu geliştirdiği bir bilgi damıtma tekniği.
Güçlü ve Zayıf Yönler
YOLOv6.0'ın birincil gücü gecikme optimizasyonunda yatmaktadır. ile optimize edildiğinde NVIDIA GPU'larda olağanüstü çıkarım hızlarına ulaşır. TensorRTBu da onu yüksek verimli fabrika otomasyonu ve akıllı şehir gözetimi için güçlü bir aday haline getirmektedir. Ayrıca, niceleme farkındalı eğitim (QAT) desteği, daha az hassasiyet gereksinimi olan uç cihazlara dağıtım yapılmasına yardımcı olur.
Bununla birlikte, model biraz uzmanlaşmıştır. Daha geniş çerçevelerde bulunan yerel çoklu görev çok yönlülüğünden yoksundur ve neredeyse yalnızca algılamaya odaklanır. Ek olarak, ekosistemi sağlam olsa da Ultralytics modellerini çevreleyen topluluktan daha küçüktür, bu da niş veri kümeleri için üçüncü taraf eğitimlerinin ve önceden eğitilmiş ağırlıkların kullanılabilirliğini potansiyel olarak sınırlandırır.
YOLOv6 hakkında daha fazla bilgi edinin
YOLOX: Basitlik ve Çapasız Yenilik
Yazarlar Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
Organizasyon: Megvii
Tarih: 2021-07-18
Arxiv: YOLO : 2021'de YOLO Serisinin Aşılması
GitHub: Megvii-BaseDetection/YOLOX
Dokümanlar: YOLOX Dokümantasyonu
YOLOX, çapasız dedektörleri ana akım YOLO soyuna dahil ederek bir paradigma değişimini temsil etti. Önceden tanımlanmış bağlantı kutularına olan ihtiyacı ortadan kaldırarak tasarım sürecini basitleştirdi ve çeşitli nesne şekilleri arasında genellemeyi geliştirdi.
Mimari ve Temel Özellikler
YOLOX, temiz bir mimariyi korurken performansı artırmak için çeşitli gelişmiş teknikleri entegre eder:
- Ayrılmış Kafa: Birleştirilmiş bir kafa (sınıflandırma ve konumlandırma için özellikleri paylaşan) kullanan önceki YOLO sürümlerinin aksine, YOLOX bu görevleri ayırarak daha hızlı yakınsama ve daha iyi doğruluk sağlar.
- SimOTA Etiket Ataması: Eğitim sürecini optimal bir taşıma problemi olarak ele alan ve pozitif örnekleri otomatik olarak maliyeti en aza indirecek şekilde temel gerçeklere atayan gelişmiş bir dinamik etiket atama stratejisi.
- Güçlü Güçlendirme: Ağırlıklı olarak MixUp ve Mozaik artırımları, modelin önceden eğitilmiş omurgalar olmadan bile sağlam özellikler öğrenmesini sağlar.
Güçlü ve Zayıf Yönler
YOLOX hassasiyet ve araştırma esnekliği açısından üstündür. Çapa içermeyen yapısı, alışılmadık en-boy oranlarına sahip nesnelerin tespitinde özellikle etkili olmasını sağlar ve bu senaryolarda genellikle çapa tabanlı eşdeğerlerinden daha iyi performans gösterir. YOLOX-Nano modeli ayrıca oldukça hafiftir (1M parametrenin altında), bu da onu son derece düşük güçlü mikro denetleyiciler için ideal hale getirir.
Olumsuz tarafı, YOLOX aynı doğruluk seviyesi için YOLOv6 veya YOLO11 gibi daha yeni modellere kıyasla FLOP açısından hesaplama açısından daha pahalı olabilir. Eğitim hattı etkili olmakla birlikte, karmaşık dinamik etiket atama hesaplamaları nedeniyle daha yavaş olabilir ve yüksek düzeyde optimize edilmiş Ultralytics uygulamalarına kıyasla eğitim sırasında genellikle daha fazla GPU belleği gerektirir.
YOLOX hakkında daha fazla bilgi edinin
Performans Karşılaştırması: Metrikler ve Analiz
Aşağıdaki tabloda COCO veri setindeki temel performans metriklerinin bire bir karşılaştırması sunulmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv6.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
Analiz
Veriler, tasarım felsefesinde belirgin bir farklılaşmanın altını çizmektedir. YOLOv6.0 donanım farkındalı verimlilikte baskındır. Örneğin YOLOv6-3.0n T4 GPU'larda 1,17 ms'lik müthiş bir çıkarım süresi elde ederek kendi sınıfındaki modeller için tipik kıyaslamalardan önemli ölçüde daha hızlıdır. Bu YOLOv6-3.0l aynı zamanda en büyük YOLOX modelini (YOLOXx) doğrulukta (52,8'e karşı 51,1 mAP) neredeyse yarısı kullanılırken FLOP'lar.
YOLOXtersine, ultra hafif ağırlık kategorisinde kazanır. Bu YOLOXnano 1 milyonun altında parametreye sahiptir, bu da çok az modern dedektörün kopyalayabildiği bir başarıdır, bu da onu bellek depolamanın hesaplama hızından ziyade birincil darboğaz olduğu belirli IoT uygulamaları için benzersiz bir şekilde uygun hale getirir. Bununla birlikte, genel amaçlı tespit için YOLOX, YOLOv6 ile karşılaştırılabilir doğruluk için daha fazla parametre gerektirme eğilimindedir.
Donanımla İlgili Hususlar
Dağıtım hedefiniz modern bir NVIDIA GPU ise (örneğin, Jetson Orin, T4, A100), YOLOv6.0 'ın özel backbone nedeniyle daha iyi verim sağlaması muhtemeldir. Genel bir CPU 'yu veya çok sıkı depolama sınırlarına sahip eski bir gömülü sistemi hedefliyorsanız, YOLOX Nano daha uygun olabilir.
Ultralytics Avantajı: Neden YOLO11'i Seçmelisiniz?
YOLOv6 ve YOLOX ise belirli nişler için sağlam çözümler sunuyor, Ultralytics YOLO11 geliştiricilerin büyük çoğunluğu için üstün bir hız, doğruluk ve kullanılabilirlik dengesi sunan en son teknolojiye sahip araştırmaların doruk noktasını temsil eder.
Eşsiz Çok Yönlülük ve Ekosistem
Genellikle yalnızca sınırlayıcı kutu tespitine odaklanan rakiplerin aksine YOLO11 , Örnek Segmentasyonu, Poz Tahmini, Yönlendirilmiş Nesne Tespiti (OBB) ve Sınıflandırma dahil olmak üzere çok çeşitli bilgisayarla görme görevleri için yerel destek sağlar. Bu, geliştiricilerin karmaşık, çok aşamalı sorunları tek bir çerçeve ile çözmelerine olanak tanır.
Ayrıca, Ultralytics ekosistemi aktif olarak sürdürülmekte ve en son Python sürümleri, PyTorch güncellemeleri ve aşağıdaki gibi dağıtım hedefleri ile uyumluluk sağlanmaktadır CoreML, OpenVINOve ONNX.
Verimlilik ve Kullanım Kolaylığı
YOLO11 , eğitim verimliliği için tasarlanmıştır ve tipik olarak transformatör tabanlı alternatiflerden ( RT-DETR gibi) veya eski YOLO sürümlerinden daha az GPU belleği gerektirir. Bu, araştırmacıların tüketici sınıfı donanımlarda daha büyük modelleri eğitmesine olanak tanır. Python API'si basitlik için tasarlanmıştır ve kullanıcıların sadece birkaç satır kodla kurulumdan çıkarıma geçmelerini sağlar:
from ultralytics import YOLO
# Load the YOLO11 model (n, s, m, l, or x)
model = YOLO("yolo11n.pt")
# Perform inference on an image
results = model("path/to/image.jpg")
# Export to ONNX for deployment
model.export(format="onnx")
Gerçek Dünya Performans Dengesi
Karşılaştırmalar sürekli olarak YOLO11 'in daha yüksek performans gösterdiğini ortaya koymaktadır mAP hem YOLOv6 hem de YOLOX ile karşılaştırılabilir veya daha yüksek çıkarım hızlarında puanlar. Bu "Pareto optimal" performans, onu otonom araçlardan tıbbi görüntüleme analizine kadar çeşitli uygulamalar için önerilen seçim haline getirmektedir.
Sonuç
YOLOv6.0 ve YOLOX'u karşılaştırırken, seçim büyük ölçüde özel kısıtlamalarınıza bağlıdır. YOLOv6.0, milisaniye düzeyinde gecikmenin kritik olduğu, tamamen endüstriyel GPU dağıtımları için tercih edilir. YOLOX, Nano modeli aracılığıyla çapasız mimarilere yönelik araştırmalar ve ultra kısıtlı depolama ortamları için sağlam bir seçim olmaya devam etmektedir.
Bununla birlikte, üst düzey performansı kullanımı kolay, zengin özelliklere sahip bir platformla birleştiren geleceğe dönük bir çözüm arayan geliştiriciler için, Ultralytics YOLO11 kesin kazanandır. Birden fazla görevi sorunsuz bir şekilde yerine getirme yeteneği, kapsamlı dokümantasyon ve geniş dağıtım desteği ile birleştiğinde, konseptten üretime kadar geliştirme yaşam döngüsünü hızlandırır.
Ultralytics modellerinin aşağıdakilere karşı nasıl yığıldığını görmek için diğer karşılaştırmaları keşfedin RT-DETR veya YOLOv7.