YOLOX ve YOLOv5: Ankarsız Araştırma ile Endüstriyel Nesne Algılama Arasındaki Köprü
Gerçek zamanlı nesne algılamanın gelişimi, iki farklı felsefe tarafından yönlendirilmiştir: mimari saflığın akademik arayışı ve pratik uygulama için endüstriyel talep. YOLOX ve YOLOv5 , bu iki yolun birleştiği noktayı temsil etmektedir. YOLOX, algılamanın temel geometrisini basitleştiren yüksek performanslı, ankraj gerektirmeyen bir algılayıcıyı piyasaya sürerken, YOLOv5 üretim ortamlarında kullanılabilirlik, sağlamlık ve uygulama kolaylığı açısından küresel bir standart YOLOv5 .
Bu ayrıntılı karşılaştırma, bu iki etkili modelin mimari seçimleri, çıkarım hızı ve gerçek dünyadaki uygulanabilirlik açısından nasıl bir performans sergilediğini inceleyerek, bilgisayar görme ihtiyaçlarınıza en uygun çerçeveyi seçmenize yardımcı olur.
Önemli Teknik Özellikler
Aşağıdaki tablo, her iki modelin performans ölçütlerini göstermektedir. YOLOX güçlü teorik sonuçlar sergilerken, YOLOv5 özellikle dışa aktarım ekosisteminin olgunluğu göz önüne alındığında, pratik uygulamalar için YOLOv5 daha dengeli bir profil sunmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOX: Çapa Kullanmayan Yenilikçi
Megvii tarafından 2021 yılında piyasaya sürülen YOLOX, YOLOv2 ve YOLOv3 gibi önceki sürümlerin temel özelliği olan bağlantı kutularını ortadan kaldırarak YOLO önemli bir değişime imza attı. Bağlantı kutusu içermeyen bir mekanizma benimseyen YOLOX, eğitim sürecini basitleştirdi ve genellikle alana özgü uzmanlık gerektiren manuel bağlantı kutusu hiperparametre ayarlaması ihtiyacını ortadan kaldırdı.
Mimari Öne Çıkanlar
- Anchor-Free Mekanizma: YOLOX, önceden tanımlanmış kutulardan ofsetleri tahmin etmek yerine, sınırlayıcı kutu koordinatlarını doğrudan tahmin eder. Bu yaklaşım, baş mimarisinin karmaşıklığını azaltır ve çeşitli nesne şekilleri arasında genellemeyi iyileştirir.
- Ayrıştırılmış Kafa: Sınıflandırma ve yerelleştirme görevleri ağın farklı dallarına ayrılmıştır. Bu ayrıştırma, sınıflandırma güvenilirliği ile yerelleştirme doğruluğu arasındaki çelişkiyi çözerek eğitim sırasında daha hızlı yakınsama sağlar.
- SimOTA Etiket Atama: YOLOX, atama prosedürünü Optimal Transport problemi olarak gören gelişmiş bir etiket atama stratejisi olan SimOTA'yı tanıttı. Bu dinamik atama, modelin eğitim sırasında daha etkili pozitif örnekleri öğrenmesini sağlar.
- Mozaik ve MixUp : YOLOv4 ve Ultralytics büyük ölçüde esinlenen YOLOX, güçlü veri artırma stratejileri kullanarak çıkarım maliyetini artırmadan sağlamlığı artırır.
Araştırma Bağlamı
YOLOX, akademik araştırma ile endüstriyel uygulama arasında önemli bir köprü görevi görerek, çapa içermeyen dedektörlerin YOLOv5 gibi optimize edilmiş çapa tabanlı sistemlerin performansına eşdeğer olabileceğini kanıtladı.
YOLOX Detayları:
- Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
- Kuruluş:Megvii
- Tarih: 2021-07-18
- Arxiv:YOLOX: 2021'de YOLO Serisini Aşmak
- GitHub:Megvii-BaseDetection/YOLOX
YOLOX hakkında daha fazla bilgi edinin
YOLOv5: Endüstriyel Standart
YOLOv5, Ultralytics tarafından geliştirilen, tartışmasız dünyanın en yaygın olarak kullanılan nesne algılama modelidir. Kullanılabilirlik, kararlılık ve "sadece çalışır" deneyimini ön planda tutmuştur. YOLOX mimari yeniliklere odaklanırken, YOLOv5 mühendislik mükemmelliğine YOLOv5 , binlerce gerçek dünya kullanım senaryosunda eğitilmesi, uygulanması ve ölçeklendirilmesi kolay bir model oluşturmuştur.
Geliştiriciler Neden YOLOv5'i Seçiyor
- Eşsiz Kullanım Kolaylığı: Ultralytics , derin öğrenme modellerinin eğitiminin karmaşıklığını ortadan kaldırır. Kullanıcılar, sadece birkaç satırlık Python ile veri setinden eğitilmiş modele geçebilirler, bu da yapay zeka benimseme sürecinin önündeki engelleri önemli ölçüde azaltır.
- Kapsamlı Ekosistem: Yayınlandıktan sonra genellikle terk edilen araştırma depolarının aksine, YOLOv5 büyük bir ekosistem tarafından YOLOv5 . Bu ekosistem, aşağıdaki gibi MLOps araçlarıyla sorunsuz entegrasyonları içerir Weights & Biases, Cometve ClearML, profesyonel bir geliştirme iş akışı sağlar.
- Verimli Bellek Yönetimi: YOLOv5 verimlilik için YOLOv5 . Genellikle, birçok rakibine kıyasla eğitim sırasında daha az GPU gerektirir, böylece kullanıcılar tüketici sınıfı donanımlarda veya hatta Google gibi ücretsiz bulut kaynaklarında etkili modeller eğitebilirler.
- Algılamanın Ötesinde Çok Yönlülük: YOLOX öncelikle bir algılama çerçevesi olsa da, YOLOv5 örnek segmentasyonu ve görüntü sınıflandırmasını destekler, bu da onu çeşitli proje gereksinimleri için çok işlevli bir araç haline getirir.
YOLOv5 :
- Yazar: Glenn Jocher
- Kuruluş:Ultralytics
- Tarih: 2020-06-26
- Belgeler:YOLOv5 Belgeleri
- GitHub:ultralytics/yolov5
YOLOv5 hakkında daha fazla bilgi edinin.
Performans ve Dağıtım Analizi
Üretim için bir model seçerken, ham mAP nadiren tek mAP . Dağıtım kısıtlamaları, donanım uyumluluğu ve bakım da aynı derecede önemlidir.
Çıkarım Hızı ve Verimlilik
YOLOv5 , dağıtım senaryolarında YOLOv5 . Mimarisi, aşağıdaki formatlara aktarım için büyük ölçüde optimize edilmiştir ONNX, TensorRT, CoreMLve TFLite. Karşılaştırma tablosunda görüldüğü gibi, YOLOv5n (Nano), benzer hafif modellere kıyasla önemli ölçüde daha hızlı çıkarım hızları ( TensorRT 1,12 ms) elde eder, bu da onu her milisaniyenin önemli olduğu uç cihazlar için ideal hale getirir.
YOLOX, performanslı olmasına rağmen, belirli mimari bileşenleri (ayrılmış başlık gibi) nedeniyle bazen dışa aktarım uyumluluğu konusunda zorluklarla karşılaşabilir ve bu da belirli çıkarım motorları için optimizasyon amacıyla daha fazla özel mühendislik gerektirebilir.
Eğitim Deneyimi
Eğitim verimliliği, Ultralytics ayırt edici özelliğidir. YOLOv5 otomatik bağlantı mekanizması, bağlantıları özel veri kümenize en uygun şekilde otomatik olarak yeniden hesaplayarak, manuel müdahaleye gerek kalmadan özelleştirilmiş bağlantıların avantajlarını sunar. Ayrıca, yüksek kaliteli önceden eğitilmiş ağırlıkların kullanılabilirliği, transfer öğrenimini hızlandırarak modellerin daha küçük veri kümeleriyle yüksek doğruluk oranlarına ulaşmasını sağlar.
from ultralytics import YOLO
# Load a model (YOLOv5 or the newer YOLO26)
model = YOLO("yolov5su.pt") # YOLOv5s with newer head
# Train on custom data in one line
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
Kolaylaştırılmış İş Akışı
Yukarıdaki kod parçacığı, birleştirilmiş Ultralytics göstermektedir. Bu aynı basit arayüz, YOLOv5, YOLOv8 ve en son teknoloji YOLO26 için de çalışır ve kod tabanınızı yeniden yazmadan modelleri anında değiştirebilmenizi sağlar.
Kullanım Durumu Önerileri
YOLOX için ideal
- Akademik Araştırma: Temiz ve bağlantısız uygulaması, etiket atama stratejileri veya algılama kafası mimarilerini inceleyen araştırmacılar için mükemmel bir temel oluşturur.
- Özel Yüksek Doğruluk Senaryoları: mAP en üst düzeye çıkarmak tek öncelik mAP ve çıkarım gecikmesi daha az önemli olan görevler için, YOLOX'un daha büyük varyantları (YOLOX-x gibi) rekabetçi bir doğruluk sunar.
YOLOv5 için ideal
- Ticari Kullanım: Güçlü dışa aktarım yolları ve istikrarı sayesinde YOLOv5 , Raspberry Pi' lerden bulut sunucularına kadar binlerce cihaza dağıtım yapan şirketler için ideal YOLOv5 .
- Edge AI: Hafif varyantlar (Nano/Small) olağanüstü hızlıdır ve cep telefonlarında veya dronlarda gerçek zamanlı video analizi için mükemmeldir.
- Hızlı Prototipleme: "Sıfırdan kahramana" deneyimi, geliştiricilerin fikirlerini günler yerine saatler içinde doğrulayabilmeleri anlamına gelir.
Gelecek: Ultralytics
YOLOv5 YOLOX hala güçlü araçlar olsa da, bu alan daha da ilerlemiştir. En iyi performansı arayan geliştiriciler için Ultralytics , yeni nesil görsel yapay zeka teknolojisini temsil etmektedir.
YOLO26, her iki dünyanın en iyi özelliklerini bir araya getirir:
- Uçtan Uca NMS: En gelişmiş araştırma modelleri gibi, YOLO26 de doğal olarak uçtan uca çalışır ve NMS gerek kalmaz. Bu da daha hızlı, deterministik çıkarım sağlar ve dağıtım süreçlerini basitleştirir.
- MuSGD Optimizer: LLM eğitim yeniliklerinden esinlenen YOLO26, daha fazla kararlılık ve yakınsama hızı için MuSGD optimizer'ı kullanır.
- Kenar Optimizasyonu: Kenar bilişim için özel olarak tasarlanmış olup, önceki nesillere kıyasla %43'e kadar daha hızlı CPU sunarak mobil ve IoT uygulamaları için üstün bir seçimdir.
- Çok yönlülük: Tek bir birleşik çerçeve içinde tüm görevleri (algılama, segmentasyon, sınıflandırma, poz ve OBB) destekler.
YOLO26 hakkında daha fazla bilgi edinin
Sonuç
YOLOX ve YOLOv5 arasında seçim yapmak, YOLOv5 hedeflerinize bağlıdır. Eğer çapa içermeyen mimarilerle denemeler yapmak isteyen bir araştırmacıysanız, YOLOX güçlü bir adaydır. Ancak, güvenilir, gerçek zamanlı uygulamalar geliştirmeye odaklanan geliştiricilerin ve işletmelerin büyük çoğunluğu için YOLOv5ve onun halefi YOLO26, hız, doğruluk ve kullanım kolaylığı arasında üstün bir denge sunar. Ultralytics , projelerinizin aktif bakım, kapsamlı belgeler ve canlı bir topluluk tarafından desteklenmesini sağlar.
Daha fazla bilgi edinmek için, YOLOv8 YOLOv5 karşılaştırmak veya YOLOv10 gerçek zamanlı yetenekleri hakkında bilgi edinmek de ilginizi çekebilir.