YOLOX - YOLOv5 Karşılaştırması: Teknik Bir İnceleme
Bilgisayar görüşü alanının hızla geliştiği günümüzde, YOLO (You Only Look Once) serisi, gerçek zamanlı nesne algılama sınırlarını sürekli olarak zorlamıştır. Bu sayfa, bu serideki iki etkili model arasında ayrıntılı bir teknik karşılaştırma sunmaktadır: Megvii tarafından geliştirilen YOLOX ve Ultralytics YOLOv5. Her iki model de güçlü yetenekler sunmasına rağmen, farklı tasarım felsefeleri üzerine inşa edilmiştir. YOLOX, algılama başlığını basitleştirmek ve performansı artırmak için anchor-free bir yaklaşım sunarken, YOLOv5 hız, doğruluk ve kullanım kolaylığının olağanüstü dengesiyle tanınan bir endüstri standardı olarak kendini kanıtlamıştır.
Bu karşılaştırma, ham doğruluğa, dağıtım hızına veya genel geliştirme verimliliğine öncelik vermeniz fark etmeksizin, projeniz için en uygun modeli seçmenize yardımcı olmak amacıyla mimari farklılıklarını, performans metriklerini ve ideal kullanım durumlarını derinlemesine inceler.
YOLOX: Ankrajsız ve Yüksek Performanslı Alternatif
YOLOX, 18 Temmuz 2021'de Megvii'den araştırmacılar tarafından tanıtıldı. Geleneksel bağlantı tabanlı yöntemlere kıyasla basitleştirilmiş bir tasarımla yüksek performans hedefleyen, nesne algılamaya anchor-free (bağlantısız) bir yaklaşım sunar. YOLOX, önceden tanımlanmış bağlantı kutularını ortadan kaldırarak tasarım karmaşıklığını azaltmayı ve farklı veri kümelerinde genellemeyi iyileştirmeyi amaçlar.
Teknik Detaylar:
- Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
- Kuruluş: Megvii
- Tarih: 2021-07-18
- Arxiv: https://arxiv.org/abs/2107.08430
- GitHub: https://github.com/Megvii-BaseDetection/YOLOX
- Belgeler: https://yolox.readthedocs.io/en/latest/
Mimari ve Temel Özellikler
YOLOX, çeşitli temel yeniliklerle kendini farklı kılar. Temel özelliği, önceden tanımlanmış bir dizi bağlantı kutusuna dayanmadan doğrudan nesne özelliklerini tahmin eden bağlantısız algılama mekanizmasıdır. Bu, eğitim hattını basitleştirir ve bağlantı ayarlama ihtiyacını ortadan kaldırır. Mimari ayrıca yazarların yakınsamayı ve doğruluğu iyileştirdiğini tespit ettiği sınıflandırma ve yerelleştirme görevleri için ayrık başlıklar içerir. Ayrıca, YOLOX, zorlu nesneler üzerindeki performansını artırmak için eğitim için pozitif örnekleri dinamik olarak atamak üzere SimOTA adlı gelişmiş bir etiket atama stratejisi kullanır.
Güçlü Yönler
- Yüksek Doğruluk: YOLOX, ayrıştırılmış başlığı ve gelişmiş etiket atama teknikleri sayesinde, COCO gibi kıyaslama testlerinde benzer boyuttaki diğer modellerden genellikle daha iyi performans göstererek rekabetçi doğruluk elde eder.
- Anchor-Free (Çapa Kutusu Olmayan) Algılama: Bu, algılama hattını basitleştirir ve genellikle alana özgü ayarlama gerektiren çapa kutusu yapılandırmalarına olan bağımlılıkları ortadan kaldırarak genellemeyi iyileştirebilir.
Zayıflıklar
- Uygulama Karmaşıklığı: Bağlantısız başlıkların ve SimOTA gibi gelişmiş stratejilerin tanıtımı, bağlantısız olmanın bir yönü basitleştirmesine rağmen, modelin uygulanmasına ve anlaşılmasına karmaşıklık katabilir.
- Harici Ekosistem: YOLOX, Ultralytics paketinin bir parçası değildir, bu da Ultralytics HUB gibi araçlarla sorunsuz entegrasyondan yoksun olduğu anlamına gelir. Bu, birleşik ve iyi belgelenmiş Ultralytics deneyimine kıyasla daha dik bir öğrenme eğrisine neden olabilir.
- CPU Hızı: Performans kıyaslamalarında görüldüğü gibi, CPU üzerindeki çıkarım hızı, özellikle daha büyük YOLOX varyantları için YOLOv5 gibi yüksek düzeyde optimize edilmiş modellerin gerisinde kalabilir.
Kullanım Alanları
YOLOX, mümkün olan en yüksek doğruluğu elde etmenin birincil hedef olduğu uygulamalar için çok uygundur:
- Otonom Sürüş: Yüksek hassasiyeti, tüm nesnelerin doğru bir şekilde tanımlanmasının kritik olduğu otonom araçlardaki algılama görevleri için değerlidir.
- Gelişmiş Robotik: Robotların navigasyon ve etkileşim için hassas nesne tespiti gerçekleştirmesi gereken karmaşık ortamlar için idealdir, Robotikteki YZ'de araştırıldığı gibi.
- Araştırma: Anchor-free metodolojiler ve nesne algılamadaki gelişmiş eğitim teknikleri üzerine akademik ve endüstriyel araştırmalar için güçlü bir temel oluşturur.
YOLOX hakkında daha fazla bilgi edinin
YOLOv5: Çok Yönlü ve Yaygın Olarak Benimsenen Model
26 Haziran 2020'de piyasaya sürülen Ultralytics YOLOv5, hız, doğruluk ve olağanüstü kullanım kolaylığının mükemmel dengesiyle kutlanan bir endüstri standardı haline gelmiştir. Ultralytics'teki Glenn Jocher tarafından geliştirilmiş olup, tamamen PyTorch ile inşa edilmiştir ve bu da onu geniş bir geliştirici ve araştırmacı topluluğu için oldukça erişilebilir kılmaktadır.
Teknik Detaylar:
- Yazar: Glenn Jocher
- Kuruluş: Ultralytics
- Tarih: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- Belgeler: https://docs.ultralytics.com/models/yolov5/
Mimari ve Temel Özellikler
YOLOv5, özellik çıkarımı için bir CSPDarknet53 backbone ve özellik toplama için bir PANet neck kullanır; bu, verimli ve etkili nesne algılama için kanıtlanmış bir kombinasyondur. Mimarisi son derece ölçeklenebilirdir ve farklı hesaplama bütçelerine ve performans ihtiyaçlarına hitap etmek için çeşitli boyutlarda (n, s, m, l, x) sunulur. YOLOX'tan farklı olarak, hız için son derece optimize edilmiş, ankraj tabanlı bir algılama head'i kullanır. Model, basit bir Python API, kapsamlı belgelendirme ve eğitim ve dağıtım için kodsuz Ultralytics HUB platformunu içeren kapsamlı bir ekosistemin parçasıdır.
Güçlü Yönler
- Olağanüstü Çıkarım Hızı: YOLOv5, hızlı algılama için yüksek düzeyde optimize edilmiştir ve hem CPU hem de GPU donanımında gerçek zamanlı sistemler için en iyi seçimdir.
- Kullanım Kolaylığı: Basit API'si, kapsamlı dokümantasyonu ve geliştiriciler için giriş engelini önemli ölçüde azaltan Ultralytics ekosistemine sorunsuz entegrasyonu ile bilinir.
- Olgun Ekosistem: Geniş, aktif bir topluluktan, sık güncellemelerden ve kolayca erişilebilen önceden eğitilmiş ağırlıklar dahil olmak üzere kapsamlı kaynaklardan yararlanır.
- Eğitim Verimliliği: Eğitim süreci, daha hızlı yakınsama süreleri ve genellikle daha karmaşık mimarilere kıyasla daha düşük bellek gereksinimleri ile oldukça verimlidir.
- Çok Yönlülük: YOLOv5, aynı çerçeve içinde örnek segmentasyonu ve görüntü sınıflandırma dahil olmak üzere, algılamanın ötesinde birden çok görme görevini destekler.
Zayıflıklar
- Anchor Tabanlı Algılama: Anchor kutularına dayanır ve bu durum anchor'suz algılayıcılara kıyasla alışılmadık şekilli veya ölçekli nesneler içeren veri kümelerinde optimum performans için ayarlama gerektirebilir.
- Doğruluk Dengesi: Harika bir denge sunmasına rağmen, daha küçük YOLOv5 modelleri hıza öncelik verir; bu da daha büyük modellere veya tamamen maksimum hassasiyet için tasarlanmış daha yeni mimarilere kıyasla biraz daha düşük doğruluğa neden olabilir.
Kullanım Alanları
YOLOv5'in çok yönlülüğü ve verimliliği, onu çok çeşitli alanlar için uygun hale getirir:
- Edge Computing: Hızı ve daha küçük model boyutları, Raspberry Pi ve NVIDIA Jetson gibi kaynak kısıtlamalı cihazlarda dağıtım için mükemmel kılar.
- Endüstriyel Otomasyon: Üretimde kalite kontrolü ve süreç otomasyonuna güç verir; örneğin geri dönüşüm verimliliğini artırır.
- Güvenlik ve Gözetim: Hırsızlık önleme gibi uygulamalar için güvenlik sistemlerinde gerçek zamanlı izlemeyi sağlar.
- Mobil Uygulamalar: Düşük gecikme süresi ve verimliliğin kritik olduğu cihaz üzerinde nesne tespiti görevleri için uygundur.
YOLOv5 hakkında daha fazla bilgi edinin
Performans Karşılaştırması: Hız - Doğruluk
YOLOX ve YOLOv5 karşılaştırıldığında, doğruluk ve hız arasında belirgin bir denge ortaya çıkar. YOLOX modelleri genellikle belirli bir model boyutu için daha yüksek bir mAPval puanı elde ederek, ankrajsız tasarımının ve gelişmiş eğitim stratejilerinin etkinliğini gösterir. Örneğin, YOLOX-x, 51.1 mAP'ye ulaşarak YOLOv5x'i hafifçe geride bırakır.
Ancak, Ultralytics YOLOv5, çıkarım hızında önemli bir avantaja sahiptir. YOLOv5n gibi daha küçük YOLOv5 modelleri, hem CPU hem de GPU'da son derece hızlıdır ve bu da onları uç cihazlardaki gerçek zamanlı uygulamalar için ideal hale getirir. Performans tablosu, YOLOv5n'nin yalnızca 1,12 ms'lik bir TensorRT gecikmesine ulaştığını ve bunun YOLOX-s'den iki kat daha hızlı olduğunu gösteriyor. Bu verimlilik, YOLOv5'i hızın kritik bir kısıtlama olduğu birçok üretim ortamı için daha pratik bir seçim haline getiriyor.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Sonuç: Hangi Modeli Seçmelisiniz?
Hem YOLOX hem de YOLOv5, güçlü nesne tespit modelleridir, ancak farklı önceliklere hitap ederler. YOLOX, maksimum doğruluğa öncelik veren ve ankrajsız mimarilerin faydalarını keşfetmek isteyen araştırmacılar ve geliştiriciler için mükemmel bir seçimdir. Kıyaslamalardaki güçlü performansı, hassasiyetin çok önemli olduğu görevler için onu zorlu bir model yapar.
Ancak, gerçek dünya uygulamalarının büyük çoğunluğu için Ultralytics YOLOv5 daha çekici bir genel paket sunuyor. Temel avantajları olağanüstü hızı, kullanım kolaylığı ve sağlam ekosisteminde yatmaktadır. Geliştiriciler, kapsamlı dokümantasyon, basit bir API ve akıcı bir eğitim süreci sayesinde hızla başlayabilirler. Modelin verimliliği, özellikle gerçek zamanlı ve uç bilişim senaryolarında dağıtım için onu son derece pratik hale getiriyor.
Ayrıca, Ultralytics'in sürekli gelişimi ve desteği, kullanıcıların iyi yönetilen ve sürekli gelişen bir çerçeveden yararlanması anlamına gelir. Kullanılabilirlik ve çok yönlülük ile birlikte en son teknoloji performansını arayanlar için, YOLOv5'in güçlü temeli üzerine inşa ederek daha da fazla özellik sunan YOLOv8 ve YOLO11 gibi daha yeni Ultralytics modellerini keşfetmek de şiddetle tavsiye edilir.
Diğer Model Karşılaştırmaları
Bu modelleri diğerleriyle karşılaştırmakla ilgileniyorsanız, şu sayfalara göz atın:
- YOLOv8 - YOLOX karşılaştırması
- YOLOv10 - YOLOX Karşılaştırması
- RT-DETR - YOLOv5 Karşılaştırması
- YOLOv8 - YOLOv5 karşılaştırması
- YOLOv9 - YOLOv5 karşılaştırması