İçeriğe geç

YOLOX - YOLOv5 Karşılaştırması: Teknik Bir İnceleme

Bilgisayar görüşü alanının hızla geliştiği günümüzde, YOLO (You Only Look Once) serisi, gerçek zamanlı nesne algılama sınırlarını sürekli olarak zorlamıştır. Bu sayfa, bu serideki iki etkili model arasında ayrıntılı bir teknik karşılaştırma sunmaktadır: Megvii tarafından geliştirilen YOLOX ve Ultralytics YOLOv5. Her iki model de güçlü yetenekler sunmasına rağmen, farklı tasarım felsefeleri üzerine inşa edilmiştir. YOLOX, algılama başlığını basitleştirmek ve performansı artırmak için anchor-free bir yaklaşım sunarken, YOLOv5 hız, doğruluk ve kullanım kolaylığının olağanüstü dengesiyle tanınan bir endüstri standardı olarak kendini kanıtlamıştır.

Bu karşılaştırma, ham doğruluğa, dağıtım hızına veya genel geliştirme verimliliğine öncelik vermeniz fark etmeksizin, projeniz için en uygun modeli seçmenize yardımcı olmak amacıyla mimari farklılıklarını, performans metriklerini ve ideal kullanım durumlarını derinlemesine inceler.

YOLOX: Ankrajsız ve Yüksek Performanslı Alternatif

YOLOX, 18 Temmuz 2021'de Megvii'den araştırmacılar tarafından tanıtıldı. Geleneksel bağlantı tabanlı yöntemlere kıyasla basitleştirilmiş bir tasarımla yüksek performans hedefleyen, nesne algılamaya anchor-free (bağlantısız) bir yaklaşım sunar. YOLOX, önceden tanımlanmış bağlantı kutularını ortadan kaldırarak tasarım karmaşıklığını azaltmayı ve farklı veri kümelerinde genellemeyi iyileştirmeyi amaçlar.

Teknik Detaylar:

Mimari ve Temel Özellikler

YOLOX, çeşitli temel yeniliklerle kendini farklı kılar. Temel özelliği, önceden tanımlanmış bir dizi bağlantı kutusuna dayanmadan doğrudan nesne özelliklerini tahmin eden bağlantısız algılama mekanizmasıdır. Bu, eğitim hattını basitleştirir ve bağlantı ayarlama ihtiyacını ortadan kaldırır. Mimari ayrıca yazarların yakınsamayı ve doğruluğu iyileştirdiğini tespit ettiği sınıflandırma ve yerelleştirme görevleri için ayrık başlıklar içerir. Ayrıca, YOLOX, zorlu nesneler üzerindeki performansını artırmak için eğitim için pozitif örnekleri dinamik olarak atamak üzere SimOTA adlı gelişmiş bir etiket atama stratejisi kullanır.

Güçlü Yönler

  • Yüksek Doğruluk: YOLOX, ayrıştırılmış başlığı ve gelişmiş etiket atama teknikleri sayesinde, COCO gibi kıyaslama testlerinde benzer boyuttaki diğer modellerden genellikle daha iyi performans göstererek rekabetçi doğruluk elde eder.
  • Anchor-Free (Çapa Kutusu Olmayan) Algılama: Bu, algılama hattını basitleştirir ve genellikle alana özgü ayarlama gerektiren çapa kutusu yapılandırmalarına olan bağımlılıkları ortadan kaldırarak genellemeyi iyileştirebilir.

Zayıflıklar

  • Uygulama Karmaşıklığı: Bağlantısız başlıkların ve SimOTA gibi gelişmiş stratejilerin tanıtımı, bağlantısız olmanın bir yönü basitleştirmesine rağmen, modelin uygulanmasına ve anlaşılmasına karmaşıklık katabilir.
  • Harici Ekosistem: YOLOX, Ultralytics paketinin bir parçası değildir, bu da Ultralytics HUB gibi araçlarla sorunsuz entegrasyondan yoksun olduğu anlamına gelir. Bu, birleşik ve iyi belgelenmiş Ultralytics deneyimine kıyasla daha dik bir öğrenme eğrisine neden olabilir.
  • CPU Hızı: Performans kıyaslamalarında görüldüğü gibi, CPU üzerindeki çıkarım hızı, özellikle daha büyük YOLOX varyantları için YOLOv5 gibi yüksek düzeyde optimize edilmiş modellerin gerisinde kalabilir.

Kullanım Alanları

YOLOX, mümkün olan en yüksek doğruluğu elde etmenin birincil hedef olduğu uygulamalar için çok uygundur:

  • Otonom Sürüş: Yüksek hassasiyeti, tüm nesnelerin doğru bir şekilde tanımlanmasının kritik olduğu otonom araçlardaki algılama görevleri için değerlidir.
  • Gelişmiş Robotik: Robotların navigasyon ve etkileşim için hassas nesne tespiti gerçekleştirmesi gereken karmaşık ortamlar için idealdir, Robotikteki YZ'de araştırıldığı gibi.
  • Araştırma: Anchor-free metodolojiler ve nesne algılamadaki gelişmiş eğitim teknikleri üzerine akademik ve endüstriyel araştırmalar için güçlü bir temel oluşturur.

YOLOX hakkında daha fazla bilgi edinin

YOLOv5: Çok Yönlü ve Yaygın Olarak Benimsenen Model

26 Haziran 2020'de piyasaya sürülen Ultralytics YOLOv5, hız, doğruluk ve olağanüstü kullanım kolaylığının mükemmel dengesiyle kutlanan bir endüstri standardı haline gelmiştir. Ultralytics'teki Glenn Jocher tarafından geliştirilmiş olup, tamamen PyTorch ile inşa edilmiştir ve bu da onu geniş bir geliştirici ve araştırmacı topluluğu için oldukça erişilebilir kılmaktadır.

Teknik Detaylar:

Mimari ve Temel Özellikler

YOLOv5, özellik çıkarımı için bir CSPDarknet53 backbone ve özellik toplama için bir PANet neck kullanır; bu, verimli ve etkili nesne algılama için kanıtlanmış bir kombinasyondur. Mimarisi son derece ölçeklenebilirdir ve farklı hesaplama bütçelerine ve performans ihtiyaçlarına hitap etmek için çeşitli boyutlarda (n, s, m, l, x) sunulur. YOLOX'tan farklı olarak, hız için son derece optimize edilmiş, ankraj tabanlı bir algılama head'i kullanır. Model, basit bir Python API, kapsamlı belgelendirme ve eğitim ve dağıtım için kodsuz Ultralytics HUB platformunu içeren kapsamlı bir ekosistemin parçasıdır.

Güçlü Yönler

  • Olağanüstü Çıkarım Hızı: YOLOv5, hızlı algılama için yüksek düzeyde optimize edilmiştir ve hem CPU hem de GPU donanımında gerçek zamanlı sistemler için en iyi seçimdir.
  • Kullanım Kolaylığı: Basit API'si, kapsamlı dokümantasyonu ve geliştiriciler için giriş engelini önemli ölçüde azaltan Ultralytics ekosistemine sorunsuz entegrasyonu ile bilinir.
  • Olgun Ekosistem: Geniş, aktif bir topluluktan, sık güncellemelerden ve kolayca erişilebilen önceden eğitilmiş ağırlıklar dahil olmak üzere kapsamlı kaynaklardan yararlanır.
  • Eğitim Verimliliği: Eğitim süreci, daha hızlı yakınsama süreleri ve genellikle daha karmaşık mimarilere kıyasla daha düşük bellek gereksinimleri ile oldukça verimlidir.
  • Çok Yönlülük: YOLOv5, aynı çerçeve içinde örnek segmentasyonu ve görüntü sınıflandırma dahil olmak üzere, algılamanın ötesinde birden çok görme görevini destekler.

Zayıflıklar

  • Anchor Tabanlı Algılama: Anchor kutularına dayanır ve bu durum anchor'suz algılayıcılara kıyasla alışılmadık şekilli veya ölçekli nesneler içeren veri kümelerinde optimum performans için ayarlama gerektirebilir.
  • Doğruluk Dengesi: Harika bir denge sunmasına rağmen, daha küçük YOLOv5 modelleri hıza öncelik verir; bu da daha büyük modellere veya tamamen maksimum hassasiyet için tasarlanmış daha yeni mimarilere kıyasla biraz daha düşük doğruluğa neden olabilir.

Kullanım Alanları

YOLOv5'in çok yönlülüğü ve verimliliği, onu çok çeşitli alanlar için uygun hale getirir:

  • Edge Computing: Hızı ve daha küçük model boyutları, Raspberry Pi ve NVIDIA Jetson gibi kaynak kısıtlamalı cihazlarda dağıtım için mükemmel kılar.
  • Endüstriyel Otomasyon: Üretimde kalite kontrolü ve süreç otomasyonuna güç verir; örneğin geri dönüşüm verimliliğini artırır.
  • Güvenlik ve Gözetim: Hırsızlık önleme gibi uygulamalar için güvenlik sistemlerinde gerçek zamanlı izlemeyi sağlar.
  • Mobil Uygulamalar: Düşük gecikme süresi ve verimliliğin kritik olduğu cihaz üzerinde nesne tespiti görevleri için uygundur.

YOLOv5 hakkında daha fazla bilgi edinin

Performans Karşılaştırması: Hız - Doğruluk

YOLOX ve YOLOv5 karşılaştırıldığında, doğruluk ve hız arasında belirgin bir denge ortaya çıkar. YOLOX modelleri genellikle belirli bir model boyutu için daha yüksek bir mAPval puanı elde ederek, ankrajsız tasarımının ve gelişmiş eğitim stratejilerinin etkinliğini gösterir. Örneğin, YOLOX-x, 51.1 mAP'ye ulaşarak YOLOv5x'i hafifçe geride bırakır.

Ancak, Ultralytics YOLOv5, çıkarım hızında önemli bir avantaja sahiptir. YOLOv5n gibi daha küçük YOLOv5 modelleri, hem CPU hem de GPU'da son derece hızlıdır ve bu da onları uç cihazlardaki gerçek zamanlı uygulamalar için ideal hale getirir. Performans tablosu, YOLOv5n'nin yalnızca 1,12 ms'lik bir TensorRT gecikmesine ulaştığını ve bunun YOLOX-s'den iki kat daha hızlı olduğunu gösteriyor. Bu verimlilik, YOLOv5'i hızın kritik bir kısıtlama olduğu birçok üretim ortamı için daha pratik bir seçim haline getiriyor.

Model boyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

Sonuç: Hangi Modeli Seçmelisiniz?

Hem YOLOX hem de YOLOv5, güçlü nesne tespit modelleridir, ancak farklı önceliklere hitap ederler. YOLOX, maksimum doğruluğa öncelik veren ve ankrajsız mimarilerin faydalarını keşfetmek isteyen araştırmacılar ve geliştiriciler için mükemmel bir seçimdir. Kıyaslamalardaki güçlü performansı, hassasiyetin çok önemli olduğu görevler için onu zorlu bir model yapar.

Ancak, gerçek dünya uygulamalarının büyük çoğunluğu için Ultralytics YOLOv5 daha çekici bir genel paket sunuyor. Temel avantajları olağanüstü hızı, kullanım kolaylığı ve sağlam ekosisteminde yatmaktadır. Geliştiriciler, kapsamlı dokümantasyon, basit bir API ve akıcı bir eğitim süreci sayesinde hızla başlayabilirler. Modelin verimliliği, özellikle gerçek zamanlı ve uç bilişim senaryolarında dağıtım için onu son derece pratik hale getiriyor.

Ayrıca, Ultralytics'in sürekli gelişimi ve desteği, kullanıcıların iyi yönetilen ve sürekli gelişen bir çerçeveden yararlanması anlamına gelir. Kullanılabilirlik ve çok yönlülük ile birlikte en son teknoloji performansını arayanlar için, YOLOv5'in güçlü temeli üzerine inşa ederek daha da fazla özellik sunan YOLOv8 ve YOLO11 gibi daha yeni Ultralytics modellerini keşfetmek de şiddetle tavsiye edilir.

Diğer Model Karşılaştırmaları

Bu modelleri diğerleriyle karşılaştırmakla ilgileniyorsanız, şu sayfalara göz atın:



📅 1 yıl önce oluşturuldu ✏️ 1 ay önce güncellendi

Yorumlar