İçeriğe geç

YOLOv7 ve YOLOX: Ayrıntılı Teknik Karşılaştırma

En uygun nesne algılama modelini seçmek, bilgisayarla görme projeleri için kritik bir karardır. Farklı mimarilerin belirli güçlü ve zayıf yönlerini anlamak, en iyi performansı elde etmenin anahtarıdır. Bu sayfa, mimari nüanslarını, performans kıyaslamalarını ve ideal dağıtım senaryolarını ayrıntılarıyla açıklayan, etkili iki model olan YOLOv7 ve YOLOX'un teknik bir karşılaştırmasını sunar.

YOLOv7: Yüksek Doğruluklu ve Verimli Algılama

Temmuz 2022'de tanıtılan YOLOv7, hem eğitim verimliliğini hem de çıkarım hızını optimize ederek gerçek zamanlı nesne dedektörleri için hızla yeni standartlar belirledi. Zorlu uygulamalar için hız ve doğruluğu dengelemede önemli bir adımı temsil ediyor.

Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
Tarih: 2022-07-06
Arşiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Belgeler: https://docs.ultralytics.com/models/yolov7/

Mimari ve Temel Özellikler

YOLOv7, makalesinde ayrıntılı olarak açıklanan çeşitli mimari yenilikler sunmuştur. Temel bir bileşen, ağın gradyan yolunu bozmadan öğrenme yeteneğini artıran ve özellik çıkarmayı geliştiren Genişletilmiş Verimli Katman Toplama Ağı'dır (E-ELAN). Model ayrıca, birleştirme tabanlı modeller için uygun gelişmiş ölçekleme teknikleri kullanır ve "eğitilebilir bedava hediyeler çantası" kullanır. Bunlar, çıkarım maliyetini artırmadan doğruluğu artıran, planlanan yeniden parametrelendirme evrişimi ve kabadan inceye yardımcı kayıp gibi eğitim geliştirmeleridir. Bu özellikler, YOLOv7'nin rekabetçi model boyutlarıyla nesne algılama alanında son teknoloji sonuçlar elde etmesini sağlar.

Performans ve Kullanım Alanları

YOLOv7, hem hızlı çıkarım hem de yüksek doğruluk gerektiren senaryolarda öne çıkar. Etkileyici mAP ve hız metrikleri, onu gerçek zamanlı video analizi, otonom sürüş sistemleri ve yüksek çözünürlüklü görüntü işleme gibi uygulamalar için güçlü bir seçim haline getirir. Akıllı şehir dağıtımlarında, YOLOv7 trafik yönetimi veya acil tehdit algılama için güvenlik sistemlerini geliştirmek için kullanılabilir.

Güçlü ve Zayıf Yönler

  • Güçlü Yönler: Algılama doğruluğu ve çıkarım hızı arasında güçlü bir denge sağlar. Çıkarım sırasında hesaplama taleplerini önemli ölçüde artırmadan daha iyi performans için gelişmiş eğitim teknikleri ("bedava ikramlar") kullanır. Mimari, E-ELAN gibi en son modülleri içerir.
  • Zayıflıklar: Mimari ve eğitim süreci, YOLOv5 gibi daha basit modellere kıyasla daha karmaşık olabilir. Daha büyük YOLOv7 modellerini eğitmek de önemli miktarda hesaplama kaynağı gerektirir, ancak çıkarım hızlı kalır.

YOLOv7 hakkında daha fazla bilgi edinin

YOLOX: Ankrajsız Mükemmellik

Megvii tarafından 2021'de tanıtılan YOLOX, eğitim sürecini basitleştiren ve genellemeyi geliştirmeyi amaçlayan anchor-free (bağlantısız) tasarımı ile kendini ayırır. YOLOX, önceden tanımlanmış bağlantı kutularından uzaklaşarak doğrudan nesne konumlarını tahmin ederek nesne algılamaya farklı bir yaklaşım sunar.

Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
Kuruluş: Megvii
Tarih: 2021-07-18
Arşiv: https://arxiv.org/abs/2107.08430
GitHub: https://github.com/Megvii-BaseDetection/YOLOX
Belgeler: https://yolox.readthedocs.io/en/latest/

Mimari ve Temel Özellikler

YOLOX, çeşitli temel mimari yenilikleri benimser. Bağlantısız yaklaşımı, bağlantı kutularına olan ihtiyacı ortadan kaldırarak tasarım karmaşıklığını ve hesaplama maliyetini azaltır. Bu, çeşitli nesne boyutlarına ve en boy oranlarına daha uyarlanabilir olmasını sağlar ve COCO gibi çeşitli veri kümelerinde performansı potansiyel olarak artırır. Ayrıca, daha hızlı yakınsamaya ve gelişmiş doğruluğa katkıda bulunan sınıflandırma ve yerelleştirme için ayrık bir başlık kullanır. YOLOX, eğitim verimliliğini daha da artırmak için MixUp ve Mosaic gibi güçlü veri artırma teknikleri ve SimOTA (Basitleştirilmiş Optimal Taşıma Ataması) adlı gelişmiş bir etiket atama stratejisi kullanır.

Performans ve Kullanım Alanları

YOLOX, hız ve doğruluk arasında iyi bir denge sağlar. Bağlantısız yapısı, nesne ölçeklerinin önemli ölçüde değiştiği uygulamalar için özellikle uygundur. Robotik ve uç yapay zeka dağıtımları gibi verimli ve doğru algılama gerektiren görevler için güçlü bir rakiptir. Örneğin, üretimde YOLOX, kusur tespiti için çeşitli nesne şekillerine karşı sağlamlığından yararlanarak kalite kontrolü için kullanılabilir.

Güçlü ve Zayıf Yönler

  • Güçlü Yönler: Ankrajsız tasarım, uygulama ve eğitim hatlarını basitleştirir. Güçlü veri artırma ve ankrajsız yaklaşım, yeni veri kümelerine genellemeyi iyileştirir. Ayrıştırılmış başlık ve ankrajsız yapı, verimli çıkarıma katkıda bulunur.
  • Zayıflıklar: Verimli olmasına rağmen, özellikle YOLOv7'nin optimize edilmiş sürümlerine veya YOLOv8 gibi daha yeni Ultralytics modellerine kıyasla, tüm YOLO modelleri arasında en hızlısı olmayabilir. Ayrıca, entegre Ultralytics ekosisteminin bir parçası değildir ve bu da Ultralytics HUB gibi araçlarla sorunsuz entegrasyonu potansiyel olarak engelleyebilir.

YOLOX hakkında daha fazla bilgi edinin

Performans ve Kıyaslamalar: YOLOv7 - YOLOX

İkisini karşılaştırırken, YOLOv7 genellikle daha büyük modelleri için daha yüksek doğruluk (mAP) elde ederek, piyasaya sürüldüğü sırada gerçek zamanlı dedektörler için son teknolojiyi zorlamaktadır. Öte yandan YOLOX, çok küçük YOLOX-Nano'dan büyük YOLOX-X'e kadar daha geniş bir ölçeklenebilir model yelpazesi sunar. YOLOX'un ankrajsız tasarımı, basitlik ve genelleme açısından avantajlar sunabilirken, YOLOv7'nin "bedava hediyeler" yaklaşımı, çıkarım yükü eklemeden doğruluğu en üst düzeye çıkarır.

Model boyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9

Sonuç ve Öneri

Hem YOLOv7 hem de YOLOX, alana önemli katkılarda bulunmuş güçlü nesne algılama modelleridir. YOLOv7, gerçek zamanlı hızlarda mümkün olan en yüksek doğruluğu elde etmenin birincil hedef olduğu uygulamalar için mükemmel bir seçimdir. YOLOX, genelleme konusunda mükemmel olan ve çeşitli hesaplama bütçelerine uygun, son derece ölçeklenebilir bir model ailesi sağlayan zorlayıcı bir ankraj içermeyen alternatif sunar.

Ancak, en modern, çok yönlü ve kullanıcı dostu çerçeveyi arayan geliştiriciler ve araştırmacılar için, YOLOv8 ve Ultralytics YOLO11 gibi daha yeni Ultralytics YOLO modelleri genellikle daha cazip bir seçim sunar. Bu modeller çeşitli temel avantajlar sunar:

  • Kullanım Kolaylığı: Basit bir Python API, kapsamlı belgeler ve anlaşılır CLI komutları ile kolaylaştırılmış bir kullanıcı deneyimi.
  • İyi Yönetilen Ekosistem: Aktif geliştirme, güçlü bir açık kaynak topluluğu, sık güncellemeler ve uçtan uca MLOps için Ultralytics HUB gibi araçlarla sorunsuz entegrasyon.
  • Çok Yönlülük: segmentasyon, sınıflandırma, poz tahmini ve yönlendirilmiş nesne algılama (OBB) dahil olmak üzere, nesne algılama ötesindeki birden fazla görme görevini destekler.
  • Performans Dengesi: Uç cihazlardan bulut sunucularına kadar çeşitli gerçek dünya senaryoları için uygun olan hız ve doğruluk arasında mükemmel bir denge.
  • Eğitim Verimliliği: Verimli eğitim süreçleri, kolayca erişilebilen önceden eğitilmiş ağırlıklar ve daha hızlı yakınsama süreleri.

Diğer Modelleri İnceleyin

Daha fazla inceleme için, YOLOv7, YOLOX ve diğer ilgili modelleri içeren bu karşılaştırmaları göz önünde bulundurun:



📅 1 yıl önce oluşturuldu ✏️ 1 ay önce güncellendi

Yorumlar