YOLOv9 - YOLOX karşılaştırması: Teknik Bir Karşılaştırma
Optimal nesne algılama modelini seçmek, bilgisayar görüşü projelerinde istenen sonuçlara ulaşmak için çok önemlidir. Modeller mimari, performans ve kaynak gereksinimleri açısından önemli ölçüde farklılık gösterir. Bu sayfa, ihtiyaçlarınıza en uygun olanı seçmenize yardımcı olmak için temel özelliklerini analiz ederek YOLOv9 ve YOLOX arasında ayrıntılı bir teknik karşılaştırma sunmaktadır.
YOLOv9: Gerçek Zamanlı Nesne Algılamayı Geliştirme
Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
Kuruluş: Institute of Information Science, Academia Sinica, Tayvan
Tarih: 2024-02-21
Arxiv: arXiv:2402.13616
GitHub: github.com/WongKinYiu/yolov9
Belgeler: docs.ultralytics.com/models/yolov9/
Ultralytics YOLOv9, Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) gibi yenilikçi teknikler sunarak nesne tespitinde önemli bir sıçramayı temsil ediyor. Chien-Yao Wang ve Hong-Yuan Mark Liao tarafından geliştirilen YOLOv9, derin sinir ağlarındaki bilgi kaybını ele alarak hem doğruluğu hem de verimliliği artırıyor. Ultralytics ekosistemine entegre edilen YOLOv9, kolaylaştırılmış bir kullanıcı deneyimi, kapsamlı belgeler ve güçlü topluluk desteğinden yararlanır.
YOLOv9 hakkında daha fazla bilgi edinin
Mimari ve Temel Özellikler
YOLOv9'un mimarisi, PGI kullanarak derin katmanlar aracılığıyla önemli bilgi akışını korumak için tasarlanmıştır. Bu, derin ağlarda yaygın olan bilgi darboğazı sorununu hafifletmeye yardımcı olur. GELAN, CSPNet ve ELAN'dan gelen kavramlar üzerine inşa ederek daha iyi parametre kullanımı ve hesaplama verimliliği için ağ yapısını optimize eder. Bu, olağanüstü verimlilikle son teknoloji performansıyla sonuçlanır. Ultralytics uygulaması, kolayca erişilebilen önceden eğitilmiş ağırlıklardan yararlanarak basit bir python API ve verimli eğitim süreçleri ile kullanım kolaylığı sağlar.
Güçlü Yönler
- Son Teknoloji Doğruluğu: COCO gibi kıyaslamalarda önde gelen mAP skorlarına ulaşır ve genellikle benzer boyutlardaki diğer modellerden daha iyi performans gösterir.
- Yüksek Verimlilik: Birçok alternatife kıyasla daha az parametre ve FLOP ile yüksek doğruluk sağlar, bu da onu edge AI dağıtımı için uygun hale getirir.
- Bilgi Koruma: PGI, bilgi kaybını etkili bir şekilde azaltarak modelin öğrenme kapasitesini ve nihai performansını artırır.
- Ultralytics Ekosistemi: Aktif geliştirme, kapsamlı kaynaklar, MLOps için Ultralytics HUB entegrasyonu ve eğitim sırasında daha düşük bellek gereksinimlerinden yararlanır.
- Çok Yönlülük: Orijinal makale algılama üzerine odaklansa da, mimari örnek segmentasyonu gibi görevler için potansiyel gösterir ve YOLOv8 gibi modellerin çoklu görev yetenekleriyle uyumludur.
Zayıflıklar
- Daha yeni bir model olduğu için, topluluk tarafından yönlendirilen dağıtım örneklerinin yelpazesi, uzun süredir yerleşmiş modellere kıyasla hala büyüyor olabilir. Ancak, Ultralytics çerçevesi içindeki entegrasyonu, benimsenmeyi önemli ölçüde hızlandırır ve sağlam bir destek sistemi sağlar.
YOLOX: Yüksek Performanslı Ankrajsız Dedektör
Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
Kuruluş: Megvii
Tarih: 2021-07-18
Arşiv: https://arxiv.org/abs/2107.08430
GitHub: https://github.com/Megvii-BaseDetection/YOLOX
Belgeler: https://yolox.readthedocs.io/en/latest/
Megvii tarafından geliştirilen YOLOX, basitlik ve yüksek performansı hedefleyen bir anchor-free (bağlantısız) nesne algılama modelidir. YOLOX, bağlantı kutusu mekanizmasını kaldırarak eğitim hattını basitleştirir ve genellemeyi iyileştirebilecek tasarım parametrelerinin sayısını azaltır.
YOLOX hakkında daha fazla bilgi edinin
Mimari ve Temel Özellikler
YOLOX, çeşitli temel mimari seçimlerle kendini farklı kılar. En önemlisi, nesne algılamayı piksel başına tahmin problemi olarak ele alan bağlantısız tasarımıdır. Diğer temel özellikler arasında sınıflandırma ve yerelleştirme görevlerini ayıran bir ayrık başlık, SimOTA adlı gelişmiş bir etiket atama stratejisi ve MixUp ve Mosaic gibi güçlü veri artırma tekniklerinin kullanımı yer alır.
Güçlü Yönler
- Anchor-Free Tasarım: Bağlantı kutusu ayarlama ihtiyacını ortadan kaldırarak model mimarisini ve eğitim sürecini basitleştirir.
- Yüksek Performans: Ortalama Hassasiyet (mAP) ve çıkarım hızı arasında kendi zamanı için rekabetçi bir denge sağlar.
- Ölçeklenebilirlik: YOLOX-Nano'dan YOLOX-X'e kadar çeşitli işlem kaynaklarında dağıtıma olanak tanıyan bir dizi model boyutu sunar.
Zayıflıklar
- Yeni Modeller Tarafından Geride Bırakıldı: Yenilikçi olmasına rağmen, YOLOX hem doğruluk hem de verimlilik açısından YOLOv9 gibi daha yeni modeller tarafından geride bırakılmıştır.
- Parçalı Ekosistem: Açık kaynaklı olmasına rağmen, MLOps için Ultralytics HUB ile sorunsuz entegrasyon gibi Ultralytics tarafından sağlanan entegre ekosistem ve kolaylaştırılmış araçlardan yoksundur.
- Daha Yüksek Hesaplama Maliyeti: Belirli bir doğruluk seviyesi için, daha büyük YOLOX modelleri, karşılaştırılabilir YOLOv9 modellerine göre daha fazla parametreye ve FLOP'a sahip olma eğilimindedir.
Performans Karşılaştırması: YOLOv9 - YOLOX
COCO veri kümesi üzerindeki performansı karşılaştırırken, YOLOv9 hem doğruluk hem de verimlilik açısından açık bir avantaj göstermektedir. Aşağıdaki tablo, YOLOv9 modellerinin, YOLOX muadillerine göre daha az parametre ve FLOP ile sürekli olarak daha yüksek mAP puanları elde ettiğini göstermektedir. Örneğin, YOLOv9-C, 25,3M parametre ile %53,0 mAP elde ederek, YOLOX-L'yi (54,2M parametre ile %49,7 mAP) ve YOLOX-X'i (99,1M parametre ile %51,1 mAP) geride bırakırken önemli ölçüde daha verimlidir. En büyük model olan YOLOv9-E, doğruluk sınırını %55,6 mAP'ye taşıyor; bu, YOLOX'un ulaşamadığı bir seviyedir. Hesaplama başına bu üstün performans, YOLOv9'u modern uygulamalar için daha güçlü ve kaynak dostu bir seçim haline getirmektedir.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
İdeal Kullanım Senaryoları
YOLOv9
YOLOv9'un üstün doğruluğu ve verimliliği, performanın kritik olduğu zorlu uygulamalar için ideal seçimdir. Aşağıdaki gibi senaryolarda mükemmeldir:
- Gelişmiş Sürücü Destek Sistemleri (ADAS): Otonom sürüş için araçları, yayaları ve yol işaretlerini yüksek hassasiyetle algılama.
- Yüksek Kaliteli Güvenlik: Güvenlik sistemlerinde karmaşık sahnelerin düşük yanlış pozitif oranlarıyla izlenmesi.
- Endüstriyel Otomasyon: Küçük kusurları belirleyerek üretimde ayrıntılı kalite kontrolü gerçekleştirme.
- Tıbbi Görüntüleme: Doğru anomali nesne tespiti sağlayarak tıbbi taramaların analizine yardımcı olma.
YOLOX
YOLOX, özellikle anchor içermeyen tasarımının belirli veri kümeleri için faydalar sağlayabileceği durumlarda, doğruluk ve hızın dengeli bir şekilde sağlanmasını gerektiren uygulamalar için çok uygundur. İdeal kullanım durumları şunlardır:
- Gerçek Zamanlı İzleme: Gerçek zamanlı nesne izlemenin gerekli olduğu robotik ve gözetim sistemlerindeki uygulamalar.
- Akademik Araştırma: Modüler ve bağlantısız tasarımı, onu nesne algılama mimarilerinde araştırma ve deneyler için ilginç bir model haline getirir.
- Uç Nokta Dağıtımları: Daha küçük YOLOX-Nano ve YOLOX-Tiny varyantları, kaynak kısıtlı cihazlarda dağıtılabilir, ancak YOLOv9 gibi daha yeni modeller genellikle aynı kaynak maliyeti için daha iyi performans sağlar.
Sonuç ve Öneri
Hem YOLOv9 hem de YOLOX, nesne tespiti alanına önemli katkılarda bulunmuştur. YOLOX, ankrajsız tasarımı ve ayrık başlığı ile sınırları zorlayarak gerçek zamanlı tespit için güçlü bir temel sunmuştur. Ancak YOLOv9, hem doğruluk hem de verimlilik için yeni bir standart belirlemiştir. Yenilikçi PGI ve GELAN mimarileri, daha az işlem kaynağıyla üstün performans elde etmesini sağlar.
En iyi performansı, verimliliği ve kullanım kolaylığını arayan geliştiriciler ve araştırmacılar için YOLOv9 açık bir seçimdir. Ultralytics ekosistemine entegrasyonu benzersiz avantajlar sağlar:
- Kullanım Kolaylığı: Kolaylaştırılmış bir Python API'si, kapsamlı dokümantasyon ve basit CLI kullanımı geliştirmeyi basitleştirir.
- İyi Yönetilen Ekosistem: Aktif geliştirme, güçlü topluluk desteği, sık güncellemeler ve sorunsuz MLOps için Ultralytics HUB ile entegrasyon.
- Performans Dengesi: Hız ve doğruluk arasında mükemmel bir denge sağlayarak uç cihazlardan buluta kadar çeşitli gerçek dünya senaryoları için uygun hale getirir.
- Eğitim Verimliliği: Daha hızlı eğitim süreleri, kolayca erişilebilen önceden eğitilmiş ağırlıklar ve verimli kaynak kullanımı.
Diğer Modelleri İnceleyin
Bu sayfa YOLOv9 ve YOLOX'a odaklanırken, bilgisayarla görme alanı çok geniştir. Sizi Ultralytics ekosistemi içinde bulunan diğer son teknoloji modelleri keşfetmeye teşvik ediyoruz. En son Ultralytics modelleri hakkında bilgi edinmek için YOLOv9 - YOLOv8 karşılaştırmalarımıza veya teknolojinin yerleşik bir endüstri standardından ne kadar ilerlediğini görmek için YOLOv9 - YOLOv5 karşılaştırmalarımıza göz atmayı düşünebilirsiniz. Dönüştürücü tabanlı mimarilerle ilgilenenler için RT-DETR - YOLOv9 karşılaştırmamız ayrıntılı bir analiz sunar.