YOLOv9 vs. YOLOv9: Teknik Bir Karşılaştırma
Bilgisayarla görmenin hızla ilerleyen dünyasında, en uygun nesne algılama modelini seçmek, sistem gecikmesinden algılama doğruluğuna kadar her şeyi etkileyen çok önemli bir karardır. Bu kapsamlı kılavuz, Alibaba Group'un yüksek hızlı dedektörü YOLO ile aşağıdaki ürünler arasında teknik bir karşılaştırma sunmaktadır YOLOv9bilgi koruma ve verimliliğe odaklanan bir mimari. Geliştiricilerin ve araştırmacıların bilinçli seçimler yapmalarına yardımcı olmak için mimari yeniliklerini, performans ölçümlerini ve ideal kullanım durumlarını analiz edeceğiz.
Her iki model de öncekilere göre önemli iyileştirmeler sunuyor, YOLOv9özellikle Ultralytics ekosistemi içinde kullanıldığında, son teknoloji doğruluk, geliştirici dostu araçlar ve çok yönlü dağıtım seçeneklerinin cazip bir karışımını sağlar.
YOLO: Sinirsel Mimari Araması ile Hız Odaklı Tasarım
YOLO , Alibaba tarafından geliştirilen ve "herkes için bir kez" metodolojisiyle tasarlanmış bir nesne algılama çerçevesidir. Düşük gecikme süresi ve yüksek verimliliğe öncelik verir, bu da onu belirli donanımlarda kesin olarak tanımlanmış hız kısıtlamaları gerektiren endüstriyel uygulamalar için güçlü bir rakip haline getirir.
Yazarlar Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Organizasyon:Alibaba Group
Tarih: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444
GitHubYOLO
Mimari Yenilikler
YOLO , otomatikleştirilmiş tasarım süreçleri ve verimli bileşenleri ile öne çıkmaktadır:
- Sinirsel Mimari Arama (NAS): YOLO , omurgaları manuel olarak tasarlamak yerine, farklı hesaplama bütçelerine göre uyarlanmış verimli yapıları (TinyNAS) keşfetmek için Sinirsel Mimari Arama (NAS) kullanır.
- RepGFPN Boyun: RepGFPN olarak adlandırılan Genelleştirilmiş Özellik Piramit Ağı'nın (GFPN) verimli bir varyasyonunu sunar. Bu bileşen özellik füzyonunu optimize eder ve yeniden parametrelendirmeyi destekleyerek daha yüksek çıkarım hızlarına olanak tanır.
- ZeroHead: Model, tipik olarak karmaşık algılama kafalarıyla ilişkili hesaplama ek yükünü azaltan hafif bir "ZeroHead" algılama kafası kullanır.
- AlignedOTA: Eğitim kararlılığını ve doğruluğunu artırmak için, sınıflandırma ve regresyon görevleri arasındaki yanlış hizalama sorunlarını çözen bir etiket atama stratejisi olan AlignedOTA'yı kullanır.
Güçlü Yönler ve Sınırlamalar
YOLO 'nun birincil gücü çıkarım hızında yatmaktadır. Mimari, yüksek GPU verimi için yoğun bir şekilde optimize edilmiştir, bu da onu işlem hacminin kritik olduğu video analiz boru hatları için uygun hale getirir. Ek olarak, damıtma kullanımı daha küçük modellerinin performansını artırır.
Bununla birlikte, YOLO ekosistem olgunluğuyla ilgili zorluklarla karşı karşıyadır. Ultralytics modelleri için mevcut olan sağlam araçlarla karşılaştırıldığında, kullanıcılar dağıtım, format dönüştürme ve topluluk desteği için daha az kaynak bulabilir. Görev çok yönlülüğü de genellikle nesne algılama ile sınırlıdır, oysa modern çerçeveler genellikle segmentasyonu ve poz tahminini yerel olarak destekler.
DAMO-YOLO hakkında daha fazla bilgi edinin
YOLOv9: Maksimum Verimlilik için Programlanabilir Gradyanlar
YOLOv9 , derin sinir ağlarındaki temel bilgi kaybı sorununu ele alarak gerçek zamanlı nesne algılamada bir paradigma değişimini temsil eder. YOLOv9 , kritik verilerin ağ derinliği boyunca korunmasını sağlayarak, olağanüstü parametre verimliliği ile üstün doğruluk elde eder.
Yazarlar Chien-Yao Wang, Hong-Yuan Mark Liao
Organizasyon:Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
Tarih: 2024-02-21
Arxiv:https://arxiv.org/abs/2402.13616
GitHub:https://github.com/WongKinYiu/yolov9
Dokümantasyon:ultralytics
Çekirdek Mimari: PGI ve GELAN
YOLOv9 , kendisini diğerlerinden ayıran iki çığır açıcı teknoloji sunuyor:
- Programlanabilir Gradyan Bilgisi (PGI): Derin ağlar genellikle girdi verilerinin katmanlardan geçerken kaybolduğu bir bilgi darboğazından muzdariptir. PGI, güvenilir gradyanlar üreten yardımcı bir denetim dalı sağlayarak derin katmanların doğru ağırlık güncellemeleri için eksiksiz bilgi almasını sağlar.
- Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN): Bu yeni mimari CSPNet ve ELAN'ın güçlü yönlerini birleştirmektedir. GELAN, hem hafif hem de inanılmaz derecede güçlü bir model sunarak parametre kullanımını en üst düzeye çıkarmak için tasarlanmıştır.
PGI Neden Önemlidir?
Geleneksel derin öğrenme modellerinde, çıktı katmanındaki kayıp fonksiyonu genellikle sığ katmanların güncellemelerini etkili bir şekilde yönlendirmek için yeterli bilgiye sahip değildir. PGI bir köprü görevi görerek girdi bilgilerini korur ve tüm ağın sağlam özellikler öğrenmesini sağlayarak daha iyi yakınsama ve daha yüksek doğruluk sağlar.
Ultralytics Avantajı
Ultralytics ekosistemi içinde YOLOv9 kullanıldığında, geliştiriciler bağımsız uygulamalara göre önemli avantajlar elde ederler:
- Kullanım Kolaylığı: Ultralytics Python API ve CLI , karmaşık eğitim boru hatlarını basit komutlara soyutlar.
- Eğitim Verimliliği: Ultralytics metodolojileri optimum kaynak kullanımı sağlar. YOLOv9 , eğitim sırasında transformatör tabanlı dedektörlere kıyasla tipik olarak daha az CUDA belleği gerektirir ve bu da onu daha geniş bir donanım yelpazesinde erişilebilir hale getirir.
- Çok yönlülük: Temel YOLOv9 makalesi tespit üzerine odaklanırken, Ultralytics çerçevesi bu mimarilerin diğer görevlere genişletilmesini kolaylaştırır ve aşağıdaki gibi formatlara sorunsuz aktarım sağlar ONNX, TensorRTve OpenVINO.
YOLOv9 hakkında daha fazla bilgi edinin
Performans Analizi: Doğruluk ve Verimlilik
Aşağıdaki karşılaştırma YOLO ve YOLOv9 arasındaki değiş tokuşları vurgulamaktadır. YOLO belirli donanımlarda rekabetçi hızlar sunarken, YOLOv9 daha az parametre ile sürekli olarak daha yüksek Ortalama Hassasiyet (mAP) sunarak üstün mimari verimlilik sergilemektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Anahtar Çıkarımlar:
- Parametre Verimliliği: YOLOv9s, DAMO-YOLOs'tan (46.0) daha yüksek bir mAP (46.8) elde ederken parametrelerin yarısından daha azını (7.1M'ye karşı 16.3M) kullanır. Bu, YOLOv9 'u önemli ölçüde daha depolama dostu ve uç yapay zeka cihazları için havadan güncellemeyi daha kolay hale getirir.
- Üst Düzey Doğruluk: En büyük YOLOv9 varyantları (c ve e) doğruluk sınırlarını YOLO'nun sınırlarının çok ötesine taşıyarak 55,6 mAP'ye ulaşır.
- Hız: YOLO , orta modeller için ham TensorRT gecikmesinde hafif bir üstünlük gösterirken, YOLOv9t son derece hızlıdır (2,3 ms), bu da onu gerçek zamanlı mobil uygulamalar için ideal hale getirir.
Eğitim Metodolojileri ve Kullanılabilirlik
Eğitim deneyimi iki model arasında önemli farklılıklar göstermektedir. YOLO'nun NAS'a dayanması, mimariyi türetmek için karmaşık bir arama aşaması veya önceden aranmış omurgaların kullanılması anlamına gelir. "Her şey için bir kez" yaklaşımı, backbone yapısının özelleştirilmesi gerekiyorsa hesaplama açısından pahalı olabilir.
Buna karşılık, Ultralytics tarafından desteklenen YOLOv9, kolaylaştırılmış bir eğitim modu sunar. Kullanıcılar, Open Images V7 gibi özel veri kümelerinde veya minimum yapılandırmayla özel koleksiyonlarda modellere ince ayar yapabilirler. Ultralytics HUB ile entegrasyon, bulut tabanlı eğitim, görselleştirme ve tek tıklamayla dağıtıma olanak tanıyarak NAS veya hiperparametre ayarlama konusunda derin uzmanlık gerektirmeden gelişmiş yapay zekaya erişimi demokratikleştirir.
Kod Örneği: YOLOv9 Eğitimi
Ultralytics Python paketi ile YOLOv9 'u uygulamak kolaydır.
from ultralytics import YOLO
# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")
# Train the model on the COCO8 dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
İdeal Kullanım Senaryoları
YOLO Ne Zaman Seçilmeli
- Büyük Ölçekli Video İşleme: Her milisaniyelik gecikmenin önemli altyapı maliyeti tasarrufu anlamına geldiği belirli sunucu GPU'larında binlerce video akışını işliyorsanız, YOLO'nun yüksek verim için optimizasyonu faydalı olabilir.
- Sabit Donanım Kısıtlamaları: Donanımın bilindiği ve sabit olduğu senaryolar için NAS türevi mimariler, mevcut bilgi işlem bütçesini mükemmel şekilde dolduracak şekilde seçilebilir.
YOLOv9 Ne Zaman Seçilmeli
- Genel Amaçlı Bilgisayarla Görme: Robotik, güvenlik veya perakende analitiği üzerinde çalışan geliştiricilerin çoğu için YOLOv9 en iyi doğruluk ve kullanım kolaylığı dengesini sunar.
- Kenar Dağıtım: Üstün parametre verimliliği (örn. YOLOv9s) sayesinde Raspberry Pi veya NVIDIA Jetson gibi kısıtlı cihazlara daha iyi uyum sağlayarak diğer uygulamalar için daha fazla alan bırakır.
- Araştırma ve Geliştirme: PGI mimarisi, derin öğrenme verimliliğine yönelik daha fazla araştırma için büyüleyici bir temel sağlar.
- Olgun Bir Ekosistem Gerektiriyor: Projeniz güvenilir izleme, CoreML veya TFLite'a kolay aktarım ve aktif topluluk desteği gerektiriyorsa, YOLOv9 'u çevreleyen Ultralytics ekosistemi eşsizdir.
Sonuç
Hem YOLOv9 hem de YOLOv9 nesne algılama alanındaki hızlı yenilikleri sergilemektedir. YOLO , maksimum hız performansını elde etmek için Sinirsel Mimari Aramasının değerini kanıtlamaktadır. Ancak, YOLOv9 çoğu kullanıcı için daha çok yönlü ve güçlü bir çözüm olarak öne çıkıyor.
PGI ile derin denetim bilgi darboğazını çözerek ve GELAN ile katmanları optimize ederek, YOLOv9 olağanüstü verimlilikle son teknoloji doğruluk sunar. Ultralytics ekosistemi ile birleştirildiğinde, konseptten dağıtıma kadar olan yolculuğu hızlandıran sağlam, bakımlı ve kullanıcı dostu bir platform sunar. Son teknoloji görüntü uygulamalarını güvenle oluşturmak isteyen geliştiriciler için Ultralytics YOLO modelleri üstün bir seçim olmaya devam ediyor.
Diğer Modelleri İnceleyin
Ultralytics ailesi içindeki diğer son teknoloji seçenekleri keşfetmek veya daha fazla karşılaştırma yapmakla ilgileniyorsanız, bu kaynakları göz önünde bulundurun:
- Ultralytics YOLO11 - Çok yönlü görüş görevleri için en yeni SOTA modeli.
- YOLOv8 - DAMO-YOLO
- RT-DETR - DAMO-YOLO Karşılaştırması
- YOLOv10 vs. YOLO
- YOLOX - DAMO-YOLO Karşılaştırması