YOLOv9 - DAMO-YOLO Karşılaştırması: Teknik Bir İnceleme
Doğru nesne algılama modelini seçmek, doğruluk, çıkarım hızı ve hesaplama verimliliği ihtiyacını dengeleyen kritik bir karardır. Bu sayfa, iki güçlü model arasında ayrıntılı bir teknik karşılaştırma sunmaktadır: mimari yenilikleriyle bilinen YOLOv9 ve hızıyla tanınan DAMO-YOLO. Bilgisayar görüşü projeleriniz için en iyi modeli seçmenize yardımcı olmak için mimarilerini, performans metriklerini ve ideal kullanım durumlarını keşfedeceğiz.
YOLOv9: Programlanabilir Gradyan Bilgisi ile Gelişmiş Öğrenme
YOLOv9, derin sinir ağlarındaki bilgi kaybının temel zorluklarını ele alan, nesne algılamada önemli bir sıçramayı temsil ediyor. Ultralytics ekosistemine entegrasyonu, onu yalnızca güçlü değil, aynı zamanda olağanüstü derecede erişilebilir kılıyor.
Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
Tarih: 2024-02-21
Arşiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9
Belgeleme: https://docs.ultralytics.com/models/yolov9/
Mimari ve Temel Özellikler
YOLOv9, iki çığır açan konsept sunar: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN). PGI, kayıp fonksiyonu için eksiksiz girdi bilgilerini korumak ve genellikle derin ağların performansını düşüren bilgi darboğazı sorununu azaltmak üzere tasarlanmıştır. GELAN, parametre kullanımını ve hesaplama maliyetini optimize eden yeni, yüksek verimli bir ağ mimarisidir.
Ultralytics çerçevesi içinde uygulandığında, YOLOv9'un gelişmiş mimarisi, geliştiriciler için tasarlanmış bir dizi özellikle birleştirilmiştir:
- Kullanım Kolaylığı: Basit bir Python API ve CLI ile kolaylaştırılmış bir kullanıcı deneyimi, kapsamlı belgelerle desteklenir.
- İyi Yönetilen Ekosistem: Aktif geliştirme, güçlü topluluk desteği, sık güncellemeler ve kodsuz eğitim ve dağıtım için Ultralytics HUB gibi araçlarla entegrasyondan faydalanır.
- Eğitim Verimliliği: Verimli eğitim süreçleri ve kolayca erişilebilen önceden eğitilmiş ağırlıklar sunar ve tipik olarak birçok rakip modelden daha az bellek gerektirir.
- Çok Yönlülük: Orijinal makale nesne algılama üzerine odaklansa da, depo Ultralytics modellerinin çoklu görev doğasıyla uyumlu olarak örnek segmentasyonu ve panoptik segmentasyon yeteneklerini gösteriyor.
Güçlü Yönler
- Son Teknoloji Doğruluğu: COCO veri kümesinde önde gelen mAP skorlarına ulaşır ve genellikle benzer ölçeklerdeki diğer modellerden daha iyi performans gösterir.
- Üstün Parametre Verimliliği: GELAN mimarisi, YOLOv9'un birçok rakibe kıyasla önemli ölçüde daha az parametre ve FLOP ile yüksek doğruluk sunmasını sağlar.
- Bilgi Koruma: PGI, bilgi kaybı sorununu etkili bir şekilde ele alarak daha derin ve daha karmaşık modellerin daha doğru bir şekilde eğitilmesini sağlar.
- Sağlam ve Destekli: Ultralytics ekosistemine entegrasyon, güvenilirliği, sürekli iyileştirmeyi ve zengin kaynaklara erişimi garanti eder.
Zayıflıklar
- Daha Yeni Model: Yakın zamanda yayınlandığı için, topluluk tarafından katkıda bulunulan dağıtım örneklerinin hacmi hala büyüyor olabilir, ancak Ultralytics çerçevesi tarafından benimsenmesi hızla hızlandırılmaktadır.
- Büyük Modeller için Kaynak İhtiyaçları: En büyük varyant olan YOLOv9-E, yüksek doğruluklu olmasına rağmen, eğitim için önemli miktarda işlem kaynağı gerektirir.
YOLOv9 hakkında daha fazla bilgi edinin
DAMO-YOLO: Neural Architecture Search ile Hız ve Doğruluk
DAMO-YOLO, Alibaba Group tarafından geliştirilen hızlı ve doğru bir nesne algılama modelidir. Özellikle GPU donanımında hız ve performans arasında mükemmel bir denge sağlamak için çeşitli modern tekniklerden yararlanır.
Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş: Alibaba Group
Tarih: 2022-11-23
Arşiv: https://arxiv.org/abs/2211.15444
GitHub: https://github.com/tinyvision/DAMO-YOLO
Mimari ve Temel Özellikler
DAMO-YOLO'nun mimarisi, gelişmiş tekniklerin bir kombinasyonunun sonucudur:
- Neural Architecture Search (NAS): Verimli bir backbone ağı (TinyNAS) oluşturmak için NAS kullanır.
- Verimli Katman Tasarımı: Özellik kaynaştırması için verimli bir RepGFPN (Genelleştirilmiş Özellik Piramidi Ağı) kullanır.
- ZeroHead: Basitleştirilmiş, hesaplama açısından hafif bir tespit başlığıdır.
- AlignedOTA: Daha etkili eğitim için geliştirilmiş bir etiket atama stratejisidir.
- Damıtma: Daha küçük modellerin performansını artırmak için bilgi damıtma kullanır.
Güçlü Yönler
- Yüksek Çıkarım Hızı: DAMO-YOLO, GPU'larda hızlı çıkarım için son derece optimize edilmiştir ve bu da onu gerçek zamanlı çıkarım senaryoları için güçlü bir aday haline getirir.
- Yüksek Performans: Özellikle daha küçük varyantları için rekabetçi bir hız-doğruluk dengesi sunar.
- Yenilikçi Teknikler: Performans sınırlarını zorlamak için NAS ve gelişmiş etiket atama gibi modern yöntemleri içerir.
- Anchor-Free: Bir anchor-free dedektör olarak, anchor kutularını ayarlama ihtiyacını ortadan kaldırarak algılama hattını basitleştirir.
Zayıflıklar
- Görev Özelliği: Öncelikle nesne tespiti için tasarlanmıştır ve Ultralytics modellerinde bulunan segmentasyon, poz tahmini veya sınıflandırma gibi diğer görevler için yerleşik çok yönlülükten yoksundur.
- Ekosistem ve Destek: Araştırma odaklı bir proje olduğu için, Ultralytics modellerini karakterize eden kapsamlı ekosistem, kapsamlı belgelendirme ve aktif topluluk desteğinden yoksundur. Bu, entegrasyonu ve sorun gidermeyi daha zor hale getirebilir.
- Daha Yüksek Parametre Sayısı: YOLOv9 ile karşılaştırıldığında, DAMO-YOLO modelleri genellikle benzer veya daha düşük doğruluk seviyelerine ulaşmak için daha fazla parametreye ve FLOP'a sahiptir.
DAMO-YOLO hakkında daha fazla bilgi edinin
Performans Analizi: YOLOv9 - DAMO-YOLO Karşılaştırması
Performansı karşılaştırırken, YOLOv9 hem doğruluk hem de parametre verimliliği açısından belirgin bir avantaj göstermektedir. En büyük model olan YOLOv9-E, COCO üzerinde %55,6 mAP ile yeni bir son teknoloji ölçütü belirlemektedir. Tüm model boyutlarında, YOLOv9, daha yüksek doğruluk elde etmek için DAMO-YOLO muadillerinden sürekli olarak daha az parametre ve çoğu durumda daha az FLOP kullanır.
DAMO-YOLO modelleri NVIDIA T4 GPU'larında çok hızlı çıkarım hızları sergilese de, YOLOv9 özellikle üstün doğruluğu ve verimliliği dikkate alındığında oldukça rekabetçi kalır. Örneğin, YOLOv9-C, önemli ölçüde daha doğru (53.0'a karşı 50.8 mAP) ve çok daha az parametre (25.3M'ye karşı 42.1M) kullanırken DAMO-YOLO-L'den biraz daha hızlıdır.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
İdeal Kullanım Senaryoları
YOLOv9
YOLOv9, doğruluk ve verimliliğin çok önemli olduğu uygulamalar için ideal bir seçimdir. Daha az parametreyle son teknoloji sonuçlar sunma yeteneği, onu aşağıdakiler için mükemmel kılar:
- Yüksek Hassasiyetli Sistemler: Otonom sürüş, tıbbi görüntü analizi ve endüstriyel kalite kontrolündeki uygulamalar.
- Kaynak Kısıtlı Dağıtım: Daha küçük YOLOv9 varyantları, hesaplama kaynaklarının sınırlı olduğu ancak yüksek performansın hala gerekli olduğu uç yapay zeka (edge AI) cihazları için mükemmeldir.
- Çoklu Görev Çözümleri: Segmentasyon veya diğer görüntü işleme görevlerini içerecek şekilde genişleyebilecek projeler, Ultralytics ekosisteminin sağladığı çok yönlü temelden yararlanır.
- Araştırma ve Geliştirme: Yenilikçi mimarisi, derin öğrenme'de yeni ufuklar keşfeden araştırmacılar için güçlü bir temel sağlar.
DAMO-YOLO
DAMO-YOLO, GPU verimini en üst düzeye çıkarmanın birincil hedef olduğu ve uygulamanın kesinlikle nesne algılamaya odaklandığı senaryolarda mükemmeldir.
- Yüksek Verimli Video Analizi: Aynı anda çok sayıda video akışını işleyen bulut tabanlı hizmetler.
- Gerçek Zamanlı GPU Uygulamaları: Bir GPU üzerindeki ham çıkarım hızının en kritik metrik olduğu ve doğruluktaki küçük ödünlerin kabul edilebilir olduğu sistemler.
Sonuç: Neden YOLOv9 Önerilen Seçenek?
DAMO-YOLO etkileyici GPU hızlarına sahip zorlu bir nesne tespit aracı olsa da, Ultralytics YOLOv9, geliştiricilerin ve araştırmacıların büyük çoğunluğu için üstün ve daha pratik bir seçenek olarak ortaya çıkıyor.
YOLOv9 yalnızca daha yüksek doğruluk elde etmekle kalmaz, aynı zamanda bunu daha yüksek parametre verimliliği ile yapar. Bu, daha küçük, hesaplama açısından daha ucuz ve dağıtımı daha kolay olan modellere dönüşür. Ancak, asıl fark yaratan faktör Ultralytics ekosistemidir. YOLOv9'u seçerek, veri açıklama ve eğitimden dağıtım ve izlemeye kadar MLOps yaşam döngüsünün her adımını basitleştiren, iyi yönetilen, tamamen entegre bir platforma erişim kazanırsınız. Üst düzey performans, kullanım kolaylığı, çoklu görev yönlülüğü ve sağlam desteğin birleşimi, YOLOv9'u gelişmiş bilgisayarlı görü uygulamaları oluşturmak için en etkili ve güvenilir çözüm haline getirir.
Diğer Modelleri İnceleyin
DAMO-YOLO'nun diğer son teknoloji modellerle nasıl karşılaştırıldığını merak ediyorsanız, belgelerimizdeki bu diğer karşılaştırmalara göz atın:
- YOLOv8 - DAMO-YOLO
- YOLO11 ve DAMO-YOLO
- RT-DETR - DAMO-YOLO Karşılaştırması
- YOLOX - DAMO-YOLO Karşılaştırması
- YOLOv10 - DAMO-YOLO Karşılaştırması