Model Karşılaştırması: YOLOv9 - YOLOv8 Nesne Algılama için
Doğru nesne algılama modelini seçmek, doğruluk, hız ve hesaplama kaynaklarını dengeleyen kritik bir karardır. Bu sayfa, çok yönlü ve kullanıcı dostu bir model olan Ultralytics YOLOv8 ile yeni mimari gelişmeleriyle bilinen bir model olan YOLOv9 arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Bilgisayarla görü projeleriniz için en uygun olanı belirlemenize yardımcı olmak için mimarilerini, performans metriklerini ve ideal kullanım durumlarını analiz edeceğiz.
YOLOv9: Yeni Mimari ile Doğruluğu Geliştirme
YOLOv9, öncelikle derin sinir ağlarındaki bilgi kaybının üstesinden gelerek doğruluğu artırmaya odaklanan, nesne algılamada önemli bir adım olarak tanıtıldı.
- Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
- Tarih: 2024-02-21
- Arşiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
- Belgeler: https://docs.ultralytics.com/models/yolov9/
Mimari ve Temel Yenilikler
YOLOv9, iki önemli yenilik sunar: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN). PGI, kayıp fonksiyonu hesaplaması için eksiksiz girdi bilgisi sağlamak üzere tasarlanmıştır; bu, bilgi darboğazı sorununu azaltmaya yardımcı olur ve ağ güncellemeleri için daha güvenilir gradyanlar oluşturulmasını sağlar. GELAN, parametre kullanımını ve hesaplama verimliliğini optimize eden yeni, yüksek verimli bir ağ mimarisidir. Birlikte, bu özellikler YOLOv9'un COCO gibi veri kümelerinde genellikle yeni son teknoloji kıstaslar belirleyerek yüksek doğruluk elde etmesini sağlar.
Güçlü Yönler
- Son Teknoloji Doğruluk: YOLOv9 modelleri, özellikle daha büyük varyantlar, gerçek zamanlı nesne algılama doğruluğunun sınırlarını zorlayarak en üst düzey mAP skorlarına ulaşır.
- Yüksek Verimlilik: GELAN mimarisi, YOLOv9'un benzer doğruluğa sahip diğer bazı modellere kıyasla daha az parametre ve hesaplama gereksinimi (FLOPs) ile yüksek performans sunmasını sağlar.
- Bilgi Koruma: PGI, çok derin ve doğru modellerin eğitimi için çok önemli olan derin ağlardaki bilgi kaybı sorununu etkili bir şekilde ele alır.
Zayıflıklar
- Ekosistem ve Kullanılabilirlik: Bir araştırma deposundan bir model olarak YOLOv9, Ultralytics'in sağladığı kusursuz, üretime hazır ekosistemden yoksundur. Eğitim süreci daha karmaşık olabilir ve topluluk desteği ve üçüncü taraf entegrasyonları daha az olgundur.
- Görev Çok Yönlülüğü: Orijinal YOLOv9 uygulaması öncelikle nesne algılama üzerine odaklanmıştır. Ultralytics modellerinde standart olan segmentasyon, poz tahmini veya sınıflandırma gibi diğer görme görevleri için yerleşik, birleşik desteği sunmaz.
- Eğitim Kaynakları: YOLOv9'u eğitmek, Ultralytics YOLOv8 tarafından sunulan aerodinamik süreçlere kıyasla daha kaynak yoğun ve zaman alıcı olabilir.
YOLOv9 hakkında daha fazla bilgi edinin
Ultralytics YOLOv8: Çok Yönlülük ve Kullanım Kolaylığı
Ultralytics YOLOv8, hızı, doğruluğu ve en önemlisi kullanım kolaylığı ve çok yönlülüğü arasındaki olağanüstü dengeyle tanınan, Ultralytics tarafından geliştirilen son teknoloji bir modeldir. Çok çeşitli vizyon yapay zeka görevleri için modelleri eğitmek, doğrulamak ve dağıtmak için eksiksiz bir çerçeve olarak tasarlanmıştır.
- Yazarlar: Glenn Jocher, Ayush Chaurasia, Jing Qiu
- Kuruluş: Ultralytics
- Tarih: 2023-01-10
- GitHub: https://github.com/ultralytics/ultralytics
- Belgeler: https://docs.ultralytics.com/models/yolov8/
Mimari ve Temel Özellikler
YOLOv8, yeni bir anchor-free tespit başlığı ve modifiye edilmiş bir C2f (2 evrişimli CSP) backbone dahil olmak üzere önemli mimari iyileştirmelerle önceki YOLO sürümlerinin başarıları üzerine inşa edilmiştir. Bu tasarım yalnızca performansı artırmakla kalmaz, aynı zamanda modeli ve işlem sonrası adımlarını da basitleştirir. Ancak, YOLOv8'in gerçek gücü bütünsel ekosisteminde yatmaktadır.
Güçlü Yönler
- Olağanüstü Performans Dengesi: YOLOv8, hız ve doğruluk arasında harika bir denge sunarak kaynak kısıtlı uç cihazlardan yüksek performanslı bulut sunucularına kadar çok çeşitli gerçek dünya uygulamaları için oldukça uygun hale getirir.
- Rakipsiz Çok Yönlülük: YOLOv8, gerçek bir çoklu görev çerçevesidir. Tek ve birleşik bir çerçevede nesne algılama, örnek segmentasyonu, görüntü sınıflandırması, poz tahmini ve yönlendirilmiş sınırlayıcı kutuları (OBB) destekler. Bu çok yönlülük, YOLOv9 gibi daha özel modellere göre önemli bir avantajdır.
- Kullanım Kolaylığı: Ultralytics, kolaylaştırılmış bir kullanıcı deneyimine öncelik vermiştir. Basit bir Python API'si ve CLI'ı, kapsamlı belgelendirme ve çok sayıda eğitim ile geliştiriciler dakikalar içinde başlayabilir.
- İyi Yönetilen Ekosistem: YOLOv8, Ultralytics tarafından aktif olarak geliştirilmekte, güçlü bir açık kaynak topluluğu tarafından desteklenmekte, sık sık güncellenmekte ve kodsuz eğitim ve MLOps iş akışları için Ultralytics HUB ile sorunsuz bir şekilde entegre olmaktadır.
- Eğitim Verimliliği: Eğitim süreci, özellikle transformatör tabanlı modeller olmak üzere, birçok diğer mimariye kıyasla kolayca erişilebilen önceden eğitilmiş ağırlıklar ve daha düşük bellek gereksinimleri ile oldukça verimlidir.
- Dağıtıma Hazır: YOLOv8, ONNX, TensorRT ve OpenVINO gibi çeşitli formatlar için yerleşik dışa aktarma desteği ile kolay dağıtım için tasarlanmıştır ve üretime giden yolu basitleştirir.
Zayıflıklar
- En Yüksek Doğruluk: Son derece doğru olmakla birlikte, en büyük YOLOv9 modelleri, saf bir nesne algılama görevinde COCO kıyaslamasında biraz daha yüksek bir mAP elde edebilir. Ancak, bu genellikle çok yönlülük ve kullanım kolaylığı pahasına gelir.
YOLOv8 hakkında daha fazla bilgi edinin
Performans Kafa Kafaya: Doğruluk ve Hız
Performansı karşılaştırırken, doğruluk (mAP), çıkarım hızı, model boyutu (parametreler) ve hesaplama maliyeti (FLOP'lar) dahil olmak üzere tüm tabloya bakmak önemlidir.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
Tablodan, YOLOv9-E'nin en yüksek mAP'ye ulaştığını görebiliriz. Ancak, YOLOv8 modelleri, özellikle gerçek zamanlı uygulamalar için çok önemli olan YOLOv8n gibi daha küçük varyantlar olmak üzere üstün çıkarım hızları gösterir. YOLOv8, üretim planlaması için gerekli olan iyi belgelenmiş hız kıyaslamaları ile farklı donanımlar arasında daha eksiksiz ve pratik bir performans profili sunar.
Sonuç: Hangi Modeli Seçmelisiniz?
YOLOv9 ve YOLOv8 arasındaki seçim büyük ölçüde projenizin önceliklerine bağlıdır.
Şu durumlarda YOLOv9'u seçin:
- Birincil ve tek hedefiniz, COCO gibi kıyaslama testlerinde mutlak maksimum nesne algılama doğruluğuna ulaşmaktır.
- PGI ve GELAN gibi yeni mimarileri keşfetmenin temel amaç olduğu bir araştırma bağlamında çalışıyorsunuz.
- Daha karmaşık bir eğitim ve dağıtım iş akışını yönetmek için önemli miktarda hesaplama kaynağına ve uzmanlığa sahipsiniz.
Aşağıdaki durumlarda Ultralytics YOLOv8'i seçin:
- Çok çeşitli uygulamalar için sağlam, güvenilir ve kullanımı kolay bir modele ihtiyacınız var.
- Projeniz, örnek segmentasyonu, poz tahmini veya sınıflandırma gibi nesne algılamadan daha fazlasını gerektiriyor. YOLOv8'in çok yönlülüğü, muazzam geliştirme süresinden tasarruf sağlar.
- Eğitimden dağıtıma kadar hızlı ve verimli bir iş akışına öncelik veriyorsunuz. Ultralytics ekosistemi, sizi daha hızlı üretime geçirmek için tasarlanmıştır.
- Hem uç hem de bulut dağıtımı için uygun, hız ve doğruluğun mükemmel bir dengesini sunan bir modele ihtiyacınız var.
- Güçlü topluluk desteğine, sürekli güncellemelere ve kapsamlı belgelere değer veriyorsunuz.
Geliştiricilerin, araştırmacıların ve işletmelerin büyük çoğunluğu için Ultralytics YOLOv8 önerilen seçimdir. Güçlü performansı, inanılmaz çok yönlülüğü ve kullanıcı dostu, iyi desteklenen bir ekosistemin birleşimi, onu gerçek dünya bilgisayarla görme çözümleri oluşturmak için daha pratik ve güçlü bir araç haline getirir.
Diğer modelleri araştırıyorsanız, kararlılığı ve yaygın olarak benimsenmesiyle bilinen Ultralytics YOLOv5 veya alternatif bir transformatör tabanlı mimari olan RT-DETR de ilginizi çekebilir. Model karşılaştırma sayfamızda daha fazla karşılaştırma bulabilirsiniz.