Model Karşılaştırması: Nesne Algılama için YOLOv8 - YOLOv9
Doğru nesne algılama modelini seçmek, doğruluk, hız ve hesaplama kaynaklarını dengelemek için çok önemlidir. Bu sayfa, YOLO serisindeki son teknoloji ürünü iki model olan Ultralytics YOLOv8 ve YOLOv9 arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. İhtiyaçlarınıza en uygun olanı belirlemenize yardımcı olmak için mimarilerini, performanslarını ve kullanım durumlarını analiz edeceğiz ve YOLOv8'in çok yönlülüğünün ve olgun ekosisteminin onu çoğu uygulama için neden tercih edilen bir seçim haline getirdiğini vurgulayacağız.
Ultralytics YOLOv8: Modern ve Çok Yönlü
Ultralytics YOLOv8, Glenn Jocher, Ayush Chaurasia ve Jing Qiu tarafından Ultralytics'te geliştirilen ve 10 Ocak 2023'te yayınlanan oldukça başarılı bir modeldir. Hız ve doğruluk arasındaki mükemmel dengesiyle ünlüdür, kullanıcı dostu ve son derece çok yönlü olacak şekilde tasarlanmıştır. YOLOv8'in temel bir avantajı, nesne algılama ötesinde örnek segmentasyonu, poz tahmini, görüntü sınıflandırması ve yönlendirilmiş sınırlayıcı kutular (OBB) dahil olmak üzere çok çeşitli görme görevleri için tek, birleşik bir çerçeve içinde destek sağlamasıdır.
Yazarlar: Glenn Jocher, Ayush Chaurasia ve Jing Qiu
Kuruluş: Ultralytics
Tarih: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Belgeler: https://docs.ultralytics.com/models/yolov8/
YOLOv8 hakkında daha fazla bilgi edinin
Mimari ve Temel Özellikler
YOLOv8, önceki YOLO sürümlerini, anchor'suz bir algılama başlığı ve C2f modülüne sahip değiştirilmiş bir CSPDarknet backbone gibi önemli mimari iyileştirmelerle temel alır. Bu tasarım seçimi, esnekliği ve verimliliği artırır. Ancak, en büyük güçlü yönleri kullanılabilirliğinde ve içinde bulunduğu sağlam ekosistemde yatmaktadır.
- Kullanım Kolaylığı: YOLOv8, kapsamlı belgelerle desteklenen basit bir Python API'si ve CLI aracılığıyla kolaylaştırılmış bir kullanıcı deneyimi sunar. Bu, hem yeni başlayanlar hem de uzmanlar için erişilebilir olmasını sağlar.
- İyi Yönetilen Ekosistem: Sürekli geliştirme, güçlü bir açık kaynak topluluğu, sık güncellemeler ve kodsuz eğitim ve MLOps iş akışları için Ultralytics HUB ile derin entegrasyondan yararlanır.
- Performans Dengesi: Model ailesi, kenar cihazlardan bulut sunucularına kadar çeşitli gerçek dünya dağıtım senaryoları için uygun olmasını sağlayan hız ve doğruluk arasında güçlü bir denge sağlar.
- Bellek Verimliliği: Genellikle transformatörler gibi daha büyük mimarilere kıyasla eğitim ve çıkarım için daha az CUDA belleği gerektirir ve bu da daha geniş bir donanım yelpazesinde geliştirme olanağı sağlar.
- Çok Yönlülük: Bu, öne çıkan bir özelliktir. YOLOv8, tek bir çerçeve içinde birden fazla görüntü işleme görevini (algılama, segmentasyon, sınıflandırma, poz, OBB) ele alma konusunda üstündür; bu yetenek, YOLOv9 gibi daha özel modellerde genellikle eksiktir.
- Eğitim Verimliliği: Hızlı geliştirme döngüleri için verimli eğitim süreçleri ve COCO gibi veri kümelerinde kolayca erişilebilen önceden eğitilmiş ağırlıklar sunar.
Güçlü ve Zayıf Yönler
Güçlü Yönler:
- Çok Yönlü Görev Desteği: Tek bir model mimarisi, algılama, segmentasyon, poz ve daha fazlası için eğitilebilir, bu da karmaşık proje gereksinimlerini basitleştirir.
- Kullanıcı Dostu: Kapsamlı dokümantasyon ve basit bir API, gelişmiş bilgisayar görüşü çözümleri geliştirme önündeki engelleri azaltır.
- Güçlü Topluluk ve Ekosistem: Optimize edilmiş dağıtım için TensorRT ve OpenVINO gibi kapsamlı kaynaklar ve entegrasyonlarla aktif olarak sürdürülmektedir.
Zayıflıklar:
- En Yüksek Doğruluk: Oldukça doğru olmakla birlikte, en büyük YOLOv9 modelleri, saf nesne algılama için COCO kıyaslamalarında biraz daha yüksek mAP puanları elde edebilir.
- Yoğun Kaynak Kullanımı (Büyük Modeller): Daha büyük YOLOv8 modelleri (L, X), önemli miktarda işlem kaynağı gerektirir, ancak performans sınıfları için verimli kalırlar.
YOLOv9: Yeni Tekniklerle Doğruluğu Geliştirme
YOLOv9, 21 Şubat 2024'te Tayvan, Academia Sinica, Bilgi Bilimi Enstitüsü'nden Chien-Yao Wang ve Hong-Yuan Mark Liao tarafından tanıtıldı. Derin sinir ağlarındaki bilgi kaybını ele alarak gerçek zamanlı nesne algılamada doğruluk sınırlarını zorlamayı amaçlayan önemli mimari yenilikler sunuyor.
Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
Kuruluş: Institute of Information Science, Academia Sinica, Tayvan
Tarih: 2024-02-21
Arxiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9
Belgeler: https://docs.ultralytics.com/models/yolov9/
YOLOv9 hakkında daha fazla bilgi edinin
Mimari ve Temel Yenilikler
YOLOv9'un temel katkıları Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN)'dır.
- Programlanabilir Gradyan Bilgisi (PGI): Bu kavram, önemli verilerin derin ağ katmanlarından geçerken kaybolduğu bilgi darboğazı sorununu azaltmak için tasarlanmıştır. PGI, doğru model güncellemeleri için temel bilgileri korumak üzere güvenilir gradyanlar oluşturmaya yardımcı olur.
- Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN): GELAN, parametre kullanımını ve hesaplama verimliliğini optimize eden yeni bir mimaridir. YOLOv9'un bazı önceki modellere kıyasla daha az parametreyle daha yüksek doğruluk elde etmesini sağlar.
Güçlü ve Zayıf Yönler
Güçlü Yönler:
- Enhanced Accuracy: Gerçek zamanlı nesne dedektörleri için COCO veri kümesinde birçok diğer modeli mAP'de geride bırakarak yeniState-of-the-art sonuçlar belirler.
- Gelişmiş Verimlilik: GELAN mimarisi, parametre başına güçlü bir performans oranı sağlar.
Zayıflıklar:
- Sınırlı Çok Yönlülük: YOLOv9 öncelikli olarak nesne algılama üzerine odaklanmıştır. YOLOv8'i kapsamlı AI projeleri için daha esnek ve pratik bir çözüm haline getiren segmentasyon, poz tahmini ve sınıflandırma için yerleşik, çoklu görev desteğine sahip değildir.
- Eğitim Kaynakları: Belgelerinde belirtildiği gibi, YOLOv9 modellerini eğitmek, Ultralytics modellerine kıyasla daha fazla kaynak yoğun ve zaman alıcı olabilir.
- Daha Yeni Mimari: Farklı bir araştırma grubunun daha yeni bir modeli olduğundan, ekosistemi, topluluk desteği ve üçüncü taraf entegrasyonları, köklü Ultralytics YOLOv8'e göre daha az olgundur. Bu, daha dik bir öğrenme eğrisine ve daha az hazır dağıtım çözümüne yol açabilir.
Performans ve Kıyaslamalar: YOLOv8 - YOLOv9
Performansı karşılaştırırken, her iki modelin de oldukça yetenekli olduğu açıktır. YOLOv9, en büyük varyantı olan YOLOv9e ile en yüksek mAP'yi elde ederek saf algılama doğruluğu konusunda çıtayı yükseltiyor. Ancak, Ultralytics YOLOv8 daha çekici bir genel paket sunuyor. Modelleri, hem CPU hem de GPU'da iyi belgelenmiş çıkarım hızlarıyla mükemmel bir hız ve doğruluk dengesi sunar; bu da gerçek dünya dağıtım kararları için kritik öneme sahiptir.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Tablo, YOLOv9 modelleri parametre açısından verimli olsa da, YOLOv8'in çeşitli donanım ortamlarına hazır olduğunu gösteren önemli CPU kıyaslamaları da dahil olmak üzere daha eksiksiz bir performans tablosu sunduğunu göstermektedir.
İdeal Kullanım Senaryoları
YOLOv8 ve YOLOv9 arasındaki seçim büyük ölçüde proje önceliklerine bağlıdır.
YOLOv8, aşağıdakiler için ideal seçimdir:
- Çoklu Görev Uygulamaları: Robotik, sağlık hizmetleri veya gelişmiş güvenlik sistemleri gibi algılama, segmentasyon ve poz tahmininin bir kombinasyonunu gerektiren projeler.
- Hızlı Geliştirme ve Dağıtım: Prototipten üretime hızla geçmesi gereken geliştiriciler, YOLOv8'in kullanım kolaylığı, kapsamlı belgeleri ve entegre ekosisteminden büyük fayda sağlayacaktır.
- Dengeli Performans İhtiyaçları: Perakende veya üretimdeki gerçek zamanlı video analizleri gibi, hız ve doğruluk arasında güçlü bir dengenin mutlak en yüksek mAP puanına ulaşmaktan daha önemli olduğu uygulamalar.
YOLOv9 en çok şu alanlar için uygundur:
- Araştırma ve Özel Yüksek Doğruluklu Algılama: Birincil amacın COCO gibi kıyaslama testlerinde nesne algılama doğruluğunu en üst düzeye çıkarmak olduğu senaryolar.
- Yüksek Hassasiyetli Endüstriyel Denetim: Mümkün olan en yüksek doğrulukla en küçük kusurları tespit etmenin temel endişe olduğu uygulamalar.
- Gelişmiş Video Analitiği: Üst düzey algılama gerektiren ve sistemin özel bağımlılıklarını karşılayabildiği akıllı şehir altyapısında kullanılır.
Sonuç: Hangi Modeli Seçmelisiniz?
Geliştiricilerin ve uygulamaların büyük çoğunluğu için Ultralytics YOLOv8 üstün seçimdir. Eşsiz çok yönlülüğü, kullanım kolaylığı ve olgun, iyi yönetilen ekosistemi, YOLOv9'a göre önemli bir avantaj sağlar. Tek bir çerçeve içinde birden çok görevi işleme yeteneği, yalnızca geliştirmeyi basitleştirmekle kalmaz, aynı zamanda üretimdeki karmaşıklığı ve maliyeti de azaltır. YOLOv9, nesne algılamada etkileyici doğruluk kazanımları sunarken, dar odak noktası ve daha az gelişmiş ekosistemi onu daha özel bir araç haline getiriyor.
YOLOv8, geliştiricilerin sağlam, çok yönlü yapay zeka sistemlerini verimli bir şekilde oluşturmalarını sağlayan bütünsel bir çözümü temsil eder. Güvenilir, yüksek performanslı ve esnek bir model arayanlar için YOLOv8 açık bir kazanan. Daha köklü bir model arıyorsanız, YOLOv5'i veya Ultralytics'in en son teknoloji ürünü için YOLO11'i inceleyin.