YOLOv9 vs. YOLOv6.0: Detaylı Bir Teknik Karşılaştırma
İdeal nesne algılama mimarisinin seçilmesi, sağlam bilgisayarla görme çözümlerinin geliştirilmesinde çok önemli bir adımdır. Bu karar genellikle doğruluk, çıkarım hızı ve hesaplama kaynağı tüketimi arasında karmaşık bir denge kurmayı gerektirir. Bu kılavuz, aşağıdakiler arasında kapsamlı bir teknik karşılaştırma sağlar YOLOv9mimari verimliliği ile ünlü son teknoloji ürünü bir model ve özellikle endüstriyel dağıtım hızları için optimize edilmiş bir model olan YOLOv6.0. Bilinçli bir seçim yapmanıza yardımcı olmak için mimari yeniliklerini, performans ölçümlerini ve ideal dağıtım senaryolarını analiz edeceğiz.
YOLOv9: Doğruluk ve Verimliliğin Yeniden Tanımlanması
2024'ün başlarında tanıtılan YOLOv9, gerçek zamanlı nesne algılamada bir paradigma değişimini temsil ediyor. Derin sinir ağlarındaki temel bilgi kaybı sorununu ele alır ve olağanüstü hesaplama verimliliğini korurken üstün doğruluk elde eder.
Yazarlar Chien-Yao Wang ve Hong-Yuan Mark Liao
Organizasyon:Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
Tarih: 2024-02-21
Arxiv:https://arxiv.org/abs/2402.13616
GitHub:https://github.com/WongKinYiu/yolov9
Docs:ultralytics
Mimari Yenilikler
YOLOv9 'un temel gücü çığır açan iki konseptte yatmaktadır: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN). Ağlar derinleştikçe, temel özellik bilgileri genellikle ileri besleme işlemi sırasında kaybolur. PGI, ağ ağırlıklarının güncellenmesi için güvenilir gradyan bilgilerinin korunmasını sağlayarak bu bilgi darboğazıyla mücadele eder. Aynı zamanda GELAN, parametre kullanımını en üst düzeye çıkarmak için mimariyi optimize ederek modelin geleneksel tasarımlara kıyasla daha az parametre ve FLOP ile daha yüksek doğruluk elde etmesini sağlar.
Ultralytics ekosistemi içinde kullanıldığında, YOLOv9 sorunsuz bir geliştirme deneyimi sunar. Kullanıcı dostu Python API, kapsamlı dokümantasyon ve sağlam destek sayesinde hem araştırmacılar hem de kurumsal geliştiriciler için erişilebilir hale gelir.
Güçlü Yönler
- Üstün Doğruluk: YOLOv9 en son teknolojiye ulaşır mAPCOCO veri kümesi gibi ölçütlerde, algılama hassasiyetinde öncekilerden sürekli olarak daha iyi performans göstermiştir.
- Hesaplama Verimliliği: GELAN mimarisi, modelin genellikle yüksek doğruluklu modellerle ilişkili ağır hesaplama maliyeti olmadan üst düzey performans sunmasını sağlayarak onu uç yapay zeka uygulamaları için uygun hale getirir.
- Bilgi Koruma: Bilgi darboğazını hafifleten PGI, modelin daha etkili özellikler öğrenmesini sağlayarak karmaşık sahnelerde daha güvenilir tespitler yapılmasını sağlar.
- Ekosistem Entegrasyonu: Kullanıcılar, kolaylaştırılmış eğitim, doğrulama ve dağıtım işlem hatları dahil olmak üzere Ultralytics araçlarının tam paketinden yararlanır. Modeller ayrıca birçok transformatör tabanlı mimariye kıyasla eğitim sırasında daha düşük bellek kullanımı için optimize edilmiştir.
- Çok yönlülük: Mimari, algılamanın ötesinde, örnek segmentasyonu ve panoptik segmentasyon gibi diğer görevlere genişlemeyi destekler.
Zayıflıklar
- Yenilik: Nispeten daha yeni bir katılımcı olarak, resmi destek kapsamlı olmasına rağmen, topluluk tarafından oluşturulan eğitimlerin ve üçüncü taraf uygulama örneklerinin hacmi hala genişlemektedir.
İdeal Kullanım Senaryoları
YOLOv9 , hassasiyetin kritik olduğu senaryolarda üstünlük sağlar:
- Tıbbi Görüntüleme: Tümör tespiti gibi ince ayrıntıların korunmasının gerekli olduğu görevler için yüksek çözünürlüklü analiz.
- Otonom Sürüş: Yayaların, araçların ve engellerin doğru bir şekilde tanımlanmasını gerektiren kritik ADAS işlevleri.
- Endüstriyel Gözetim: Gözden kaçan tespitlerin maliyetli arızalara yol açabileceği üretim süreçlerindeki küçük kusurların belirlenmesi.
YOLOv9 hakkında daha fazla bilgi edinin
YOLOv6.0: Endüstriyel Hız için Üretildi
YOLOv6.0, Meituan'daki vizyon ekibi tarafından geliştirilen YOLOv6 serisinin üçüncü iterasyonudur. 2023'ün başlarında piyasaya sürülen bu seri, özellikle GPU donanımında endüstriyel uygulamalar için çıkarım hızını en üst düzeye çıkarmaya odaklanarak tasarlanmıştır.
Yazarlar Chuyi Li, Lulu Li, Yifei Geng, et al.
Organization:Meituan
Date: 2023-01-13
ArxivYOLOv6
GitHubYOLOv6
DocsYOLOv6ultralytics
Mimari Özellikler
YOLOv6.0, donanıma duyarlı bir sinir ağı tasarımı kullanır. Etkili bir Yeniden Parametrelendirme kullanır backbone (RepBackbone) ve hibrit bloklardan oluşan bir boyun. Bu yapı, GPU'ların paralel hesaplama yeteneklerinden yararlanmak için özel olarak ayarlanmıştır ve rekabetçi doğruluğu korurken çıkarım sırasında mümkün olan en düşük gecikmeyi sağlamayı amaçlamaktadır.
Güçlü Yönler
- Yüksek Çıkarım Hızı: Mimari, GPU dağıtım için en hızlı seçeneklerden biri haline getirerek verim için yoğun bir şekilde optimize edilmiştir.
- Hız-Hassasiyet D engesi: Yüksek hızlı ayıklama hatları gibi milisaniyelerin önemli olduğu gerçek zamanlı sistemler için cazip bir denge sunar.
- Endüstriyel Odak: Model, üretim ve otomasyon ortamlarındaki pratik zorlukları ele almak üzere tasarlanmıştır.
Zayıflıklar
- Daha Düşük Tepe Doğruluğu: Hızlı olmasına rağmen model, özellikle büyük model varyantlarında, en yüksek doğrulukta YOLOv9 'un gerisinde kalmaktadır.
- Sınırlı Ekosistem: Topluluk ve araç ekosistemi, yaygın olarak benimsenen Ultralytics çerçevesine kıyasla daha küçüktür.
- Görev Spesifikliği: Öncelikle nesne algılamaya odaklanmıştır ve daha yeni Ultralytics modellerinde bulunan yerel, çok görevli çok yönlülükten ( poz tahmini veya OBB gibi) yoksundur.
İdeal Kullanım Senaryoları
YOLOv6.0 yüksek verimli ortamlar için çok uygundur:
- Gerçek Zamanlı Gözetim: Güvenlik alarm sistemleri için birden fazla video akışını aynı anda işleme.
- Üretim Hattı Sıralama: Hızlı hareket eden konveyör bantlarında hızlı nesne sınıflandırması ve lokalizasyonu.
YOLOv6.0 hakkında daha fazla bilgi edinin
Performans Analizi
Aşağıdaki karşılaştırma her iki modelin performans ölçütlerini vurgulamaktadır. YOLOv6.0 en küçük varyantları için etkileyici bir hız sunarken, YOLOv9 karşılaştırılabilir parantezlerde daha az parametre ile daha yüksek doğruluk sağlayarak üstün verimlilik göstermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv6.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Anahtar Çıkarımlar:
- Verimlilik Kralı: YOLOv9 sadece 25,3M parametre ile %53,0 mAP elde eder. Buna karşılık, YOLOv6.0l %52,8 gibi daha düşük bir mAP değerine ulaşmak için 59,6M parametreye ihtiyaç duymaktadır. Bu, YOLOv9'un "daha azıyla daha fazlasını" yapan üstün mimari tasarımını göstermektedir.
- En Yüksek Performans: YOLOv9 modeli %55,6 mAP ile yüksek bir çıta belirleyerek YOLOv6 serisinin bu karşılaştırmada ulaşamadığı bir hassasiyet seviyesi sunuyor.
- Hız ve Doğruluk: YOLOv6.0n inanılmaz derecede hızlıdır (1,17 ms), bu da onu doğrulukta bir düşüşün (%37,5 mAP) kabul edilebilir olduğu aşırı düşük gecikme gereksinimleri için uygun bir seçenek haline getirir. Bununla birlikte, genel amaçlı uygulamalar için YOLOv9, önemli ölçüde daha az parametreyle (2,0M'ye karşı 4,7M) daha iyi bir denge (2,3 ms'de %38,3 mAP ) sunar.
Bellek Verimliliği
YOLOv9 da dahil olmak üzere Ultralytics YOLOv9 modelleri, eğitim sırasında optimize edilmiş bellek kullanımlarıyla ünlüdür. Devasa GPU VRAM gerektiren bazı ağır transformatör tabanlı modellerin aksine, bu modeller genellikle tüketici sınıfı donanımlarda eğitilebilir ve son teknoloji yapay zeka geliştirmeye erişimi demokratikleştirir.
Eğitim ve Kullanılabilirlik
Kullanıcı deneyimi iki model arasında önemli ölçüde farklılık gösterir. Ultralytics ekosistemine tamamen entegre olan YOLOv9, kolaylaştırılmış bir iş akışı sunar. Geliştiriciler, modelleri yalnızca birkaç satır kodla eğitmek, doğrulamak ve dağıtmak için basit bir Python arayüzünden yararlanabilirler.
from ultralytics import YOLO
# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")
# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model.predict("image.jpg")
Bu entegrasyon, otomatik hiperparametre ayarı, TensorBoard ile gerçek zamanlı günlük kaydı gibi gelişmiş özelliklere erişim sağlar veya Weights & Biasesve aşağıdaki gibi formatlara sorunsuz dışa aktarma ONNX ve TensorRT.
Buna karşılık, YOLOv6.0'ı eğitmek genellikle kendi GitHub deposunda ve eğitim komut dosyalarında gezinmeyi gerektirir; bu da Ultralytics kütüphanesinin tak ve çalıştır yapısına alışkın olanlar için daha dik bir öğrenme eğrisi sunabilir.
Sonuç
YOLOv6.0, GPU donanımında mutlak en düşük gecikme süresini talep eden belirli endüstriyel nişler için güçlü bir rakip olmaya devam ederken, YOLOv9 modern bilgisayarla görme görevleri için çok yönlü üstün bir seçim olarak ortaya çıkmaktadır.
YOLOv9 , son teknoloji doğruluk, olağanüstü parametre verimliliği ve Ultralytics ekosisteminin muazzam avantajlarının kazanan bir kombinasyonunu sunar. Daha hafif modellerle daha yüksek hassasiyet elde etme yeteneği, uç dağıtım senaryolarında daha düşük depolama maliyetleri ve daha hızlı iletim anlamına gelir. Ayrıca, Ultralytics modelleriyle ilişkili kullanım kolaylığı, kapsamlı dokümantasyon ve aktif topluluk desteği, geliştirme yaşam döngüsünü önemli ölçüde hızlandırarak ekiplerin konseptten dağıtıma güvenle geçmesine olanak tanır.
Yeni nesil performans arayan geliştiriciler için ayrıca şunları keşfetmenizi öneririz Ultralytics YOLO11poz tahmini ve yönlendirilmiş nesne algılama dahil olmak üzere daha geniş bir görev yelpazesi için bu yetenekleri daha da geliştiren en son modelimiz. Bunları aşağıdaki gibi transformatör tabanlı yaklaşımlarla da karşılaştırabilirsiniz RT-DETRmodel karşılaştırma merkezimizde.