YOLOv10 vs. YOLO: Nesne Algılama için Detaylı Teknik Karşılaştırma
Doğruluk, hız ve verimlilik açısından önemli farklılıklar gösteren bilgisayarla görme uygulamaları için en uygun nesne algılama modelini seçmek çok önemlidir. Bu sayfa, nesne algılama alanındaki iki gelişmiş model olan YOLOv10 ve YOLO arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Model seçim sürecinize rehberlik etmek için mimarilerini, performans kıyaslamalarını ve uygun uygulamaları inceleyeceğiz.
YOLOv10
YOLOv10, gerçek zamanlı nesne algılama yetenekleriyle tanınan YOLO serisinin en son evrimidir. Tsinghua Üniversitesi'ndeki araştırmacılar tarafından geliştirilen ve 2024-05-23(arXiv ön baskı arXiv:2405.14458) tarihinde tanıtılan YOLOv10, uçtan uca verimlilik ve gelişmiş performans için tasarlanmıştır. Resmi PyTorch uygulaması GitHub'da mevcuttur.
Mimari ve Temel Özellikler
YOLOv10, mimariyi düzene sokmaya ve hız ile doğruluk arasındaki dengeyi geliştirmeye, NMS'siz eğitime ve verimli model tasarımına doğru ilerlemeye odaklanan çeşitli yenilikler sunuyor. Önemli mimari özellikler şunlardır:
- NMS'siz Eğitim: Maksimum Olmayan Bastırma (NMS) olmadan eğitim için tutarlı ikili atamalar kullanır, işlem sonrası ek yükü ve çıkarım gecikmesini azaltır.
- Bütünsel Verimlilik-Doğruluk Odaklı Tasarım: Hesaplama fazlalığını en aza indirmek ve tespit yeteneklerini geliştirmek için çeşitli model bileşenlerinin kapsamlı optimizasyonu.
- Omurga ve Ağ Yapısı: Geliştirilmiş parametre verimliliği ve daha hızlı işleme için rafine özellik çıkarma katmanları ve modern bir ağ yapısı.
Performans Ölçütleri
YOLOv10, çeşitli model ölçeklerinde son teknoloji ürünü performans sunarak farklı hesaplama ihtiyaçlarına uygun bir dizi seçenek sağlar. COCO veri setindeki performans ölçümleri şunları içerir:
- mAP: COCO doğrulama veri kümesinde rekabetçi ortalama Ortalama Hassasiyet (mAP) elde eder. Örneğin, YOLOv10-S %46,7 mAPval50-95 elde eder.
- Çıkarım Hızı: T4 TensorRT10 üzerinde 1,56 ms çıkarım süresine ulaşan YOLOv10-N ile etkileyici çıkarım hızları sunar.
- Model Boyutu: YOLOv10-N için 2,3M parametreden YOLOv10-X için 56,9M'ye kadar değişen model boyutlarıyla birden fazla boyutta (N, S, M, B, L, X) mevcuttur.
Güçlü ve Zayıf Yönler
Güçlü yönler:
- Gerçek Zamanlı Performans: Hız ve verimlilik için optimize edilmiştir, bu da onu gerçek zamanlı uygulamalar için ideal kılar.
- Yüksek Hassasiyet: Özellikle YOLOv10-X gibi daha büyük model varyantlarında son teknoloji ürünü doğruluk elde eder.
- Uçtan Uca Verimlilik: NMS içermeyen tasarım gecikmeyi azaltır ve dağıtımı basitleştirir.
- Çok yönlülük: Çeşitli nesne algılama görevleri için uygundur ve Raspberry Pi ve NVIDIA Jetson gibi uç cihazlar da dahil olmak üzere farklı donanım platformlarına uyarlanabilir.
- Kullanım Kolaylığı: Ultralytics Python paketi ile entegrasyon, eğitim, doğrulama ve dağıtım iş akışlarını basitleştirir.
Zayıflıklar:
- Gelişmekte Olan Model: Yeni bir model olarak, daha geniş ekosistemlerdeki topluluk desteği ve önceden eğitilmiş ağırlıklar, daha yerleşik modellere kıyasla hala gelişmekte olabilir.
- Ödünleşme: Daha küçük modeller, daha büyük varyantlara veya daha karmaşık modellere kıyasla potansiyel olarak bir miktar doğruluk pahasına hıza öncelik verir.
Kullanım Örnekleri
YOLOv10, yüksek hızlı, doğru nesne algılama gerektiren uygulamalar için çok uygundur, örneğin:
- Otonom Sistemler: Kendi kendine giden arabalar ve robotik.
- Güvenlik ve Gözetim: Güvenlik alarm sistemleri ve gerçek zamanlı izleme.
- Endüstriyel Otomasyon: Üretim kalite kontrolü ve süreç otomasyonu.
- Perakende Analitiği: Envanter yönetimi ve müşteri davranış analizi.
YOLOv10 hakkında daha fazla bilgi edinin
DAMO-YOLO
Alibaba Group tarafından geliştirilen YOLO, 2022 yılında tanıtılan yüksek performanslı bir nesne algılama modelidir(arXiv ön baskı arXiv:2211.15444v2). Hızlı ve doğru olacak şekilde tasarlanmıştır ve verimli nesne tespiti için çeşitli gelişmiş teknikler içerir. Resmi uygulama ve belgeler GitHub'da mevcuttur.
Mimari ve Temel Özellikler
YOLO , hız ve doğruluk dengesini sağlamak için çeşitli yenilikçi bileşenleri bir araya getirir:
- NAS Omurgası: Nesne algılama görevleri için optimize edilmiş verimli omurga ağları tasarlamak için Sinirsel Mimari Arama (NAS) kullanır.
- Verimli RepGFPN: Verimli özellik füzyonu ve çok ölçekli özellik temsili için Yeniden Parametrelendirilmiş Gradyan Özellik Piramidi Ağı (RepGFPN) kullanır.
- ZeroHead: Algılama doğruluğunu korurken hesaplama yükünü en aza indirmek için tasarlanmış hafif bir algılama kafası.
- AlignedOTA: Eğitim sırasında gelişmiş etiket ataması için Aligned Optimal Transport Assignment (AlignedOTA) kullanır ve tespit performansını artırır.
- Damıtma Geliştirme: Model performansını daha da artırmak için bilgi damıtma tekniklerini içerir.
Performans Ölçütleri
YOLO modelleri, farklı performans ihtiyaçlarını karşılamak için çeşitli boyutlarda (Minik, Küçük, Orta, Büyük) sunulmaktadır. Temel performans göstergeleri şunları içerir:
- mAP: COCO gibi kıyaslama veri kümelerinde yüksek mAP elde eder. Örneğin YOLO, %50,8 mAPval50-95 değerine ulaşır.
- Çıkarım Hızı: YOLO, T4 TensorRT10 üzerinde 2,32 ms çıkarım süresi elde ederek gerçek zamanlı uygulamalar için uygun hale getiren yüksek çıkarım hızları sunar.
- Model Boyutu: Model boyutları, YOLO için 8,5M parametreden YOLO için 42,1M'ye kadar değişen farklı dağıtım senaryoları için esneklik sağlar.
Güçlü ve Zayıf Yönler
Güçlü yönler:
- Yüksek Doğruluk: Mimari yenilikler ve gelişmiş eğitim teknikleri sayesinde mükemmel algılama doğruluğuna ulaşır.
- Hızlı Çıkarım: Hız için tasarlanmıştır, gerçek zamanlı sistemlere uygun verimli çıkarım performansı sağlar.
- Verimli Tasarım: Hesaplama verimliliğini optimize etmek için NAS omurgaları ve hafif başlıklar içerir.
- Kapsamlı Özellik Seti: Güçlü performans için RepGFPN ve AlignedOTA gibi çok sayıda gelişmiş tekniği entegre eder.
Zayıflıklar:
- Karmaşıklık: NAS ve çok sayıda gelişmiş bileşenin entegrasyonu, özelleştirme ve modifikasyonda karmaşıklığa yol açabilir.
- Kaynak Gereksinimleri: Daha büyük YOLO modelleri, son derece hafif alternatiflere kıyasla önemli hesaplama kaynakları gerektirebilir.
Kullanım Örnekleri
YOLO , nesne algılamada yüksek doğruluk ve hız gerektiren uygulamalar için çok uygundur, örneğin:
- Gelişmiş Sürücü Destek Sistemleri (ADAS): Otonom sürüş senaryolarında nesne algılama.
- Yüksek Çözünürlüklü Görüntü Analizi: Uydu görüntüsü analizi gibi yüksek çözünürlüklü görüntülerin ayrıntılı analizini gerektiren uygulamalar.
- Robotik ve Otomasyon: Endüstriyel otomasyonda robotik navigasyon ve manipülasyon için hassas nesne algılama.
- Gözetim Sistemleri: Görsel yapay zeka ile gözetim statükosunu sarsan yüksek doğrulukta algılama.
YOLO hakkında daha fazla bilgi edinin
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4TensorRT10 (ms) |
params (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Kullanıcılar ayrıca YOLOv10 ve YOLO 'yu Ultralytics YOLO ailesindeki ve ötesindeki diğer modellerle karşılaştırmak isteyebilir:
- YOLOv8: YOLOv8 ile YOLO'nun çok yönlülüğünü ve kullanım kolaylığını keşfedin.
- YOLOv9: YOLO'ya kıyasla YOLOv9'daki mimari yenilikleri anlayın.
- RT-DETR: RT-DETR ile YOLO'daki uçtan uca dedektörleri karşılaştırın.
- EfficientDet: EfficientDet vs YOLO'da verimlilik odaklı modellerin nasıl sıralandığını görün.
- PP-YOLOE: PP-YOLOE ve YOLO gibi alternatif verimli modelleri düşünün.