İçeriğe geç

YOLOv9 vs YOLOv10: Detaylı Teknik Karşılaştırma

Ultralytics , bilgisayarla görmenin sınırlarını zorlamaya kendini adamıştır ve bunun önemli bir parçası da YOLO modellerimizi geliştirmek ve iyileştirmektir. Bu sayfa, en son teknoloji ürünü iki nesne algılama modeli olan YOLOv9 ve YOLOv10 arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Belirli bilgisayarla görme görevleriniz için en uygun modeli seçmenize yardımcı olmak için mimari nüanslarını, performans kıyaslamalarını ve uygun uygulamaları inceleyeceğiz.

YOLOv9: Programlanabilir Gradyan Bilgileri

Tayvan, Academia Sinica, Bilgi Bilimi Enstitüsü'nden Chien-Yao Wang ve Hong-Yuan Mark Liao tarafından Şubat 2024'te tanıtılan YOLOv9, verimli nesne tespitinde önemli bir ilerlemeyi temsil ediyor. YOLOv9'un temel yeniliği, derin öğrenme süreci sırasında bilgi kaybını gidermek için tasarlanan Programlanabilir Gradyan Bilgisinde (PGI) yatmaktadır. Bu, Genelleştirilmiş Verimli Katman Toplama Ağları (GELAN) gibi tekniklerle elde edilir ve modelin tam olarak öğrenmesini istediğiniz şeyi öğrenmesini sağlar.

Mimari ve Temel Özellikler: YOLOv9, özellik çıkarımını geliştirmek ve ağ boyunca bilgi bütünlüğünü korumak için GELAN'dan yararlanır. Bu yaklaşım, yalnızca doğru değil aynı zamanda parametre açısından verimli bir modele yol açarak onu hesaplama kaynaklarının sınırlı olduğu dağıtımlar için uygun hale getirir. YOLOv9,"YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information" adlı makaleden uyarlanmıştır.

Performans Ölçütleri: YOLOv9, COCO veri kümesinde etkileyici bir performans sergilemektedir. Örneğin, YOLOv9c 25,3M parametre ve 102,1B FLOP ile %53,0 mAPval50-95 değerine ulaşmıştır. Modelin mimarisi verimlilik için tasarlanmıştır ve önceki modellere kıyasla daha az parametre ve hesaplama ile yüksek doğruluk elde etmesini sağlar.

Güçlü yönler:

  • Yüksek Doğruluk: Nesne algılamada son teknoloji ürünü doğruluğa ulaşır.
  • Parametre Verimliliği: GELAN ve PGI sayesinde parametreleri ve hesaplamaları etkin bir şekilde kullanır.
  • Yeni Yaklaşım: Daha iyi öğrenme için Programlanabilir Gradyan Bilgisi sunar.

Zayıflıklar:

  • Nispeten Yeni: Daha yeni bir model olduğundan, daha köklü modellere kıyasla daha küçük bir topluluğa ve daha az dağıtım örneğine sahip olabilir.

Kullanım Alanları: YOLOv9, aşağıdakiler gibi yüksek doğruluk ve verimlilik gerektiren uygulamalar için çok uygundur:

  • İleri Robotik: Karmaşık robotik sistemlerde nesne algılama.
  • Yüksek Çözünürlüklü Görüntü Analizi: Büyük görüntülerin ayrıntılı analizini gerektiren senaryolar.
  • Kaynak Kısıtlı Ortamlar: Hesaplama gücünün sınırlı olduğu uç cihazlar ve mobil uygulamalar.

YOLOv9 hakkında daha fazla bilgi edinin

Yazarlar ve Kaynaklar:

YOLOv10: Bütünsel Verimlilik-Doğruluk Odaklı Tasarım

Tsinghua Üniversitesi'nden Ao Wang, Hui Chen, Lihao Liu ve arkadaşları tarafından Mayıs 2024'te piyasaya sürülen YOLOv10, maksimum verimlilik ve hızı vurgulayarak gerçek zamanlı uçtan uca nesne tespiti için tasarlanmıştır. YOLOv10, NMS'siz eğitim için Tutarlı İkili Atamalar ve Bütünsel Verimlilik-Doğruluk Odaklı Model Tasarımı dahil olmak üzere hem doğruluğu hem de verimliliği artırmak için birkaç önemli metodolojik iyileştirme sunar.

Mimari ve Temel Özellikler: YOLOv10'un mimarisi, hesaplama fazlalığını en aza indirmek ve performansı en üst düzeye çıkarmak için titizlikle tasarlanmıştır. Temel verimlilik geliştirmeleri arasında Hafif Sınıflandırma Başlığı, Uzamsal-Kanal Ayrıştırmalı Alt Örnekleme ve Sıralama Kılavuzlu Blok Tasarımı yer alır. Büyük Çekirdekli Konvolüsyonlar ve Kısmi Öz Dikkat (PSA) sayesinde doğruluk artırılmıştır. Bu yenilikler YOLOv10'un doğruluktan ödün vermeden son teknoloji hız ve verimlilik elde etmesini sağlar. YOLOv10,"YOLOv10: Gerçek Zamanlı Uçtan Uca Nesne Algılama" başlıklı makalede ayrıntılı olarak açıklanmaktadır.

Performans Ölçütleri: YOLOv10, gerçek zamanlı nesne tespitinde yeni ölçütler belirler. Örneğin, YOLOv10-S'nin COCO veri setinde karşılaştırılabilir AP ile RT-DETR'den 1,8 kat daha hızlı olduğu bildirilmiştir. YOLOv10-B, benzer performans seviyelerini korurken YOLOv9-C'ye göre %46 daha az gecikme süresi ve %25 daha az parametre göstermektedir. YOLOv10-N, T4 GPU'da sadece 1,84 ms'lik etkileyici bir gecikme süresine ulaşıyor.

Güçlü yönler:

  • Olağanüstü Verimlilik: Minimum gecikme süresi ve hesaplama maliyeti için optimize edilmiştir.
  • NMS'siz Eğitim: Tutarlı İkili Atamalar, Maksimum Olmayan Bastırma olmadan uçtan uca dağıtım sağlayarak çıkarım süresini kısaltır.
  • Yüksek Hız: Önceki YOLO sürümlerine ve diğer modellere kıyasla önemli ölçüde daha yüksek çıkarım hızlarına ulaşır.
  • İyi Doğruluk: Verimliliğe öncelik verirken rekabetçi doğruluğu korur.

Zayıflıklar:

  • Çok Yeni Model: Çok yeni bir model olarak hala aktif geliştirme aşamasındadır ve topluluk desteği artmaktadır.

Kullanım Alanları: YOLOv10, gerçek zamanlı performans ve verimliliğin çok önemli olduğu uygulamalar için idealdir:

  • Uç Bilişim: Sınırlı kaynaklara sahip uç cihazlarda dağıtım.
  • Gerçek Zamanlı Video Analitiği: Video akışlarında anında nesne tespiti gerektiren uygulamalar.
  • Mobil ve Gömülü Sistemler: Hız ve güç tüketiminin kritik olduğu mobil uygulamalara ve gömülü sistemlere entegrasyon.

YOLOv10 hakkında daha fazla bilgi edinin

Yazarlar ve Kaynaklar:

Karşılaştırma Tablosu

Model boyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4TensorRT10
(ms)
params
(M)
FLOP'lar
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4

Sonuç

Hem YOLOv9 hem de YOLOv10, her biri benzersiz güçlere sahip nesne algılamada en son gelişmeleri temsil eder. YOLOv9, Programlanabilir Gradyan Bilgisi sayesinde doğruluk ve parametre verimliliğinde üstünlük sağlayarak karmaşık ve ayrıntılı analizler için uygun hale gelir. YOLOv10 ise bütünsel verimlilik-doğruluk odaklı tasarımı ve NMS'siz eğitimi ile hız ve gerçek zamanlı performansa öncelik vererek edge ve gerçek zamanlı uygulamalar için idealdir.

Olgunluk ve çok yönlülük arasında bir denge arayan kullanıcılar için, Ultralytics YOLOv8 sağlam bir seçim olmaya devam ediyor. En son gelişmeler ve en yüksek doğrulukla ilgilenenler için, Ultralytics YOLO11 ayrıca önceki YOLO inelemelerinin güçlü yönlerini temel alarak cazip bir seçenek sunuyor. Nihayetinde en iyi model, doğruluk, hız ve kaynak kısıtlamalarını dengeleyerek projenizin özel gereksinimlerine bağlıdır.

📅1 yıl önce oluşturuldu ✏️ 1 ay önce güncellendi

Yorumlar