İçeriğe geç

YOLOv10 - YOLOv9 Karşılaştırması: Teknik Bir Karşılaştırma

Doğru nesne algılama modelini seçmek, herhangi bir bilgisayarla görme projesi için çok önemlidir ve performansı, hızı ve dağıtım fizibilitesini doğrudan etkiler. Alan hızla gelişirken, en son mimariler hakkında bilgi sahibi olmak çok önemlidir. Bu sayfa, son teknoloji ürünü iki model arasında ayrıntılı bir teknik karşılaştırma sunmaktadır: YOLOv10 ve YOLOv9. Doğruluk, hız ve kaynak gereksinimleri gibi faktörlere göre bilinçli bir karar vermenize yardımcı olmak için mimari yeniliklerini, performans metriklerini ve ideal kullanım durumlarını analiz edeceğiz.

YOLOv10: Gerçek Zamanlı Uçtan Uca Verimlilik

YOLOv10, Tsinghua Üniversitesi'ndeki araştırmacılar tarafından Mayıs 2024'te yayınlanan son teknoloji bir modeldir. Gerçek bir uçtan uca nesne algılama hattı oluşturarak olağanüstü gerçek zamanlı performans sunmak üzere tasarlanmıştır. Öne çıkan yenilik, geleneksel olarak çıkarım gecikmesi ekleyen bir işlem sonrası adım olan Non-Maximum Suppression (NMS)'ın ortadan kaldırılmasıdır. Bu, YOLOv10'u hızın kritik olduğu uygulamalar için oldukça verimli bir seçim haline getirir.

Teknik Detaylar:

Mimari ve Temel Özellikler

YOLOv10, hız-doğruluk dengesinin sınırlarını zorlamak için çeşitli mimari gelişmeler sunar.

  • NMS'siz Eğitim: Temel yenilik, eğitim sırasında Tutarlı Çift Atamalar kullanılmasıdır. Bu strateji, model için zengin bir denetim sağlarken, çıkarım sırasında NMS olmadan çalışmasını sağlar. YOLOv10, bu işlem sonrası darboğazı ortadan kaldırarak daha düşük gecikme süresi elde eder ve dağıtım hattını basitleştirir.
  • Bütünsel Verimlilik-Doğruluk Odaklı Tasarım: Yazarlar, modelin bileşenlerinin kapsamlı bir optimizasyonunu gerçekleştirdi. Bu, hesaplama yükünü azaltmak için hafif bir sınıflandırma başlığı, bilgileri daha etkili bir şekilde korumak için uzamsal-kanal ayrıştırmalı alt örnekleme ve hesaplama yedekliliğini ortadan kaldırmak için rank-guided blok tasarımını içerir. Minimum ek yükle doğruluğu artırmak için mimari, geniş çekirdekli evrişimler ve kısmi self-attention (PSA) içerir.

Güçlü ve Zayıf Yönler

Güçlü Yönler:

  • Aşırı Verimlilik: YOLOv10, minimum gecikme ve hesaplama maliyeti için optimize edilmiştir, bu da onu mevcut en hızlı nesne dedektörlerinden biri yapar.
  • End-to-End Deployment: NMS içermeyen tasarım, işlem sonrası adımları ortadan kaldırarak dağıtımı basitleştirir ve çıkarım süresini azaltır.
  • Mükemmel Performans Dengesi: Hız ve doğruluk arasında son teknoloji ürünü bir denge sağlar ve genellikle benzer ölçeklerdeki diğer modellerden daha iyi performans gösterir.
  • Ultralytics Entegrasyonu: YOLOv10, Ultralytics ekosistemine sorunsuz bir şekilde entegre edilmiştir. Bu, kullanıcılara basit bir Python API, kapsamlı belgelendirme ve iyi yönetilen bir çerçevenin desteği dahil olmak üzere kolaylaştırılmış bir deneyim sunar.

Zayıflıklar:

  • Güncellik: Çok yeni bir model olduğundan, topluluk ve üçüncü taraf kaynakları Ultralytics YOLOv8 gibi daha yerleşik modellere kıyasla hala büyüyor.

İdeal Kullanım Senaryoları

YOLOv10, gerçek zamanlı performans ve verimliliğin en yüksek öncelikler olduğu uygulamalar için ideal seçimdir.

  • Edge AI: Düşük gecikme süresi ve küçük ayak izi, onu NVIDIA Jetson ve mobil platformlar gibi kaynak kısıtlı cihazlara dağıtım için mükemmel kılar.
  • Yüksek Hızlı Video Analizi: Trafik yönetimi veya canlı güvenlik izlemesi gibi video akışlarında anında algılama gerektiren senaryolar.
  • Otonom Sistemler: Hızlı karar vermenin gerekli olduğu robotik ve dronlardaki uygulamalar.

YOLOv10 hakkında daha fazla bilgi edinin

YOLOv9: Programlanabilir Gradyan Bilgisi

Şubat 2024'te tanıtılan YOLOv9, Tayvan'daki Bilgi Bilimi Enstitüsü, Academia Sinica'daki araştırmacılardan önemli bir gelişmedir. Derin sinir ağlarındaki temel bir sorunu ele alır: veri ardışık katmanlardan geçerken bilgi kaybı. YOLOv9, ağ güncellemeleri için güvenilir gradyan bilgisinin kullanılabilir olmasını sağlamak için Programlanabilir Gradyan Bilgisi (PGI)'ni sunar ve bu da daha etkili öğrenmeye ve daha yüksek doğruluğa yol açar.

Teknik Detaylar:

Mimari ve Temel Özellikler

YOLOv9'un mimarisi, bilgi tutma ve öğrenme verimliliğini en üst düzeye çıkarmak için tasarlanmıştır.

  • Programlanabilir Gradyan Bilgisi (PGI): Bu yeni kavram, ağ ağırlıklarını güncellemek için güvenilir gradyanlar oluşturmaya yardımcı olur, bilgi darboğazı sorununu etkili bir şekilde ele alır ve ayrıntıların derin mimarilerde kaybolmasını önler.
  • Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN): YOLOv9, parametre kullanımını ve hesaplama verimliliğini optimize eden yeni bir ağ mimarisi olan GELAN'ı sunar. GELAN, önceki mimarilerin güçlü yönlerini bir araya getirerek, hesaplama açısından engelleyici olmadan YOLOv9'un yüksek performans elde etmesini sağlar.

Güçlü ve Zayıf Yönler

Güçlü Yönler:

  • Yüksek Doğruluk: YOLOv9, en büyük varyantı (YOLOv9-E) COCO veri kümesinde yeni bir mAP ölçütü belirleyerek son teknoloji doğruluğa ulaşır.
  • Verimli Mimari: PGI ve GELAN'ın birleşimi, benzer doğruluk seviyelerini hedefleyen diğer modellere kıyasla daha az parametreyle mükemmel performans sağlar.
  • Bilgi Koruma: Temel tasarımı, bilgi kaybını etkili bir şekilde azaltarak daha iyi özellik temsili ve tespit edilmesi zor nesnelerin algılanmasına yol açar.
  • Ultralytics Ekosistemi: YOLOv10 gibi, YOLOv9 da Ultralytics çatısına entegrasyondan yararlanır ve kullanım kolaylığı, kapsamlı belgelendirme ve eğitim ve dağıtım için sağlam bir araç setine erişim sunar.

Zayıflıklar:

  • YOLOv10'dan Daha Yüksek Gecikme Süresi: Doğruluk sınıfı için verimli olsa da, performans tablosunda görüldüğü gibi genellikle YOLOv10'a kıyasla daha yüksek çıkarım gecikmesine sahiptir.
  • Karmaşıklık: PGI ve yardımcı tersine çevrilebilir dalların kavramları, daha basit tasarımlara kıyasla mimariye bir karmaşıklık katmanı ekler.

İdeal Kullanım Senaryoları

YOLOv9, mümkün olan en yüksek doğruluğu elde etmenin öncelikli hedef olduğu ve hesaplama kaynaklarının daha az kısıtlı olduğu uygulamalar için çok uygundur.

  • Yüksek Çözünürlüklü Analiz: Tıbbi görüntüleme veya uydu görüntüsü analizi gibi büyük görüntülerin ayrıntılı analizini gerektiren senaryolar.
  • Gelişmiş Güvenlik Sistemleri: Çok çeşitli nesnelerin doğru bir şekilde tanımlanmasının güvenlik için kritik olduğu karmaşık gözetim ortamları.
  • Kalite Kontrol: Üretim kalite kontrolü için gerekli olan, çok küçük kusurların yüksek hassasiyetle tespit edilmesinin gerektiği endüstriyel uygulamalar.

YOLOv9 hakkında daha fazla bilgi edinin

Performans ve Kıyaslamalar: YOLOv10 - YOLOv9 Karşılaştırması

Aşağıdaki tabloda, COCO veri kümesinde YOLOv10 ve YOLOv9'un çeşitli ölçekleri arasında ayrıntılı bir performans karşılaştırması sunulmaktadır. Metrikler, iki aile arasındaki tasarım ödünleşimlerini açıkça göstermektedir.

YOLOv10, karşılaştırılabilir tüm model boyutlarında sürekli olarak daha düşük gecikme süresi ve daha fazla parametre verimliliği gösterir. Örneğin, YOLOv10-B, YOLOv9-C'ye benzer bir mAP'ye ulaşır, ancak %46 daha az gecikme süresi ve %25 daha az parametre ile. Bu, YOLOv10'un gerçek zamanlı uygulamalardaki gücünü vurgular.

Öte yandan, YOLOv9-E %55,6'lık en yüksek mAP'ye ulaşarak, daha yüksek gecikme süresi ve daha fazla parametre pahasına olsa bile, doğruluğun tartışılmaz olduğu senaryolar için en iyi seçimdir.

Model boyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0

Sonuç: Hangi Modeli Seçmelisiniz?

YOLO10 ve YOLOv9 arasındaki seçim tamamen projenizin özel ihtiyaçlarına bağlıdır.

  • Hız, gecikme süresi ve hesaplama verimliliği öncelikli kısıtlamalarınız ise YOLOv10'u Seçin. NMS'siz, uçtan uca tasarımı, onu gerçek zamanlı video işleme, uç cihazlarda dağıtım ve hızlı ve verimli çıkarımın kritik olduğu herhangi bir uygulama için üstün bir seçenek haline getiriyor.

  • Temel amacınız mümkün olan en yüksek algılama doğruluğuna ulaşmaksa YOLOv9'u seçin. Yenilikçi mimarisi, bilgileri koruma konusunda mükemmeldir ve bu da onu hassasiyetin mutlak en düşük gecikme ihtiyacından daha ağır bastığı karmaşık sahneler ve yüksek riskli uygulamalar için ideal kılar.

Her iki model de güçlü, son teknoloji ürünü mimarilerdir ve kullanımlarını ve dağıtımlarını basitleştiren Ultralytics ekosistemine entegre olmalarından büyük ölçüde faydalanırlar.

Diğer Modelleri İnceleyin

YOLOv10 ve YOLOv9 en son teknolojiyi temsil ederken, Ultralytics ekosistemi çok çeşitli modelleri destekler. Olgun, çok yönlü ve dengeli bir model arayan geliştiriciler için Ultralytics YOLOv8, algılamanın ötesinde birden fazla görme görevi için destek sunan mükemmel bir seçim olmaya devam ediyor. Ultralytics'ten en son gelişmeleri arayanlar için YOLO11'e göz atın. Model karşılaştırma sayfamızda daha fazla karşılaştırma keşfedebilirsiniz.



📅 1 yıl önce oluşturuldu ✏️ 1 ay önce güncellendi

Yorumlar