YOLOv10 vs. YOLOv9: Kapsamlı Bir Teknik Karşılaştırma
YOLO (Sadece Bir Kez Bakarsınız) mimarisinin hız ve doğruluk sınırlarını zorlayan birbirini izleyen yinelemeleriyle nesne algılama alanı hızla gelişmiştir. Bu alana son zamanlarda yapılan en önemli katkılardan ikisi şunlardır YOLOv10 ve YOLOv9. Her iki model de COCO veri setinde en son teknolojiye sahip performansa ulaşırken, tasarım felsefeleri ve mimari hedefleri açısından önemli ölçüde farklılaşmaktadır.
YOLOv10 , maksimum olmayan bastırmaNMS) ihtiyacını ortadan kaldırarak düşük gecikme süresine ve uçtan uca verimliliğe öncelik verirken, YOLOv9 Programlanabilir Gradyan Bilgisi (PGI) aracılığıyla bilgi tutma ve doğruluğu en üst düzeye çıkarmaya odaklanır. Bu kılavuz, geliştiricilerin ve araştırmacıların bilgisayarla görme uygulamaları için en uygun modeli seçmelerine yardımcı olmak için ayrıntılı bir teknik karşılaştırma sağlar.
YOLOv10: Uçtan Uca Gerçek Zamanlı Dedektör
Tsinghua Üniversitesi'ndeki araştırmacılar tarafından Mayıs 2024'te yayınlandı, YOLOv10YOLO serisinde bir paradigma değişimini temsil etmektedir. Birincil yeniliği, geleneksel olarak çıkarım gecikmesi için bir darboğaz olan Maksimum Olmayan Bastırma (NMS) işlem sonrası adımının kaldırılmasıdır.
Teknik Detaylar:
- Yazarlar: Ao Wang, Hui Chen, Lihao Liu, ve diğerleri.
- Organizasyon:Tsinghua Üniversitesi
- Tarih: 2024-05-23
- Arxiv:Gerçek Zamanlı Uçtan Uca Nesne Algılama
- GitHub:THU-MIG/yolov10
Mimari ve Temel Yenilikler
YOLOv10 , verimliliğini Tutarlı İkili Atamalar ve Bütünsel Verimlilik-Doğruluk Odaklı Model Tasarımı kombinasyonuyla elde eder.
- NMS'siz Eğitim: Geleneksel YOLO modelleri, yinelenen sınırlayıcı kutuları filtrelemek için NMS 'ye güvenir. YOLOv10 , model eğitimi sırasında ikili bir atama stratejisi kullanır. Bire çok dal, öğrenme için zengin denetleyici sinyaller sağlarken bire bir dal, modelin çıkarım sırasında nesne başına tek bir en iyi tahmin üretmesini sağlar. Bu, modelin NMS olmadan konuşlandırılmasına olanak tanıyarak çıkarım gecikmesini önemli ölçüde azaltır.
- Model Optimizasyonu: Mimari, hafif sınıflandırma başlıkları, uzamsal kanal ayrıştırmalı alt örnekleme ve sıralama kılavuzlu blok tasarımı içerir. Bu özellikler hesaplama fazlalığını ve bellek kullanımını azaltarak modeli sınırlı kaynaklara sahip donanımlarda son derece verimli hale getirir.
Verimlilik Avantajı
YOLOv10 'da NMS 'nin kaldırılması özellikle uç dağıtım için faydalıdır. CPU kaynaklarının kıt olduğu cihazlarda, binlerce aday kutuyu sıralama ve filtrelemenin hesaplama maliyetinden kaçınmak önemli hızlanmalara neden olabilir.
YOLOv10 hakkında daha fazla bilgi edinin
YOLOv9: Bilgi Saklama Konusunda Uzmanlaşmak
Şubat 2024'te Chien-Yao Wang ve Hong-Yuan Mark Liao tarafından tanıtılmıştır, YOLOv9 derin sinir ağlarının doğasında bulunan "bilgi darboğazı" sorununu hedefler. Veriler birbirini izleyen katmanlardan geçerken (özellik çıkarma), önemli bilgiler kaybolabilir ve özellikle küçük veya tespit edilmesi detect nesneler için doğruluğun azalmasına neden olabilir.
Teknik Detaylar:
- Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
- Organizasyon:Bilgi Bilimleri Enstitüsü, Academia Sinica
- Tarih: 2024-02-21
- Arxiv:Programlanabilir Gradyan Bilgisini Kullanarak Öğrenmek İstediğinizi Öğrenmek
- GitHub:WongKinYiu/yolov9
Mimari ve Temel Yenilikler
YOLOv9 , ağın mümkün olduğunca çok girdi bilgisini tutmasını ve kullanmasını sağlamak için yeni kavramlar getirmektedir.
- Programlanabilir Gradyan Bilgisi (PGI): PGI, ağ ağırlıklarını güncellemek için güvenilir gradyanlar üreten yardımcı bir denetim çerçevesi sağlar. Bu, derin katmanların eksiksiz girdi bilgisi almasını sağlayarak kaybolan gradyan sorununu hafifletir ve yakınsamayı iyileştirir.
- Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN): Bu yeni mimari, önceki sürümlerde kullanılan geleneksel ELAN'ın yerini almıştır. GELAN, parametre kullanımını ve hesaplama verimliliğini (FLOP'lar) optimize ederek YOLOv9 'un öncekilerle karşılaştırılabilir bir model boyutuyla daha yüksek doğruluk elde etmesini sağlar.
Derin Öğrenme İçgörüsü
YOLOv9'un bilgi tutmaya odaklanması, aksi takdirde alt örnekleme işlemleri sırasında özellik ayrıntılarının kaybolabileceği karmaşık sahnelerdeki nesneleri tespit etmede son derece güçlü olmasını sağlar. backbone.
YOLOv9 hakkında daha fazla bilgi edinin
Performans Ölçütleri: Hız ve Doğruluk
Bu iki model arasındaki seçim genellikle ham çıkarım hızı ve tespit hassasiyeti arasındaki bir değiş tokuşa bağlıdır. Aşağıdaki tablo, çeşitli model ölçeklerindeki performans farklılıklarını vurgulamaktadır.
Analiz:
- Gecikme süresi: YOLOv10 , özellikle daha küçük model boyutlarında (N ve S) gecikme süresinde YOLOv9 'dan sürekli olarak daha iyi performans göstermektedir. Örneğin, YOLOv10n, TensorRT'de 1,56 ms' lik bir çıkarım hızına ulaşarak karşılaştırılabilir modellerden önemli ölçüde daha hızlıdır.
- Doğruluk: YOLOv9 , spektrumun üst ucunda doğruluk açısından üstündür. YOLOv9e modeli %55,6'lık olağanüstü bir mAP elde ederek hassasiyetin çok önemli olduğu uygulamalar için üstün bir seçimdir.
- Verimlilik: YOLOv10 , parametre başına mükemmel doğruluk sunar. YOLOv10b, YOLOv9c'den daha düşük gecikme süresiyle %52,7 mAP elde ederek bütünsel tasarımının etkinliğini göstermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
İdeal Kullanım Senaryoları
Her modelin güçlü yönlerini anlamak, özel proje hedefleriniz için doğru aracı seçmenize yardımcı olur.
YOLOv10 Ne Zaman Seçilmeli
- Uç Yapay Zeka Dağıtımı: NVIDIA Jetson veya Raspberry Pi gibi cihazlarda çalışan uygulamalar, CPU ek yükünü azaltan NMS tasarımdan yararlanır.
- Yüksek Frekanslı Video Analizi: Trafik izleme veya spor analitiği gibi yüksek FPS video akışlarının işlenmesini gerektiren senaryolar.
- Gerçek Zamanlı Robotik: Navigasyon ve engellerden kaçınma için düşük gecikmeli geri bildirim döngülerine dayanan otonom sistemler.
YOLOv9 Ne Zaman Seçilmeli
- Yüksek Hassasiyetli Denetim: Bir kusuru gözden kaçırmanın (yanlış negatif) maliyetli olduğu endüstriyel kalite kontrolü.
- Küçük Nesne Algılama: Nesnelerin küçük ve özellik bakımından fakir olduğu uydu görüntüleri analizi veya tıbbi görüntüleme içeren uygulamalar.
- Karmaşık Sahneler: Nesneleri ayırt etmek için maksimum bilgi tutmanın gerekli olduğu yüksek oklüzyon veya karmaşanın olduğu ortamlar.
Ultralytics ile Kullanım
Bu modelleri kullanmanın önemli avantajlarından biri de Ultralytics ekosistemine entegrasyonlarıdır. Hem YOLOv10 hem de YOLOv9 , aynı birleşik Python API ve Komut Satırı ArayüzüCLI) aracılığıyla kullanılabilir ve eğitimden dağıtıma kadar iş akışını basitleştirir.
Python Örneği
Aşağıdaki kod, her iki modelle de çıkarımın nasıl yükleneceğini ve çalıştırılacağını göstermektedir ultralytics paketi.
from ultralytics import YOLO
# Load a YOLOv10 model (NMS-free, high speed)
model_v10 = YOLO("yolov10n.pt")
# Load a YOLOv9 model (High accuracy)
model_v9 = YOLO("yolov9c.pt")
# Run inference on an image
# The API remains consistent regardless of the underlying architecture
results_v10 = model_v10("https://ultralytics.com/images/bus.jpg")
results_v9 = model_v9("https://ultralytics.com/images/bus.jpg")
# Print results
for r in results_v10:
print(f"YOLOv10 Detections: {r.boxes.shape[0]}")
for r in results_v9:
print(f"YOLOv9 Detections: {r.boxes.shape[0]}")
Ultralytics Avantajı
Bilgisayarla görme projeleriniz için Ultralytics 'i seçmek, model mimarisinin ötesinde çeşitli avantajlar sunar:
- Kullanım Kolaylığı: Kullanıcı dostu API, YOLOv9, YOLOv10 ve aşağıdaki gibi diğer modeller arasında geçiş yapmanızı sağlar YOLO11 sadece ağırlık dosyası adını değiştirerek.
- Performans Dengesi: Ultralytics uygulamaları, hız ve doğruluğu dengeleyerek gerçek dünya performansı için optimize edilmiştir.
- Eğitim Verimliliği: Çerçeve, otomatik karışık hassasiyet (AMP) ve çoklu GPU eğitimi gibi özellikleri destekleyerek kendi veri kümelerinizde özel modelleri eğitmeyi kolaylaştırır.
- Bellek Gereksinimleri: Ultralytics modelleri tipik olarak transformatör tabanlı alternatiflere kıyasla daha düşük bellek kullanımı sergiler ve tüketici sınıfı GPU'larda eğitimi kolaylaştırır.
Sonuç
Her ikisi de YOLOv10 ve YOLOv9 nesne tespitinde önemli kilometre taşlarını temsil etmektedir. YOLOv10 yenilikçi NMS mimarisi sayesinde hız ve verimliliğe öncelik veren uygulamalar için açık ara galiptir. Tersine, YOLOv9 mümkün olan en yüksek doğruluk ve bilgi tutma gerektiren senaryolar için sağlam bir seçim olmaya devam etmektedir.
En yeni ve çok yönlü çözümü arayan geliştiriciler için ayrıca şunları keşfetmenizi öneririz YOLO11. YOLO11 , bu öncüllerin güçlü yönlerini temel alarak algılama, segmentasyon ve poz tahmini görevleri için rafine bir hız, doğruluk ve özellik dengesi sunar.
Diğer Modelleri İnceleyin
- Ultralytics YOLO11 - En son teknoloji ürünü model.
- Ultralytics YOLOv8 - Çeşitli görme görevleri için çok yönlü ve olgun bir model.
- RT-DETR - Yüksek doğruluklu uygulamalar için transformatör tabanlı bir dedektör.