İçeriğe geç

YOLOv10 vs. YOLOv10: Nesne Algılama Evrimine Derinlemesine Bir Bakış

Doğru nesne algılama modelini seçmek, dağıtım maliyetlerinden kullanıcı deneyimine kadar her şeyi etkileyen çok önemli bir karardır. Bu teknik karşılaştırma, Alibaba Group'un araştırma odaklı bir modeli olan YOLO ile YOLOv10Tsinghua Üniversitesi'ndeki araştırmacılar tarafından geliştirilen ve Ultralytics ekosistemine entegre edilen en yeni gerçek zamanlı uçtan uca dedektör.

Her iki model de hız ve doğruluk arasındaki dengeyi optimize etmeyi amaçlasa da, büyük ölçüde farklı mimari stratejiler kullanmaktadır. Bu analiz, bilgisayarla görmenin karmaşık ortamında gezinmenize yardımcı olmak için teknik özelliklerini, performans ölçümlerini ve ideal kullanım durumlarını incelemektedir.

Performans Metrikleri

Aşağıdaki tablo, COCO veri setindeki verimlilik ve doğruluğun doğrudan bir karşılaştırmasını sunmaktadır. Temel çıkarımlar arasında parametre verimliliği ve çıkarım hızları yer almaktadır. YOLOv10NMS tasarımı sayesinde önemli avantajlar sergiler.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

YOLO: Araştırma Odaklı İnovasyon

2022 yılının sonlarında piyasaya sürülen YOLO , Alibaba Group'un gelişmiş nöral mimari arama ve yeni özellik füzyon teknikleri aracılığıyla YOLO dedektörlerin sınırlarını zorlamak için gösterdiği önemli bir çabayı temsil ediyor.

Teknik Ayrıntılar:
Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, et al.
Organizasyon:Alibaba Group
Tarih: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHub:YOLO

DAMO-YOLO hakkında daha fazla bilgi edinin

Mimari ve Temel Özellikler

YOLO , performansına ulaşmak için çeşitli son teknoloji konseptleri entegre etmektedir:

  1. Nöral Mimari Arama (NAS): Manuel olarak tasarlanmış omurgalara sahip modellerin aksine YOLO , verimli ağ yapılarını otomatik olarak keşfetmek için MAE-NAS'ı kullanır ve belirli donanım kısıtlamaları için ağın derinliğini ve genişliğini optimize eder.
  2. RepGFPN Boyun: Bu özellik piramidi ağı, özellik füzyonunu verimli bir şekilde yönetmek için yeniden parametrelendirme kullanır. Daha basit çıkarım zamanı bloklarına dönüşen karmaşık eğitim zamanı yapılarına izin vererek hızı artırırken doğruluğu korur.
  3. ZeroHead & Al ignedOTA: Model, algılama kafasının karmaşıklığını azaltmak için bir "ZeroHead" tasarımı kullanır ve eğitim sırasında etiket atamasını ele almak için AlignedOTA (Optimal Taşıma Ataması) kullanır ve sınıflandırma ile regresyon görevleri arasındaki yanlış hizalama sorunlarını çözer.

Karmaşıklık Değerlendirmesi

YOLO etkileyici yenilikler sunarken, NAS ve özel bileşenlere olan bağımlılığı, eğitim hattını daha karmaşık hale getirebilir ve kapsamlı ayarlama yapmadan çeşitli donanımlarda hızlı özelleştirme veya dağıtım gerektiren geliştiriciler için daha az erişilebilir hale getirebilir.

Güçlü ve Zayıf Yönler

  • Güçlü yönler: YOLO , özellikle piyasaya sürülme zamanı için güçlü bir doğruluk sunar ve daha küçük modeller için damıtma iyileştirmesi gibi yeni kavramlar getirmiştir.
  • Zayıf Yönler: YOLO 'yu çevreleyen ekosistem öncelikle MMDetection çerçevesine bağlıdır ve bu da kullanıcı dostu Ultralytics ekosistemine kıyasla daha dik bir öğrenme eğrisi sunabilir. Ayrıca, gecikme ekleyen geleneksel NMS post-processing gerektirir.

YOLOv10: Uçtan Uca Gerçek Zamanlı Algılama Çağı

Tsinghua Üniversitesi'ndeki araştırmacılar tarafından Mayıs 2024'te piyasaya sürülen YOLOv10, YOLO serisinde bir paradigma değişikliğini temsil ediyor. Maksimum Olmayan BastırmaNMS) ihtiyacını ortadan kaldırarak, gerçek uçtan uca performans elde eder ve çıkarım gecikmesini önemli ölçüde azaltır.

Teknik Ayrıntılar:
Yazarlar: Ao Wang, Hui Chen, Lihao Liu, et al.
Organizasyon:Tsinghua Üniversitesi
Tarih: 2024-05-23
Arxiv:https://arxiv.org/abs/2405.14458
GitHub:https://github.com/THU-MIG/yolov10
Docs:ultralytics


YOLOv10 hakkında daha fazla bilgi edinin

Mimari ve Yenilikler

YOLOv10 , hem mimariyi hem de işlem sonrası boru hattını hedef alarak bütünsel verimliliğe odaklanmaktadır:

  1. NMS'siz Tasarım: Tutarlı İkili Atamalar adı verilen bir strateji sayesinde YOLOv10 hem bire-çok hem de bire-bir etiket atamaları ile eğitim yapar. Bu, modelin çıkarım sırasında her nesne için tek bir en iyi kutuyu tahmin etmesini sağlayarak NMS 'yi geçersiz kılar. Bu, işlem sonrası süreçlerin sıklıkla darboğaza dönüşebildiği gerçek zamanlı çıkarım için kritik bir avantajdır.
  2. Bütünsel Verimlilik-Doğruluk Tasarımı: Mimari, hafif bir sınıflandırma kafasına ve uzamsal kanal ayrıştırmalı alt örneklemeye sahiptir. Bu optimizasyonlar hesaplama fazlalığını azaltarak önceki nesillere kıyasla daha düşük FLOP ve parametre sayılarına yol açar.
  3. Sıralama Güdümlü Blok Tasarımı: Model, verimliliğin gerekli olduğu yerlerde kompakt ters çevrilmiş bloklar (CIB) ve özellik geliştirmenin kritik olduğu yerlerde kısmi öz dikkat (PSA) kullanarak farklı aşamaların fazlalığına göre dahili blok tasarımını uyarlar.

Ultralytics ile Kullanım Kolaylığı

YOLOv10 'un en önemli avantajlarından biri, Ultralytics ekosistemine sorunsuz entegrasyonudur. Geliştiriciler, YOLOv10 için kullanılan aynı basit API'yi kullanarak YOLOv10 'u eğitebilir, doğrulayabilir ve dağıtabilir YOLOv8 ve YOLO11.

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Train the model on your custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

Karşılaştırmalı Analiz

YOLOv10 karşılaştırıldığında, aralarındaki fark verimlilik yaklaşımlarında ve operasyonel ekosistemlerinde yatmaktadır.

Hız ve Gecikme

YOLOv10 gerçek dünya gecikmesinde belirgin bir avantaja sahiptir. Standart YOLO modelleri (ve YOLO), çakışan sınırlayıcı kutuları filtrelemek için Maksimum Olmayan Bastırma (NMS) gerektirir. NMS yürütme süresi, tespit edilen nesnelerin sayısına göre değişir ve öngörülemeyen gecikmelere neden olur. YOLOv10'un uçtan uca tasarımı deterministik gecikme süresi sağlayarak otonom sürüş veya yüksek hızlı endüstriyel robotik gibi zaman açısından kritik uygulamalar için üstünlük sağlar.

Kaynak Verimliliği

Performans tablosunda gösterildiği gibi, YOLOv10s, YOLO 'den (%46,0) daha yüksek bir mAP (%46,7) elde ederken, parametrelerin yarısından daha azını (7,2M'ye karşı 16,3M) kullanmaktadır. Bu azaltılmış bellek ayak izi, uç dağıtım için çok önemlidir. Ultralytics modelleri, hem eğitim hem de çıkarım sırasında daha düşük bellek gereksinimleriyle ünlüdür ve diğer mimarilerin Bellek Dışı (OOM) hatalarıyla mücadele edebileceği tüketici sınıfı GPU'larda eğitime olanak tanır.

Ekosistem ve Destek

YOLO sağlam bir akademik katkı olsa da, YOLOv10 bakımlı Ultralytics ekosisteminden faydalanmaktadır. Buna aşağıdakiler dahildir:

  • Aktif Geliştirme: Sık güncellemeler ve hata düzeltmeleri.
  • Topluluk Desteği: GitHub ve Discord'da büyük bir geliştirici topluluğu.
  • Dokümantasyon: Veri artırmadan dağıtıma kadar her şeyi kapsayan kapsamlı dokümantasyon.
  • Eğitim Verimliliği: Otomatik karışık hassasiyet (AMP) ve çoklu GPU eğitimi gibi özellikleri kutudan çıktığı anda destekleyen kolaylaştırılmış rutinler.

Tespitin Ötesinde

Projeniz örnek segmentasyonu, poz tahmini veya yönlendirilmiş nesne algılama (OBB)gibi sınırlayıcı kutuların ötesinde çok yönlülük gerektiriyorsa YOLO11 veya YOLOv8. YOLOv10 saf tespitte üstünlük sağlarken, daha geniş Ultralytics ailesi bu karmaşık çoklu görev ihtiyaçları için son teknoloji çözümler sunar.

İdeal Kullanım Senaryoları

YOLOv10 Ne Zaman Seçilmeli

  • Edge AI ve IoT: Düşük parametre sayısı (örneğin, 2,3M parametrede YOLOv10n) Raspberry Pi veya NVIDIA Jetson gibi cihazlar için mükemmeldir.
  • Gerçek Zamanlı Video Analitiği: NMS 'nin ortadan kaldırılması, trafik izleme veya güvenlik beslemeleri için gerekli olan tutarlı kare hızları sağlar.
  • Hızlı Gelişim: Verilerden dağıtıma hızlı bir şekilde geçmesi gereken ekipler sezgisel özelliklerden faydalanacaktır ultralytics Python API ve Ultralytics HUB.

DAMO-YOLO'yu Ne Zaman Düşünmeli

  • Akademik Araştırma: Sinirsel Mimari Arama (NAS) veya özellik piramidi optimizasyonu üzerine çalışan araştırmacılar YOLO'nun mimarisini değerli bir referans olarak bulabilirler.
  • Eski Boru Hatları: MMDetection çerçevesine derinlemesine entegre olmuş projeler, YOLO 'yu benimsemeyi çerçeveleri değiştirmekten daha kolay bulabilir.

Sonuç

Her iki model de bilgisayarla görme alanında önemli kilometre taşlarını temsil etmektedir. YOLO , 2022 yılında NAS ve gelişmiş özellik füzyonunun gücünü sergilemiştir. Ancak, 2024 ve sonrasındaki modern uygulamalar için, YOLOv10 daha cazip bir paket sunuyor. NMS uçtan uca mimarisi, nesne algılamada uzun süredir devam eden bir darboğazı çözerken, Ultralytics ekosistemine entegrasyonu erişilebilir, bakımı yapılabilir ve dağıtımı kolay olmasını sağlar.

Hız, doğruluk ve kullanım kolaylığı arasında en iyi dengeyi arayan geliştiriciler için YOLOv10, çok yönlü YOLO11-Sağlam yapay zeka çözümleri oluşturmak için üstün bir seçim olarak öne çıkıyor.


Yorumlar