İçeriğe geç

YOLOv10 vs YOLOv7: Gerçek Zamanlı Nesne Algılama Mimarisinde İlerleme

YOLO (You Only Look Once) ailesinin gelişimi, gerçek zamanlı uygulamalar için hız ve doğruluğu dengeleyerek bilgisayarla görmenin sınırlarını sürekli olarak zorlamıştır. Bu karşılaştırma, aşağıdakiler arasındaki mimari değişimleri ve performans farklılıklarını araştırmaktadır YOLOv10Tsinghua Üniversitesi'nden araştırmacılar tarafından yayınlanan son teknoloji ürünü bir model ve YOLOv7Academia Sinica tarafından geliştirilen oldukça etkili bir modeldir. Her iki model de nesne algılama alanına önemli katkılarda bulunmuş olsa da, performans hedeflerine ulaşmak için farklı stratejiler kullanmaktadırlar.

Model Mimarilerinin Evrimi

YOLOv7 'den YOLOv10 'a geçiş, sinir ağlarının post-processing ve özellik entegrasyonunu nasıl ele aldığı konusunda bir paradigma değişikliğine işaret ediyor.

YOLOv10: NMS'siz Devrim

YOLOv10Tsinghua Üniversitesi'nden Ao Wang, Hui Chen ve diğerleri tarafından 23 Mayıs 2024'te yayınlanan bu rapor, çığır açan NMS bir eğitim stratejisi sunuyor. Geleneksel olarak, nesne dedektörleri yinelenen sınırlayıcı kutuları filtrelemek için Maksimum Olmayan Bastırma 'ya (NMS) güvenir ve bu da çıkarım gecikmesinde bir darboğaz yaratabilir.

YOLOv10 , NMS eğitim için Tutarlı İkili Atamaları kullanarak modelin benzersiz nesne örneklerini doğrudan tahmin etmesini sağlar. Bütünsel bir verimlilik-doğruluk odaklı model tasarımı ile birlikte, hesaplama fazlalığını azaltmak için hafif sınıflandırma kafası ve uzamsal-kanal ayrıştırılmış alt örnekleme dahil olmak üzere çeşitli bileşenleri optimize eder.

YOLOv10 hakkında daha fazla bilgi edinin

YOLOv7: Eğitilebilir Ücretsiz Çantalar için Optimize Edildi

YOLOv7Academia Sinica'dan Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao tarafından 6 Temmuz 2022 tarihinde yayınlanan bu rapor, çıkarım maliyetini artırmadan eğitim sürecini optimize etmeye odaklanmaktadır. Gradyan yolunu kontrol ederek ağın öğrenme kabiliyetini artıran Genişletilmiş Verimli Katman Toplama Ağı'nı (E-ELAN) tanıtmıştır.

YOLOv7 , çıkarım hızını etkilemeden eğitim sırasında doğruluğu artıran "Bag-of-Freebies" yöntemlerinden ve parametreleri verimli bir şekilde birleştiren model ölçeklendirme tekniklerinden yoğun bir şekilde yararlanır. Oldukça etkili olmasına rağmen, geleneksel NMS son işlemeye dayanması, uçtan uca gecikmesinin genellikle daha yeni NMS mimarilerden daha yüksek olduğu anlamına gelir.

YOLOv7 hakkında daha fazla bilgi edinin

Teknik Performans Karşılaştırması

Bu modeller değerlendirildiğinde, verimlilik ve ham tespit kabiliyetine ilişkin farklı modeller ortaya çıkmaktadır. YOLOv10 , YOLOv7'ye kıyasla önemli ölçüde daha az parametre ve daha hızlı çıkarım süreleri ile benzer veya daha iyi mAP (Ortalama Ortalama Hassasiyet) elde ederek genellikle üstün verimlilik sunar.

Aşağıdaki tablo COCO veri setindeki temel ölçütleri özetlemektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Verimlilik İçgörüsü

Veriler, kaynakların kısıtlı olduğu ortamlarda YOLOv10 için kritik bir avantajı vurgulamaktadır. YOLOv10m, YOLOv7l (%51,4 mAP) ile neredeyse aynı doğruluğa (%51,3 mAP) ulaşır ancak bunu yarıdan daha az parametre (15,4M vs 36,9M) ve önemli ölçüde daha düşük FLOP (59,1B vs 104,7B) ile yapar.

Gecikme Süresi ve Verim

YOLOv10'un NMS adımını kaldırması, kalabalık sahnelerde sıklıkla görülen gecikme varyansını büyük ölçüde azaltır. Her milisaniyenin önemli olduğu otonom araçlar veya drone gözetimi gibi uygulamalarda, YOLOv10 'un öngörülebilir çıkarım süresi güvenlik açısından kritik bir avantaj sağlar. YOLOv7 , üst düzey GPU'larda verim açısından rekabetçi olmaya devam ediyor, ancak karşılaştırılabilir sonuçlar elde etmek için daha fazla bellek ve hesaplama tüketiyor.

Kullanım Alanları ve Uygulamalar

Mimari farklılıklar, her model için ideal dağıtım senaryolarını belirler.

YOLOv10 için İdeal Senaryolar

  • Edge AI: Düşük parametre sayısı ve FLOP'ları nedeniyle YOLOv10 , Raspberry Pi veya NVIDIA Jetson gibi cihazlar için mükemmeldir.
  • Gerçek Zamanlı Video Analitiği: Yüksek çıkarım hızı, trafik yönetimi ve perakende analitiği için yüksek FPS işlemeyi destekler.
  • Robotik: Daha düşük gecikme, robot navigasyonu ve manipülasyon görevleri için daha hızlı tepki süreleri anlamına gelir.

YOLOv7 için İdeal Senaryolar

  • Eski Sistemler: YOLOv7 kod tabanı ile halihazırda entegre olan projeler, bu kod tabanını hemen yeniden düzenleme yapmadan sürdürmek için yeterince kararlı bulabilir.
  • Genel Amaçlı Algılama: VRAM'in bol olduğu sunucu tarafı dağıtımları için, YOLOv7'nin daha büyük modelleri, aşağıdaki gibi yeni alternatiflerden daha az verimli olsalar da, hala sağlam algılama yetenekleri sağlar YOLO11.

Ultralytics Avantajı

Her iki model de güçlü olsa da, Ultralytics ekosisteminden yararlanmak geliştiriciler ve araştırmacılar için farklı avantajlar sunar. Ultralytics çerçevesi, eğitim, doğrulama ve dağıtım için arayüzü standartlaştırarak modeller arasında geçiş yapmayı ve performansı kıyaslamayı önemli ölçüde kolaylaştırır.

Kullanım Kolaylığı ve Eğitim Verimliliği

Derin öğrenmenin önündeki başlıca engellerden biri eğitim işlem hatlarının karmaşıklığıdır. YOLOv10 dahil olmak üzere Ultralytics modelleri ve YOLO11veri artırma, hiperparametre ayarlama ve dışa aktar ma işlemlerini otomatik olarak gerçekleştiren kolaylaştırılmış bir Python API kullanır.

  • Basit API: Birkaç satır kodla bir modeli eğitin.
  • Bellek Verimliliği: Ultralytics optimizasyonları genellikle eğitim sırasında ham uygulamalara kıyasla daha düşük CUDA bellek kullanımı ile sonuçlanır.
  • Önceden Eğitilmiş Ağırlıklar: Yüksek kaliteli önceden eğitilmiş modellere erişim ImageNet ve COCO transfer öğrenimini hızlandırır.

Görevler Arasında Çok Yönlülük

Modern Ultralytics modelleri basit sınırlayıcı kutu tespitinin ötesine geçer. Aynı çerçeve içinde Örnek Segmentasyonu, Poz Tahmini, Yönlendirilmiş Nesne Algılama (OBB) ve Sınıflandırmayı desteklerler. Bu çok yönlülük, eski bağımsız depolara göre önemli bir avantajdır.

Kod Örneği: YOLOv10 'u Ultralytics ile Çalıştırma

Aşağıdaki örnek, önceden eğitilmiş bir YOLOv10 modelini yüklemek ve çıkarımı çalıştırmak için Ultralytics API'sini kullanmanın basitliğini göstermektedir. Bu kullanım kolaylığı, YOLOv7 gibi eski mimariler için genellikle gerekli olan daha manuel kurulumla tezat oluşturmaktadır.

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Run inference on an image
results = model("path/to/image.jpg")

# Display the results
results[0].show()

Sonuç ve Öneri

Yeni projeler için, YOLOv10 veya daha da gelişmiş YOLO11 önerilen seçeneklerdir. YOLOv10'un NMS mimarisi, üstün bir hız ve doğruluk dengesi sunarak onu modern uç bilişim ihtiyaçları için son derece uyarlanabilir hale getirir. Hesaplama ayak izini azaltırken önceki nesillerin gecikme darboğazlarını giderir.

Her ne kadar YOLOv7 bilgisayarla görme tarihinde saygın bir kilometre taşı olmaya devam etse de, mimarisi günümüz standartlarına göre daha az verimlidir. En iyi performansı, uzun vadeli bakımı ve dağıtım kolaylığını arayan geliştiriciler, sürekli güncellemeleri ve geniş araç desteği ileUltralytics ekosistemini, görsel yapay zeka çözümleri oluşturmak için en verimli ortam olarak göreceklerdir.

Daha fazlasını keşfedin


Yorumlar