İçeriğe geç

Model Karşılaştırması: Nesne Algılama için YOLOv7 ve YOLOv8

Bilgisayarla görmenin hızla gelişen ortamında, "You Only Look Once"YOLO) model ailesi, gerçek zamanlı nesne algılama standardını sürekli olarak belirlemiştir. Bu serideki iki önemli kilometre taşı YOLOv7 ve Ultralytics YOLOv8'dir. Her iki model de piyasaya sürüldüklerinde doğruluk ve hız sınırlarını zorlarken, farklı tasarım felsefelerini ve ekosistem olgunluklarını temsil etmektedir.

Bu kılavuz, geliştiricilerin ve araştırmacıların akademik araştırmadan üretim sınıfı dağıtıma kadar kendi özel ihtiyaçları için doğru aracı seçmelerine yardımcı olmak için ayrıntılı bir teknik karşılaştırma sağlar.

Performans Metriklerinin Karşılaştırılması

Aşağıdaki tablo, temel YOLOv7 ve YOLOv8 modelleri arasındaki performans ölçümlerinin doğrudan bir karşılaştırmasını sunmaktadır. YOLOv8 , çıkarım hızında önemli bir avantaj ve özellikle uç yapay zeka uygulamaları için kritik olan daha küçük model varyantlarında uygun bir parametre sayısı göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

YOLOv7: "Bedava Çanta" Evrimi

Temmuz 2022'de piyasaya sürülen YOLOv7 , öncelikle YOLOv4 ve YOLOR'un yazarları tarafından geliştirilmiştir. Çıkarım maliyetlerini artırmadan eğitim sürecini optimize etmeyi amaçlayan ve "eğitilebilir ücretsiz çanta" olarak adlandırılan bir kavram olan çeşitli mimari yenilikler getirmiştir.

  • Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
  • Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
  • Tarih: 2022-07-06
  • Bağlantılar:Arxiv Paper | GitHub Repository

Temel Mimari Özellikler

YOLOv7 , Genişletilmiş Verimli Katman Toplama Ağını (E-ELAN) tanıttı. Bu mimari, ağın daha çeşitli özellikleri öğrenmesini sağlamak için en kısa ve en uzun gradyan yollarını kontrol eder. Ayrıca, mimarinin derinliğini ve genişliğini aynı anda değiştirerek farklı boyutlarda optimum performans sağlayan model ölçeklendirme tekniklerini kullanmıştır.

Lansmandaki etkileyici kıyaslamalarına rağmen, YOLOv7 öncelikle nesne algılamaya odaklanıyor ve yeni çerçevelere kıyasla diğer görevler için daha az entegre destek sunuyor.

YOLOv7 hakkında daha fazla bilgi edinin

Ultralytics YOLOv8: Birleşik Çerçeve ve Modern Mimari

2023 yılının başlarında Ultralytics tarafından piyasaya sürülen YOLOv8 , YOLO mimarisinde büyük bir revizyonu temsil ediyordu. Sadece bir model olarak değil, algılama, örnek segmentasyonu, poz tahmini ve sınıflandırmayı sorunsuz bir şekilde gerçekleştirebilen birleşik bir çerçeve olarak tasarlandı.

Mimari Yenilikler

YOLOv8 , önceki sürümlerde ( YOLOv7 dahil) kullanılan çapa tabanlı tespitten uzaklaşarak çapasız bir tespit mekanizmasına geçmiştir. Bu değişim, çapa kutularını hesaplama ihtiyacını ortadan kaldırarak eğitim sürecini basitleştirir ve modeli nesne şekli ve boyutundaki değişikliklere karşı daha sağlam hale getirir.

backbone , C3 modüllerinin yerini alan C2f modüllerini (iki konvolüsyonlu Çapraz Aşamalı Kısmi Darboğaz) kullanacak şekilde yükseltilmiştir. YOLOv5. Bu değişiklik gradyan akışını iyileştirir ve modelin daha zengin özellik bilgilerini yakalarken hafif kalmasını sağlar.

YOLOv8 hakkında daha fazla bilgi edinin

Detaylı Teknik Karşılaştırma

Ankraj Tabanlı ve Ankrajsız

En belirleyici farklılıklardan biri algılama kafasıdır. YOLOv7 , modelin nesnelerle eşleştirmeye çalıştığı önceden tanımlanmış şekiller olan bağlantı kutularına dayanır. Etkili olsa da bu, özel veri kümeleri için hiperparametre ayarı gerektirir.

Buna karşılık YOLOv8 , bir nesnenin merkezini doğrudan tahmin ederek çapasız bir yaklaşım kullanır. Bu, kutu tahminlerinin sayısını azaltarak Maksimum Olmayan BastırmayıNMS) hızlandırır ve modelin manuel çapa yapılandırması olmadan çeşitli veriler üzerinde eğitilmesini kolaylaştırır.

Eğitim Verimliliği ve Bellek Kullanımı

Ultralytics modelleri mühendislik verimliliği ile ünlüdür. YOLOv8 , eğitimin son dönemlerinde Mozaik artırmayı devre dışı bırakan akıllı bir veri artırma stratejisi kullanır. Bu teknik, eğitim kaybını dengeler ve hassasiyeti artırır.

Bellek Verimliliği

Ultralytics YOLOv8 'in transformatörler gibi karmaşık mimarilere göre önemli bir avantajı (örn, RT-DETR) daha düşük CUDA bellek gereksinimidir. Bu, kullanıcıların tüketici sınıfı GPU'larda daha büyük parti boyutlarını eğitmesine olanak tanıyarak son teknoloji model eğitimine erişimi demokratikleştirir.

Ekosistem ve Kullanım Kolaylığı

YOLOv7 güçlü bir araştırma deposu olsa da, Ultralytics YOLOv8 cilalı bir ürün deneyimi sunar. Ultralytics ekosistemi şunları sağlar:

  1. Kolaylaştırılmış API: Tüm görevler için tutarlı bir Python arayüzü.
  2. Dağıtım: Dışa Aktarma modu aracılığıyla ONNX, TensorRT, CoreML ve TFLite gibi formatlara tek tıkla dışa aktarma.
  3. Topluluk Desteği: Aktif bir Discord topluluğu ve en son PyTorch sürümleriyle uyumluluğu sağlayan sık güncellemeler.

Kod Karşılaştırması

Kullanılabilirlik açığı, çıkarımı çalıştırmak için gereken kod karşılaştırıldığında açıkça görülmektedir. Ultralytics , düşük kodlu bir yaklaşıma öncelik vererek geliştiricilerin vizyon yapay zekasını minimum ek yük ile uygulamalara entegre etmelerine olanak tanır.

YOLOv8 'i Python ile Çalıştırma

from ultralytics import YOLO

# Load a pre-trained YOLOv8 model
model = YOLO("yolov8n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
for result in results:
    result.show()

CLI Uygulaması

YOLOv8 , boru hattı entegrasyonunu ve hızlı testi basitleştiren bir özellik olarak doğrudan komut satırından da çalıştırılabilir.

# Detect objects in an image using the nano model
yolo predict model=yolov8n.pt source='https://ultralytics.com/images/zidane.jpg' imgsz=640

İdeal Kullanım Senaryoları

YOLOv7 ne zaman kullanılmalı

YOLOv7 , 2022/2023 standartlarına göre kıyaslama yapan veya özellikle Darknet tarzı mimari etrafında inşa edilmiş eski sistemleri sürdüren araştırmacılar için uygun bir seçim olmaya devam etmektedir. "Beleşçi torba" yaklaşımı, sinir ağı optimizasyon stratejilerini inceleyenler için ilginç bilgiler sunuyor.

YOLOv8 ne zaman kullanılmalı

YOLOv8 , aşağıdakiler de dahil olmak üzere yeni projelerin büyük çoğunluğu için önerilen seçimdir:

  • Gerçek Zamanlı Uygulamalar: YOLOv8n (nano) modeli inanılmaz hızlar ( CPU'da yaklaşık 80 ms) sunarak mobil uygulamalar ve gömülü sistemler için mükemmeldir.
  • Çoklu Görev Ardışık Düzenleri: Algılamanın yanı sıra poz tahmini veya segmentasyon gerektiren projeler tek bir API kullanabilir.
  • Ticari Dağıtım: Sağlam dışa aktarma uyumluluğu, PyTorch 'ta eğitilen modellerin TensorRT veya OpenVINO kullanılarak üretim ortamlarına verimli bir şekilde dağıtılabilmesini sağlar.

Sonuç

YOLOv7 ise eğitilebilir parametreleri optimize ederek bilgisayarla görme alanına önemli katkılarda bulunmuştur, Ultralytics YOLOv8 pratik yapay zeka gelişimi için modern standardı temsil etmektedir.

YOLOv8'in üstün hız ve doğruluk dengesi, çapasız tasarım ve kapsamlı Ultralytics destek ekosistemi ile birleştiğinde, yeni başlayanlar için daha erişilebilir ve uzmanlar için daha güçlü hale gelir. Ölçeklenebilir, bakımı yapılabilir ve yüksek performanslı görüntü uygulamaları oluşturmak isteyen geliştiriciler için YOLOv8ve YOLO11-ileriye dönük en ikna edici yolu sunmaktadır.

Daha Fazla Okuma

Nesne algılama alanındaki en son gelişmeleri keşfetmek isteyenler, bu ilgili modelleri incelemeyi düşünebilirler:

  • YOLO11: Ultralytics'in en son yinelemesi, daha da fazla verimlilik için mimariyi iyileştiriyor.
  • YOLOv6: Endüstriyel uygulamalara odaklanan bir başka çapasız model.
  • YOLOv9: Derin ağ eğitimi için Programlanabilir Gradyan Bilgisine (PGI) odaklanır.

Yorumlar