İçeriğe geç

YOLOv10 - YOLOv5 Karşılaştırması: Mimari ve Performans Derinlemesine İnceleme

Bilgisayar görüşü alanındaki hızlı gelişmelerde, doğru nesne algılama modelini seçmek proje başarısı için kritik öneme sahiptir. Bu karşılaştırma, NMS'siz eğitime odaklanan yakın tarihli bir akademik sürüm olan YOLOv10 ile Ultralytics'in sağlamlığı ve sektör çapında benimsenmesiyle tanınan efsanevi modeli YOLOv5 arasındaki teknik farklılıkları incelemektedir. Her iki model de You Only Look Once soyundan gelmesine rağmen, farklı mühendislik önceliklerine ve dağıtım ortamlarına hitap etmektedir.

Model Genel Bakışları

YOLOv10: Verimlilik Uzmanı

Mayıs 2024'te Tsinghua Üniversitesi'ndeki araştırmacılar tarafından piyasaya sürülen YOLOv10, çıkarım sırasında Non-Maximum Suppression (NMS) ihtiyacını ortadan kaldırmak için tasarlanmış mimari mekanizmalar sunmaktadır. Eğitim sırasında tutarlı çift atamalar kullanarak YOLOv10, uçtan uca gecikmeyi azaltmayı amaçlamaktadır ve bu da onu her milisaniyelik çıkarım gecikmesinin önemli olduğu uç uygulamalar için güçlü bir aday haline getirmektedir.

YOLOv10 hakkında daha fazla bilgi edinin

Ultralytics YOLOv5: Endüstri Standardı

2020'de piyasaya sürülmesinden bu yana UltralyticsYOLOv5 , yapay zeka topluluğunda kullanım kolaylığını tanımlamıştır. Hız, doğruluk ve mühendislik faydası dengesine öncelik verir. YOLOv5 , ham ölçümlerin ötesinde, mobil dağıtım araçları, deney izleme platformları ve veri kümesi yönetimi iş akışlarıyla sorunsuz bir şekilde entegre olan olgun bir ekosistem sunar. Çok yönlülüğü, görüntü sınıflandırması ve örnek segmentasyonunu içerecek şekilde algılamanın ötesine uzanır.

YOLOv5 hakkında daha fazla bilgi edinin

Mimari Farklılıklar

Temel ayrışma, tahminlerin nasıl işlendiğinde yatmaktadır. YOLOv5, çakışan sınırlayıcı kutuları filtrelemek için NMS'ye dayanan, yüksek düzeyde optimize edilmiş, anchor tabanlı bir mimari kullanır. Bu yöntem, çeşitli veri kümelerinde savaşta test edilmiş ve sağlamdır.

Aksine, YOLOv10 tutarlı bir çift atama stratejisi kullanır. Bu, modelin çıkarım sırasında her nesne için tek bir en iyi kutuyu tahmin etmesini sağlar ve teorik olarak NMS adımını tamamen ortadan kaldırır. İşlem sonrası yükündeki bu azalma, YOLOv10'un ana iddiasıdır ve NVIDIA Jetson Orin Nano gibi uç cihazlarda daha düşük gecikme süresi sunar. Ek olarak, YOLOv10, parametreleri (params) ve kayan nokta işlemlerini (FLOP'lar) en aza indirmek için backbone ve head'inde bütünsel verimlilik tasarımları içerir.

Bellek Verimliliği

YOLOv5 gibi Ultralytics modellerinin (ve daha yeni YOLO11) bir özelliği, optimize edilmiş bellek ayak izleridir. Büyük miktarda CUDA belleği tüketen bazı transformer tabanlı dedektörlerin aksine, Ultralytics modelleri, tüketici sınıfı donanımda verimli bir şekilde eğitilmek üzere tasarlanmıştır ve son teknoloji yapay zekaya erişimi demokratikleştirmektedir.

Performans Metrikleri

Aşağıdaki tablo, performans ödünleşimlerini vurgulamaktadır. YOLOv10, genellikle daha eski YOLOv5 mimarisine kıyasla daha az parametreyle daha yüksek Ortalama Ortalama Hassasiyet (mAP) elde eder. Bununla birlikte, YOLOv5 özellikle TensorRT veya ONNX gibi optimize edilmiş dışa aktarma biçimlerini kullanırken, belirli donanım yapılandırmalarında ham çıkarım hızında rekabetçi kalır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Güçlü ve Zayıf Yönler

YOLOv10 Analizi

Güçlü Yönler:

  • NMS'siz: Maksimum olmayan bastırma adımının kaldırılması, dağıtım hattını basitleştirir ve çıkarım gecikmesini dengeler.
  • Parametre Verimliliği: Depolama alanı kısıtlı cihazlar için faydalı olan daha küçük model ağırlıkları ile yüksek doğruluk sağlar.
  • Son Teknoloji Doğruluğu: COCO kıyaslamasında saf mAP metriklerinde eski YOLO sürümlerinden daha iyi performans gösterir.

Zayıflıklar:

  • Sınırlı Çok Yönlülük: Öncelikli olarak nesne algılamaya odaklanmıştır ve daha yeni Ultralytics modellerinde bulunan poz tahmini veya Yönlendirilmiş Sınırlayıcı Kutu (OBB) algılama gibi karmaşık görevler için yerel desteğe sahip değildir.
  • Gelişen Ekosistem: Araştırma merkezli bir model olduğu için, Ultralytics yerel modelleri için mevcut olan geniş topluluk eklentileri, savaş testinden geçmiş entegrasyonlar ve kurumsal destekten yoksun olabilir.

YOLOv5 Analizi

Güçlü Yönler:

  • Rakipsiz Çok Yönlülük: Kutudan çıkar çıkmaz algılama, segmentasyon ve sınıflandırmayı destekler.
  • Güçlü Ekosistem: Ultralytics tarafından desteklenir ve Ultralytics HUB, Roboflow ve Comet ML gibi araçlarla zahmetsizce entegre olur.
  • Dağıtıma Hazır: CoreML, TFLite, TensorRT ve OpenVINO'ya aktarma için kapsamlı belgeler mevcuttur ve sorunsuz üretim dağıtımları sağlanır.
  • Eğitim Verimliliği: Kararlı eğitim dinamikleri ve düşük bellek kullanımı ile bilinir, bu da onu tek GPU kurulumlarına sahip geliştiriciler için erişilebilir kılar.

Zayıflıklar:

  • Eskiyen Mimari: Hala güçlü olmasına rağmen, saf mAP/FLOP'lar oranı YOLOv8 ve YOLO11 gibi daha yeni yinelemeler tarafından aşılmıştır.
  • Ankraj Bağımlılığı: Aşırı nesne en boy oranlarına sahip veri kümeleri için manuel ayarlama gerektirebilecek ankraj kutularına dayanır.

İdeal Kullanım Senaryoları

Bu ikisi arasındaki seçim genellikle dağıtım ortamınızın özel kısıtlamalarına bağlıdır.

  • Aşağıdaki durumlarda YOLOv10'u seçin: NMS hesaplama yükünü ortadan kaldırmanın kritik bir hız avantajı sağladığı bir gömülü cihaz için özel bir nesne algılama sistemi oluşturuyorsanız veya küçük bir model ayak izinden mutlak en yüksek mAP'ye ihtiyacınız varsa.
  • Aşağıdaki durumlarda YOLOv5'i seçin: Bir üretim hattı için güvenilir, çoklu görevli bir modele ihtiyacınız varsa. Örnek segmentasyonu ve classify işleme yeteneği, onu vizyon yapay zekası için bir "İsviçre Çakısı" yapar. Ayrıca, ekibiniz standart MLOps iş akışlarına güveniyorsa, YOLOv5'in Ultralytics ekosistemine sorunsuz entegrasyonu geliştirme süresini önemli ölçüde azaltır.

Kullanıcı Deneyimi ve Ekosistem

Ultralytics modellerinin belirleyici özelliklerinden biri, geliştirici deneyimine odaklanmasıdır. YOLOv5, "sadece çalışır" standardını belirledi ve bu felsefe devam ediyor. Kullanıcılar, yakınsamayı hızlandırmak için önceden eğitilmiş ağırlıklardan yararlanarak, yalnızca birkaç satır kodla özel veriler üzerinde bir YOLOv5 modeli eğitebilir.

Aksine, YOLOv10 mükemmel akademik sonuçlar sağlarken, karmaşık üretim hatlarına entegre etmek daha fazla özel mühendislik gerektirebilir. Ultralytics, hataların hızla giderilmesini ve özelliklerin gerçek dünya kullanıcı geri bildirimlerine göre eklenmesini sağlayan canlı bir açık kaynak topluluğunu sürdürmektedir.

Kod Karşılaştırması

Bu modelleri çalıştırmak oldukça kolaydır. Aşağıda, python kullanarak her biriyle nasıl yükleme ve tahmin yapabileceğinize dair örnekler bulunmaktadır.

YOLOv10'u kullanıyorum:

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Perform inference on an image
results = model("path/to/image.jpg")
results[0].show()

YOLOv5 kullanarak ( PyTorch Hub aracılığıyla):

import torch

# Load YOLOv5s from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")

# Perform inference
results = model("path/to/image.jpg")
results.show()

Sonuç

Her iki model de bilgisayar görüşünde önemli başarıları temsil ediyor. YOLOv10, NMS'siz tasarımıyla gecikme optimizasyonunun sınırlarını zorlayarak onu özel, yüksek hızlı detect görevleri için heyecan verici bir seçim haline getiriyor.

Ancak, çoğu geliştirici ve kuruluş için Ultralytics ekosistemi (burada YOLOv5'in kalıcı güvenilirliği ve YOLO11'in en son teknoloji performansı ile temsil edilir) daha kapsamlı bir çözüm sunar. Kullanım kolaylığı, kapsamlı belgeler ve çoklu görev yeteneklerinin birleşimi, hata ayıklamaya daha az ve değer dağıtmaya daha fazla zaman ayırmanızı sağlar.

Ekosistem avantajlarını korurken YOLOv5'ten yükseltme yapmak isteyenler için, en son performansı, ankrajsız detect ve OBB ve poz tahmini dahil olmak üzere tüm vizyon görevleri spektrumuna yönelik desteği sunan YOLO11'i keşfetmenizi şiddetle tavsiye ederiz.

Daha Fazla Okuma


Yorumlar