İçeriğe geç

YOLOv10 vs YOLOv5: Mimari ve Performans Derin Dalış

Bilgisayarla görmenin hızla gelişen ortamında, doğru nesne algılama modelini seçmek proje başarısı için kritik öneme sahiptir. Bu karşılaştırma, aşağıdakiler arasındaki teknik farklılıkları araştırmaktadır YOLOv10NMS'siz eğitime odaklanan yakın tarihli bir akademik yayın ve YOLOv5Ultralytics 'in sağlamlığı ve sektör çapında benimsenmesiyle bilinen efsanevi modeli. Her iki model de You Only Look Once (Sadece Bir Kez Bakarsınız) soyundan gelse de farklı mühendislik önceliklerine ve dağıtım ortamlarına hitap etmektedir.

Model Genel Bakışları

YOLOv10: Verimlilik Uzmanı

Tsinghua Üniversitesi'ndeki araştırmacılar tarafından Mayıs 2024'te piyasaya sürülen YOLOv10 , çıkarım sırasında Maksimum Olmayan Bastırma (NMS) ihtiyacını ortadan kaldırmak için tasarlanmış mimari mekanizmalar sunuyor. Eğitim sırasında tutarlı ikili atamalar kullanarak uçtan uca gecikmeyi azaltmayı amaçlayan YOLOv10 , çıkarım gecikmesinin her milisaniyesinin önemli olduğu uç uygulamalar için güçlü bir adaydır.

YOLOv10 hakkında daha fazla bilgi edinin

Ultralytics YOLOv5: Endüstri Standardı

2020'de piyasaya sürülmesinden bu yana UltralyticsYOLOv5 , yapay zeka topluluğunda kullanım kolaylığını tanımlamıştır. Hız, doğruluk ve mühendislik faydası dengesine öncelik verir. YOLOv5 , ham ölçümlerin ötesinde, mobil dağıtım araçları, deney izleme platformları ve veri kümesi yönetimi iş akışlarıyla sorunsuz bir şekilde entegre olan olgun bir ekosistem sunar. Çok yönlülüğü, görüntü sınıflandırması ve örnek segmentasyonunu içerecek şekilde algılamanın ötesine uzanır.

  • Yazar: Glenn Jocher
  • Kuruluş: Ultralytics
  • Tarih: 2020-06-26
  • GitHub:yolov5

YOLOv5 hakkında daha fazla bilgi edinin

Mimari Farklılıklar

Birincil farklılık, tahminlerin nasıl işlendiğinde yatmaktadır. YOLOv5 , üst üste binen sınırlayıcı kutuları filtrelemek için NMS 'ye dayanan son derece optimize edilmiş çapa tabanlı bir mimari kullanır. Bu yöntem, çeşitli veri kümelerinde test edilmiş ve sağlamdır.

Buna karşılık, YOLOv10 tutarlı bir ikili atama stratejisi kullanır. Bu, modelin çıkarım sırasında her nesne için tek bir en iyi kutuyu tahmin etmesini sağlar ve teorik olarak NMS adımını tamamen ortadan kaldırır. İşlem sonrası ek yükteki bu azalma, NVIDIA Jetson Orin Nano gibi uç cihazlarda daha düşük gecikme süresi sunan YOLOv10'un ana şöhret iddiasıdır. Ayrıca YOLOv10 , parametreleri (params) ve kayan nokta işlemlerini (FLOPs) en aza indirmek için backbone ve kafasında bütünsel verimlilik tasarımları içerir.

Bellek Verimliliği

YOLOv5 gibi Ultralytics modellerinin ayırt edici özelliklerinden biri (ve daha yeni YOLO11) optimize edilmiş bellek ayak izidir. Büyük miktarda CUDA belleği tüketen bazı transformatör tabanlı dedektörlerin aksine, Ultralytics modelleri tüketici sınıfı donanımlarda verimli bir şekilde eğitilecek şekilde tasarlanmıştır ve son teknoloji yapay zekaya erişimi demokratikleştirir.

Performans Metrikleri

Aşağıdaki tablo performans değişimlerini vurgulamaktadır. YOLOv10 , eski YOLOv5 mimarisine kıyasla daha az parametre ile genellikle daha yüksek Ortalama Hassasiyet (mAP) elde eder. Bununla birlikte, YOLOv5 , özellikle aşağıdaki gibi optimize edilmiş dışa aktarma formatları kullanıldığında, belirli donanım yapılandırmalarında ham çıkarım hızı açısından rekabetçi olmaya devam etmektedir TensorRT veya ONNX.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Güçlü ve Zayıf Yönler

YOLOv10 Analizi

Güçlü Yönler:

  • NMS'NMS: Maksimum olmayan bastırma adımının kaldırılması, dağıtım işlem hattını basitleştirir ve çıkarım gecikmesini dengeler.
  • Parametre Verimliliği: Depolama alanı kısıtlı cihazlar için faydalı olan daha küçük model ağırlıkları ile yüksek doğruluk elde eder.
  • Son Teknoloji Doğruluk: COCO kıyaslamasında saf mAP metriklerinde eski YOLO sürümlerinden daha iyi performans gösterir.

Zayıflıklar:

  • Sınırlı Çok Yönlülük: Öncelikle nesne algılamaya odaklanmış olup, daha yeni Ultralytics modellerinde bulunan poz tahmini veya Yönlendirilmiş Sınırlayıcı Kutu (OBB ) algılama gibi karmaşık görevler için yerel destekten yoksundur.
  • Gelişmekte Olan Ekosistem: Araştırma merkezli bir model olarak, Ultralytics modeller için mevcut olan kapsamlı topluluk eklentilerinden, savaşta test edilmiş entegrasyonlardan ve kurumsal destekten yoksun olabilir.

YOLOv5 Analizi

Güçlü Yönler:

  • Eşsiz Çok Yönlülük: Kutudan çıkar çıkmaz algılama, segmentasyon ve sınıflandırmayı destekler.
  • Sağlam Ekosistem: Destekleyen UltralyticsUltralytics HUB, Roboflow ve Comet ML gibi araçlarla zahmetsizce entegre olur.
  • Dağıtıma Hazır: CoreML, TFLite, TensorRT ve OpenVINO'ya dışa aktarım için kapsamlı belgeler mevcuttur ve sorunsuz üretim sunumları sağlar.
  • Eğitim Verimliliği: İstikrarlı eğitim dinamikleri ve düşük bellek kullanımı ile bilinir, bu da onu tek GPU kurulumlarına sahip geliştiriciler için erişilebilir kılar.

Zayıflıklar:

  • Yaşlanan Mimari: Hala güçlü olsa da, saf mAP oranı aşağıdaki gibi yeni yinelemeler tarafından aşılmıştır YOLOv8 ve YOLO11.
  • Çapa Bağımlılığı: Aşırı nesne en boy oranlarına sahip veri kümeleri için manuel ayarlama gerektirebilecek bağlantı kutularına dayanır.

İdeal Kullanım Senaryoları

Bu ikisi arasındaki seçim genellikle dağıtım ortamınızın belirli kısıtlamalarına bağlıdır.

  • Aşağıdaki durumlarda YOLOv10 'u seçin: NMS hesaplama ek yükünü ortadan kaldırmanın kritik bir hız avantajı sağladığı gömülü bir cihaz için özel bir nesne algılama sistemi oluşturuyorsanız veya küçük bir model ayak izinden mutlak en yüksek mAP 'ye ihtiyacınız varsa.
  • Aşağıdaki durumlarda YOLOv5 'i seçin: Bir üretim hattı için güvenilir, çok görevli bir modele ihtiyacınız varsa. Örnek segmentasyonunu ve sınıflandırmayı idare edebilme yeteneği, onu görsel yapay zeka için bir "İsviçre Çakısı" haline getirir. Ayrıca, ekibiniz standart MLOps iş akışlarına güveniyorsa, YOLOv5 'in Ultralytics ekosistemine sorunsuz entegrasyonu geliştirme süresini önemli ölçüde azaltır.

Kullanıcı Deneyimi ve Ekosistem

Ultralytics modellerinin belirleyici özelliklerinden biri de geliştirici deneyimine odaklanmasıdır. YOLOv5 , "sadece çalışıyor" standardını belirledi ve bu felsefe devam ediyor. Kullanıcılar, yakınsamayı hızlandırmak için önceden eğitilmiş ağırlıklardan yararlanarak, yalnızca birkaç satır kodla özel veriler üzerinde bir YOLOv5 modelini eğitebilirler.

Buna karşılık, YOLOv10 mükemmel akademik sonuçlar sağlarken, karmaşık üretim boru hatlarına entegre edilmesi daha fazla özel mühendislik gerektirebilir. Ultralytics , canlı bir açık kaynak topluluğuna sahiptir ve hataların hızlı bir şekilde giderilmesini ve gerçek dünyadaki kullanıcı geri bildirimlerine dayalı özelliklerin eklenmesini sağlar.

Kod Karşılaştırması

Bu modelleri çalıştırmak basittir. Aşağıda, Python kullanarak her birinin nasıl yükleneceğine ve tahmin edileceğine dair örnekler verilmiştir.

YOLOv10'u kullanıyorum:

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Perform inference on an image
results = model("path/to/image.jpg")
results[0].show()

YOLOv5 kullanarak ( PyTorch Hub aracılığıyla):

import torch

# Load YOLOv5s from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")

# Perform inference
results = model("path/to/image.jpg")
results.show()

Sonuç

Her iki model de bilgisayarla görme alanında önemli başarıları temsil etmektedir. YOLOv10NMS tasarımıyla gecikme optimizasyonunun sınırlarını zorlayarak özel, yüksek hızlı algılama görevleri için heyecan verici bir seçim haline getiriyor.

Bununla birlikte, çoğu geliştirici ve işletme için, Ultralytics ekosistemi -burada Ultralytics 'in kalıcı güvenilirliği ile temsil edilmektedirYOLOv5 ve son teknoloji performansı YOLO11-daha kapsamlı bir çözüm sunar. Kullanım kolaylığı, kapsamlı dokümantasyon ve çoklu görev özelliklerinin birleşimi, hata ayıklamaya daha az, değer dağıtmaya daha fazla zaman ayırmanızı sağlar.

Ekosistem avantajlarını koruyarak YOLOv5 'ten yükseltme yapmak isteyenler için şunları keşfetmenizi şiddetle tavsiye ederiz YOLO11son teknoloji performans, çapasız algılama ve OBB ve poz tahmini de dahil olmak üzere tüm görüş görevleri için destek sunar.

Daha Fazla Okuma


Yorumlar