İçeriğe geç

YOLOv5 vs. YOLOv5: Kapsamlı Bir Teknik Karşılaştırma

Optimum nesne algılama mimarisinin seçilmesi, bilgisayarla görmenin geliştirilmesinde çok önemli bir adımdır ve doğruluk, çıkarım hızı ve entegrasyon karmaşıklığının dikkatli bir şekilde değerlendirilmesini gerektirir. Bu analiz, Alibaba Group tarafından geliştirilen yüksek hassasiyetli bir model olan YOLO ile Ultralytics YOLOv5performans, hız ve geliştirici dostu ekosistem dengesiyle tanınan endüstri standardı bir mimaridir. Bilinçli bir karar vermenize yardımcı olmak için mimari yeniliklerini, kıyaslama ölçümlerini ve ideal uygulama senaryolarını keşfediyoruz.

YOLO: Doğruluk Odaklı Mimari

Yazarlar Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Organizasyon:Alibaba Group
Tarih: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHub:https://github.com/tinyvision/DAMO-YOLO
Dokümanlar:YOLO README

YOLO , Alibaba Group'un makul gecikme süresini korurken tespit doğruluğunun sınırlarını zorlamak için gösterdiği önemli bir çabayı temsil etmektedir. Gelişmiş nöral mimari arama (NAS) teknolojilerini ve yeni özellik birleştirme stratejilerini entegre ederek statik kıyaslamalarda birçok çağdaşından daha iyi performans gösterir.

Mimari Yenilikler

YOLO , ağdan maksimum performans elde etmek için tasarlanmış, teknik açıdan karmaşık çeşitli bileşenlerle farklılaşmaktadır:

  • MAE-NAS Backbone: Manuel olarak tasarlanmış omurgalara sahip modellerin aksine YOLO , Maksimum Entropi ilkesi tarafından yönlendirilen Sinirsel Mimari Arama (NAS) kullanır. Bu, değişen kısıtlamalar altında özellik çıkarma verimliliği için özel olarak optimize edilmiş bir backbone yapısı ile sonuçlanır.
  • Verimli RepGFPN: Model, Yeniden Parametrelendirilmiş Genelleştirilmiş Özellik Piramidi Ağı (RepGFPN) kullanır. Bu gelişmiş boyun modülü, farklı ölçeklerde özellik füzyonunu optimize ederek ve doğruluktan ödün vermeden çıkarım gecikmesini azaltmak için yeniden parametrelendirmeden yararlanarak standart FPN'leri geliştirir.
  • ZeroHead: Algılama kafasının hesaplama maliyetini en aza indirmek için YOLO , sınıflandırma ve regresyon görevlerini verimli bir şekilde yerine getiren hafif, ayrıştırılmış bir kafa olan ZeroHead'i sunar.
  • AlignedOTA: Eğitim kararlılığı ve doğruluğu, tahmin çapalarını statik eşleştirme kurallarından daha etkili bir şekilde temel gerçek nesnelerle hizalayan dinamik bir etiket atama stratejisi olan Aligned Optimal Transport Assignment (AlignedOTA) ile geliştirilmiştir.
  • Damıtma Geliştirme: Eğitim süreci genellikle daha büyük bir "öğretmen" modelinin daha küçük "öğrenci" modelinin öğrenmesine rehberlik ederek daha zengin özellik temsilleri kazandırdığı bilgi damıtımını içerir.

Araştırma Odaklı Tasarım

YOLO , COCO gibi ölçütlerde yüksek mAP elde etmek için yoğun bir şekilde optimize edilmiştir. NAS ve damıtma kullanımı, onu akademik araştırmalar ve eğitim karmaşıklığı pahasına olsa bile doğruluktaki her bir yüzde kesrinin önemli olduğu senaryolar için güçlü bir araç haline getirir.

Güçlü ve Zayıf Yönler

YOLO 'nun birincil avantajı ham tespit doğruluğudur. NAS ve gelişmiş boyun tasarımlarından yararlanarak, genellikle aynı neslin karşılaştırılabilir modellerinden daha yüksek Ortalama Hassasiyet (mAP) puanları elde eder. İnce taneli özellik ayrımının kritik olduğu karmaşık sahnelerdeki nesneleri tanımlamada üstündür.

Ancak bu kazanımlar bazı ödünleri de beraberinde getirmektedir. NAS omurgalarına ve damıtma boru hatlarına olan bağımlılık, eğitim ve entegrasyonun karmaşıklığını artırır. Bazı alternatiflerin tak ve çalıştır doğasının aksine, YOLO için özel bir eğitim hattı kurmak yoğun kaynak gerektirebilir. Ayrıca, ekosistemi nispeten daha küçüktür, yani daha yerleşik çerçevelere kıyasla daha az topluluk kaynağı, öğretici ve üçüncü taraf entegrasyonu mevcuttur.

DAMO-YOLO hakkında daha fazla bilgi edinin

Ultralytics YOLOv5: Pratik Yapay Zeka için Standart

Yazar Glenn Jocher
Organizasyon:Ultralytics
Tarih: 2020-06-26
GitHubyolov5
Docsyolov5yolov5

Yayınlandığından beri, Ultralytics YOLOv5 gerçek dünyadaki bilgisayarla görme uygulamaları için başvurulacak çözüm olarak kendini kanıtlamıştır. Hız, doğruluk ve kullanılabilirlik arasında efsanevi bir denge kurar ve veri kümesi küratörlüğünden dağıtıma kadar makine öğrenimi yaşam döngüsünün her aşamasını basitleştiren bir ekosistemle desteklenir.

Mimari ve Kullanılabilirlik

YOLOv5 , GPU ve CPU donanımlarında sağlamlıkları ve verimlilikleri için seçilen mimariler olan PANet boynu ile birleştirilmiş bir CSPDarknet53 backbone kullanır. Kanıtlanmış bir metodoloji olan çapa tabanlı algılama kullanırken, gerçek gücü mühendisliğinde ve ekosisteminde yatmaktadır:

  • Kolaylaştırılmış Kullanıcı Deneyimi: YOLOv5 , "Sıfırdan Kahramana" felsefesiyle ünlüdür. Geliştiriciler ortamı kurabilir, özel veri kümeleri üzerinde eğitim verebilir ve sadece birkaç satır kodla çıkarım yapabilir.
  • Çok yönlülük: Standart nesne algılamanın ötesinde, YOLOv5 örnek segmentasyonunu ve görüntü sınıflandırmasını destekleyerek kullanıcıların tek bir çerçeve içinde birden fazla görme görevinin üstesinden gelmesine olanak tanır.
  • Dışa aktarılabilirlik: Model, aşağıdakiler de dahil olmak üzere çok sayıda formata sorunsuz dışa aktarımı destekler ONNX, TensorRT, CoreML ve TFLite ile bulut sunucularından uç cihazlara kadar her şeyde kolay dağıtım sağlar.
  • Bellek Verimliliği: Ultralytics modelleri, karmaşık transformatör tabanlı mimarilere veya NAS ağırlıklı modellere kıyasla eğitim sırasında tipik olarak daha düşük bellek kullanımı gösterir ve bu da onları daha geniş bir donanım yelpazesinde erişilebilir hale getirir.

Ekosistem Avantajı

Ultralytics Ekosistemi, geliştirme için büyük bir hızlandırıcıdır. Kapsamlı dokümantasyon, aktif topluluk forumları ve sık güncellemeler ile geliştiriciler hata ayıklamaya daha az, yenilik yapmaya daha çok zaman ayırırlar. Ultralytics HUB gibi araçlarla entegrasyonlar, model yönetimini ve eğitimini daha da kolaylaştırır.

Geliştiriciler Neden YOLOv5i Seçiyor?

YOLOv5 , Kullanım Kolaylığı ve Eğitim Verimliliğine öncelik verdiği için en iyi seçenek olmaya devam etmektedir. Önceden eğitilmiş ağırlıklar kolayca kullanılabilir ve sağlamdır, bu da hızlı transfer öğrenimine olanak tanır. Çıkarım hızı olağanüstüdür ve video analitiği, otonom navigasyon ve endüstriyel denetim gibi gerçek zamanlı uygulamalar için idealdir.

gibi yeni modeller olsa da YOLO11 o zamandan bu yana çapasız mimariler ve daha fazla performans artışı sağlasa da, YOLOv5 sayısız üretim sistemi için güvenilir, iyi desteklenen ve son derece yetenekli bir iş gücü olmaya devam etmektedir.

YOLOv5 hakkında daha fazla bilgi edinin

Performans Karşılaştırması

Doğrudan bir karşılaştırmada, iki model arasındaki ayrım netleşir: YOLO doğrulama doğruluğunumAP) en üst düzeye çıkarmaya yönelirken, YOLOv5 çıkarım hızı ve dağıtım pratikliği için optimize eder. Aşağıdaki tablo, YOLO modellerinin benzer parametre sayılarında genellikle daha yüksek mAP puanları elde ederken, YOLOv5 modellerinin (özellikle Nano ve Small varyantları) CPU ve GPU'da üstün hız sunduğunu vurgulamaktadır; bu da genellikle uç dağıtımlar için belirleyici faktördür.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Gerçek Dünya Uygulama Kodu

Ultralytics modelleri için en güçlü argümanlardan biri entegrasyonun basitliğidir. Aşağıda, bir YOLOv5 modelinin PyTorch Hub kullanılarak çıkarım için ne kadar kolay yüklenip kullanılabileceğini gösteren ve ekosistemin geliştirici dostu doğasını gösteren doğrulanmış bir örnek yer almaktadır.

import torch

# Load YOLOv5s from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)

# Define an image source (URL or local path)
img = "https://ultralytics.com/images/zidane.jpg"

# Run inference
results = model(img)

# Print results to console
results.print()

# Show the results
results.show()

Sonuç

Her iki mimari de bilgisayarla görme alanında farklı rollere hizmet etmektedir. YOLO, en son teknoloji doğruluğa ulaşmanın tek hedef olduğu ve NAS tabanlı eğitim hatlarının karmaşıklığının kabul edilebilir olduğu akademik araştırmalar ve yarışmalar için zorlu bir seçimdir.

Ancak, geliştiricilerin, araştırmacıların ve işletmelerin büyük çoğunluğu için, Ultralytics YOLOv5 (ve onun halefi, YOLO11) üstün öneri olmaya devam etmektedir. İyi Korunan Ekosistemin avantajları abartılamaz: basit API'ler, kapsamlı dokümantasyon ve sorunsuz dışa aktarma seçenekleri, pazara sunma süresini büyük ölçüde azaltır. Gerçek zamanlı kısıtlamaları etkili bir şekilde ele alan Performans Dengesi ve segmentasyon ve sınıflandırma gibi görevlerde Çok Yönlülük ile Ultralytics modelleri, pratik yapay zeka çözümleri oluşturmak için sağlam ve geleceğe dönük bir temel sağlar.

En son performans ve özellikleri arayanlar için, bu ürünü keşfetmenizi şiddetle tavsiye ederiz YOLO11YOLOv5 'in mirası üzerine daha da yüksek doğruluk ve verimlilikle inşa edilmiştir.

Diğer Karşılaştırmaları İnceleyin

İhtiyaçlarınıza en uygun modeli daha iyi değerlendirmek için bu ayrıntılı karşılaştırmaları inceleyin:


Yorumlar