İçeriğe geç

YOLOv5 - DAMO-YOLO Karşılaştırması: Detaylı Teknik Bir İnceleme

Bilgisayarla görmenin hızla gelişen ortamında, doğru nesne algılama mimarisini seçmek proje başarısı için çok önemlidir. Bu karşılaştırma iki önemli modeli incelemektedir: Ultralytics YOLOv5güvenilirliği ve hızıyla bilinen ve dünya çapında benimsenmiş bir endüstri standardı olan YOLO ve Alibaba Group'un yeni mimari arama tekniklerini tanıtan araştırma odaklı bir modeli.

Her iki model de nesne algılama görevlerini çözmeyi amaçlasa da farklı ihtiyaçlara hitap etmektedir. YOLOv5 kullanım kolaylığı, dağıtım çok yönlülüğü ve gerçek dünya performans dengesine öncelik verirken, YOLO Sinirsel Mimari Arama (NAS) ve ağır özellik füzyon mekanizmaları ile akademik sınırları zorlamaya odaklanır.

Performans Ölçütleri ve Kıyaslamalar

Üretim için bir model seçerken çıkarım hızı ve tespit doğruluğu arasındaki dengeleri anlamak çok önemlidir. Aşağıdaki veriler, bu modellerin nesne algılama için standart bir ölçüt olan COCO veri kümesinde nasıl performans gösterdiğini vurgulamaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Sonuçların Analizi

Veriler, tasarım felsefesinde belirgin bir ikilemi ortaya koymaktadır. YOLOv5n (Nano), GPU 'da 1,12 ms' lik inanılmaz bir çıkarım süresi ve yaygın olarak erişilebilir CPU performansı sunarak hız ve verimlilik konusunda tartışmasız şampiyon. Bu da onu düşük gecikmenin pazarlık konusu olmadığı uç yapay zeka uygulamaları için ideal kılıyor.

YOLO modelleri, örneğin DAMO-YOLOlmarjinal olarak daha yüksek Ortalama Ortalama HassasiyetmAP)'de zirve yapıyor. 50.8Ancak CPU performans ölçümlerinde opaklık pahasına. YOLO için bildirilen CPU hızlarının olmaması, öncelikle üst düzey GPU ortamları için optimize edildiğini ve mobil uygulamalar veya gömülü sistemler gibi daha geniş dağıtım senaryoları için esnekliğini sınırladığını göstermektedir.

Ultralytics YOLOv5: Çok Yönlü Endüstri Standardı

Yazar Glenn Jocher
Organizasyon:Ultralytics
Tarih: 2020-06-26
GitHubyolov5
Dokümantasyonyolov5yolov5

YOLOv5 , piyasaya sürüldüğünden bu yana bilgisayarla görme topluluğunda bir köşe taşı olarak kendini kanıtlamıştır. Yerel olarak oluşturulmuş PyTorchkarmaşıklığı kullanılabilirlikle dengeleyerek "piller dahil" bir deneyim sunar. Mimarisi, çeşitli boyutlardaki nesneleri detect etmek için farklı ölçeklerdeki özellikleri verimli bir şekilde toplayan bir CSPDarknet backbone ve bir PANet boynu kullanır.

Temel Güçlü Yönler

  • Kullanım Kolaylığı: Ultralytics , geliştirici deneyimine (DX) öncelik verir. Basit bir Python API ve sezgisel CLI komutları ile kullanıcılar modelleri dakikalar içinde eğitebilir ve dağıtabilir.
  • Bakımlı Ekosistem: Aktif bir topluluk ve sık güncellemelerle desteklenen YOLOv5 , sorunsuz model yönetimi için Ultralytics HUB dahil olmak üzere en yeni araçlarla uyumluluk sağlar.
  • Çok yönlülük: Standart algılamanın ötesinde, YOLOv5 örnek segmentasyonunu ve görüntü sınıflandırmasını destekleyerek geliştiricilerin tek bir çerçeveyle birden fazla görme görevinin üstesinden gelmesine olanak tanır.
  • Dağıtım Esnekliği: ONNX ve TensorRT 'ye aktarımdan iOS ve Android'de çalıştırmaya kadar, YOLOv5 her yerde çalışacak şekilde tasarlanmıştır.

YOLOv5 hakkında daha fazla bilgi edinin

Kolaylaştırılmış İş Akışı

YOLOv5 , popüler MLOps araçlarıyla sorunsuz bir şekilde entegre olur. Deneylerinizi aşağıdakileri kullanarak track edebilirsiniz Weights & Biases veya Comet Tek bir komutla, eğitim çalışmalarınızın tekrarlanabilir ve analizinin kolay olmasını sağlar.

YOLO: Araştırma Odaklı Doğruluk

Yazarlar Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Organizasyon: Alibaba Group
Tarih: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHubYOLO

YOLO , Alibaba'nın DAMO Akademisi tarafından geliştirilen bir yöntemdir. Verimli omurgaları (MAE-NAS) otomatik olarak tasarlamak için Nöral Mimari Arama (NAS), RepGFPN (Reparameterized Generalized Feature Pyramid Network) olarak bilinen ağır bir boyun yapısı ve ZeroHead adı verilen hafif bir kafa dahil olmak üzere bir dizi gelişmiş teknoloji sunar.

Temel Özellikler

  • MAE-NAS Backbone: Belirli gecikme kısıtlamaları altında optimum bir ağ yapısı bulmak için MAE-NAS adlı bir yöntem kullanır, ancak bu, mimariyi manuel olarak değiştirmek için daha karmaşık hale getirebilir.
  • AlignedOTA Etiket Ataması: Sınıflandırma ve regresyon görevleri arasındaki yanlış hizalamaları çözmek için AlignedOTA adı verilen dinamik bir etiket atama stratejisi kullanır.
  • Doğruluğa Odaklanın: YOLO 'nun birincil hedefi COCO veri setinde mAP 'yi en üst düzeye çıkarmaktır, bu da onu her bir yüzde kesrinin önemli olduğu yarışmalar veya akademik araştırmalar için güçlü bir rakip haline getirir.

DAMO-YOLO hakkında daha fazla bilgi edinin

Mimari ve Operasyonel Farklılıklar

YOLOv5 ve YOLO arasındaki farklılık, basit metriklerin ötesine geçerek temel tasarım felsefelerine ve operasyonel gereksinimlerine kadar uzanmaktadır.

Mimari: Basitlik ve Karmaşıklık

YOLOv5 el yapımı, sezgisel bir mimari kullanır. Çapa tabanlı yaklaşımı iyi anlaşılır ve hata ayıklaması kolaydır. Buna karşılık, YOLO ağır yeniden parametrelendirmeye ve otomatik aramaya (NAS) dayanır. NAS verimli yapılar ortaya çıkarabilse de, genellikle geliştiricilerin özelleştirmesi veya yorumlaması zor olan "kara kutu" modelleriyle sonuçlanır. Ayrıca, YOLOv5'daki ağır boyun (RepGFPN) eğitim sırasında hesaplama yükünü artırır ve YOLOv5'in verimli CSP tasarımına kıyasla daha fazla GPU belleği gerektirir.

Eğitim Verimliliği ve Hafıza

Ultralytics modelleri eğitim verimliliği ile ünlüdür. YOLOv5 tipik olarak daha az CUDA belleği gerektirir ve tüketici sınıfı GPU'larda eğitilmesine olanak tanır. YOLO, karmaşık yeniden parametrelendirme ve damıtma süreçleriyle, etkili bir şekilde eğitmek için genellikle üst düzey donanım gerektirir. Ayrıca Ultralytics , yakınsama yolunu hızlandırmak için önceden eğitilmiş ağırlıklardan oluşan geniş bir kütüphane ve otomatik hiperparametre ayarı sağlar.

Ekosistem ve Kullanım Kolaylığı

Belki de en önemli fark ekosistemde yatmaktadır. YOLOv5 sadece bir model değildir; kapsamlı bir araç paketinin parçasıdır.

  • Dokümantasyon: Ultralytics , kullanıcıları veri toplamadan dağıtıma kadar yönlendiren kapsamlı, çok dilli belgeler bulundurur.
  • Topluluk: Büyük bir küresel topluluk, sorunların hızlı bir şekilde çözülmesini ve eğitimlerin kolayca erişilebilir olmasını sağlar.
  • Entegrasyonlar: Şunlar için yerel destek Roboflow veri kümeleri ve NVIDIA Jetson gibi dağıtım hedefleri tüm işlem hattını basitleştirir.

Öncelikle bir araştırma deposu olan YOLO, bu düzeyde cilalı destekten yoksundur ve ticari ürünlere entegrasyonu önemli ölçüde daha zor hale getirir.

Gerçek Dünya Kullanım Durumları

Bu modeller arasındaki seçim genellikle belirli dağıtım ortamına bağlıdır.

YOLOv5 'in Üstün Olduğu Noktalar

  • Akıllı Tarım: Düşük kaynak gereksinimi sayesinde drone'larda veya otonom traktörlerde mahsul hastalıklarını tespit etmek için mükemmeldir.
  • Üretim: Endüstriyel otomasyonda, YOLOv5'in yüksek hızı, hızlı hareket eden konveyör bantlarında gerçek zamanlı kusur tespitine olanak tanır.
  • Perakende Analitiği: Nesne sayma ve kuyruk yönetimi için YOLOv5'in CPU performansı, mevcut mağaza donanımında uygun maliyetli dağıtım sağlar.

YOLO 'nun Üstün Olduğu Noktalar

  • Akademik Araştırma: RepGFPN veya NAS tekniklerinin etkinliğini inceleyen araştırmacılar YOLO 'yu değerli bir temel olarak bulacaklardır.
  • Üst Düzey Gözetim: Doğruluğun gecikmeye göre öncelikli olduğu özel sunucu sınıfı GPU'lara sahip senaryolarda, YOLO karmaşık sahnelerde hassas algılama sağlayabilir.

Kod Örneği: YOLOv5 ile Başlarken

Ultralytics Python paketi sayesinde YOLOv5 'i çalıştırmak kolaydır. Aşağıdaki örnek, önceden eğitilmiş bir modelin nasıl yükleneceğini ve bir görüntü üzerinde çıkarımın nasıl çalıştırılacağını göstermektedir.

import torch

# Load a pre-trained YOLOv5s model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)

# Define an image URL or local path
img = "https://ultralytics.com/images/zidane.jpg"

# Run inference
results = model(img)

# Print results to the console
results.print()

# Show the image with bounding boxes
results.show()

Sonuç

Hem YOLOv5 hem de YOLO nesne algılama alanına önemli katkılarda bulunmaktadır. YOLO , yüksek doğruluk ölçütlerine ulaşmak için Sinirsel Mimari Arama ve gelişmiş özellik füzyonunun potansiyelini sergilemektedir.

Ancak, geliştiricilerin, mühendislerin ve işletmelerin büyük çoğunluğu için, Ultralytics YOLOv5 üstün bir seçim olmaya devam ediyor. Eşsiz Kullanım Kolaylığı, sağlam Performans Dengesi ve İyi Korunan Ekosistemin güvenliği, projelerin prototipten üretime minimum sürtünme ile geçmesini sağlar. CPU'lar ve GPU'lar arasında verimli bir şekilde dağıtma yeteneği, eğitim için daha düşük bellek gereksinimleriyle birleştiğinde, YOLOv5 'i gerçek dünya uygulamaları için son derece pratik bir çözüm haline getirir.

Ultralytics , bilgisayarla görme teknolojisindeki en son gelişmelerden yararlanmak isteyenler için YOLOv8 ve son teknoloji ürünü YOLO11. Bu yeni modeller, YOLOv5'in sağlam temeli üzerine inşa edilerek daha da yüksek hız, doğruluk ve görev çok yönlülüğü sunuyor.

Diğer Karşılaştırmaları İnceleyin

Bu modellerin daha geniş ekosisteme nasıl uyduğunu daha iyi anlamak için bu ayrıntılı karşılaştırmaları inceleyin:


Yorumlar