İçeriğe geç

YOLOv5 YOLO: Nesne Algılama Evrimine Teknik Bir Derinlemesine Bakış

Hızla gelişen bilgisayar görme dünyasında, doğru nesne algılama modelini seçmek projenin başarısı için çok önemlidir. Bu kılavuzda YOLOv5, erişilebilir yapay zekayı demokratikleştiren efsanevi depo, ve Alibaba'nın TinyVision ekibinin araştırma odaklı mimarisi YOLO karşılaştırmaktadır. Her iki model de yüksek verimlilik hedeflerken, mimari, kullanım kolaylığı ve dağıtım hazırlığı konusunda farklı felsefelerle soruna yaklaşmaktadır.

Modele Genel Bakış ve Kökenleri

YOLOv5

2020 ortasında Ultralyticstarafından piyasaya sürülen YOLOv5 , sadece mimarisiyle değil, mühendisliğiyle de endüstri standardı YOLOv5 . Kullanılabilirlik, sağlam eğitim süreçleri ve sorunsuz dışa aktarılabilirliği ön plana çıkardı. Halen küresel olarak en yaygın kullanılan görsel yapay zeka modellerinden biri olmaya devam ediyor.

YOLOv5 hakkında daha fazla bilgi edinin.

DAMO-YOLO

2022 yılının sonlarında Alibaba Group tarafından önerilenYOLO Distillation-Augmented MOdel), Neural Architecture Search (NAS), verimli Reparameterized Generalized-FPN (RepGFPN) gibi en son teknolojileri ve performansı artırmak için damıtmaya yoğun bir şekilde dayanmaktadır.

Teknik Mimari Karşılaştırması

Bu iki model arasındaki mimari farklılıklar, sezgisel "hediye çantası" tasarımlarından otomatik, arama tabanlı mimarilere geçişi vurgulamaktadır.

YOLOv5: CSP-Darknet Standardı

YOLOv5 , Modifiye CSP-Darknet53 backbone kullanır. Temel gücü, modüler tasarımı ve eğitim sırasında uygulanan "bag-of-freebies" (ücretsiz paket) gibi Mosaic augmentasyonu ve genetik algoritma hiperparametre evrimidir.

  • Backbone: CSP-Darknet
  • Boyun: CSP bloklu PANet
  • Başlık: YOLOv3 tarzı bağlantı noktası tabanlı birleştirilmiş başlık

YOLO: NAS ve Damıtma

YOLO , optimal backbone bulmak için Sinir Mimarisi Arama (NAS) kullanarak standart manuel tasarımlardanYOLO (MAE-NAS).

  • Backbone: MAE-NAS (Arama tabanlı)
  • Boyun: Verimli özellik birleştirmeye olanak tanıyan RepGFPN (Yeniden Parametreleştirilmiş Genelleştirilmiş FPN).
  • Başlık: Etiket ataması için AlignedOTA ile birleştirilmiş ZeroHead (çift görevli projeksiyon katmanları).
  • Damıtma: Daha büyük bir "öğretmen" modelinin daha küçük "öğrenci" modelinin eğitimini yönlendirdiği temel bir bileşen olup, eğitim sürecine karmaşıklık katmakla birlikte nihai doğruluğu artırır.

Damıtma Karmaşıklığı

Damıtma,YOLOnun doğruluğunu artırırken, YOLOv5 kıyasla eğitim iş akışını önemli ölçüde karmaşıklaştırır. Kullanıcılar genellikle önce bir öğretmen modelini eğitmek veya indirmek zorundadır, bu da özel veri kümeleri için giriş engelini artırır.

Performans Metrikleri

Aşağıdaki tablo, COCO veri setinde çeşitli model ölçeklerinin performansını karşılaştırmaktadır.YOLO akademik metriklerde güçlü sonuçlarYOLO , YOLOv5 verimlilik ve dağıtım çok yönlülüğü açısından rekabet gücünü YOLOv5 .

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Sonuçların Analizi

  • Verimlilik: YOLOv5n (Nano),YOLO kıyasla önemli ölçüde daha düşük parametre sayısı (2,6 milyon karşı 8,5 milyon) ve FLOP'larla hafif çıkarımın kralı olmaya devam ediyor ve bu da onu standart CPU'larda aşırı uç durumlar için çok daha uygun hale getiriyor.
  • Doğruluk:YOLO , damıtma boru hattınıYOLO daha yüksek mAP değerleri elde eder. mAP elde etmek için damıtma boru hattını kullanır.
  • Çıkarım Hızı: YOLOv5 , standart kütüphanelerde yüksek düzeyde optimize edilmiş daha basit mimari bloklar sayesinde ONNX aracılığıyla YOLOv5 daha hızlı CPU sunar.

Eğitim ve Kullanılabilirlik

Bu, geliştiriciler için en önemli farktır. Ultralytics "sıfırdan kahramana" deneyimini önceliklendirirken, araştırma veri depoları genellikle kapsamlı yapılandırma gerektirir.

YOLOv5: Kolaylaştırılmış Deneyim

YOLOv5 , sektör standardı haline gelen kullanıcı dostu bir komut satırı arayüzü ve Python YOLOv5 . Özel veri setinde eğitim için minimum kurulum gereklidir.

import torch

# Load a model
model = torch.hub.load("ultralytics/yolov5", "yolov5s")

# Train via CLI (simplified)
# !python train.py --data coco.yaml --epochs 100 --weights yolov5s.pt

YOLO: Araştırma Karmaşıklığı

YOLO eğitimiYOLO daha karmaşık bir yapılandırma sistemi içerir. Damıtma programına bağımlılık, kullanıcıların eğitim aşamasında genellikle iki modeli (öğretmen ve öğrenci) yönetmesi gerektiği anlamına gelir, bu da GPU bellek gereksinimlerini ve yapılandırma yükünü artırır.

Ultralytics : Ekosistem ve Çok Yönlülük

YOLO güçlü bir saf nesne algılayıcıYOLO da, Ultralytics modern AI projelerinin ihtiyaç duyduğu daha geniş bir yetenekler paketi sunar.

  1. Çok yönlülük: Basit sınırlayıcı kutuların ötesinde, Ultralytics örnek segmentasyonu, poz tahmini, sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) algılamasını Ultralytics .YOLO öncelikle standart algılamayaYOLO .
  2. Dağıtım: Ultralytics , aşağıdaki formatlara sorunsuz bir şekilde aktarılabilir TensorRT, CoreML, TFLite ve OpenVINO aktarılabilir.
  3. Topluluk Desteği: Milyonlarca kullanıcısı olan Ultralytics , araştırma veri havuzlarının sunamayacağı kapsamlı kaynaklar, eğitimler ve üçüncü taraf entegrasyonları sunar.

Yeni Nesil: YOLO26

NAS tabanlı modellerin verimliliğinden etkilenen ancak YOLOv5 kullanım kolaylığına ihtiyaç duyan geliştiriciler için YOLO26 önerilen halefidir. 2026 yılında piyasaya sürülen bu model, her iki dünyanın en iyi özelliklerini bir araya getirir.

  • Uçtan Uca NMS: Son akademik gelişmeler gibi, YOLO26 de Non-Maximum Suppression (NMS) özelliğini kaldırarak dağıtım süreçlerini basitleştiriyor.
  • MuSGD Optimizer: LLM eğitiminden esinlenilen bu hibrit optimizer, istikrarlı bir yakınsama sağlar.
  • Kenar Optimizasyonu: YOLO26, CPU'larda %43'e kadar daha hızlıdır, bu da onu YOLOv5 YOLO göre kenar bilişim için üstün bir seçim haline getirir.

YOLO26 hakkında daha fazla bilgi edinin

Sonuç

YOLO, bilgisayar görme araştırmaları alanına mükemmel bir katkı sağlıyor ve Sinir Mimarisi Arama ve damıtmanın gücünü gösteriyor. Gelişmiş mimari arama yöntemlerini incelemek veya eğitim karmaşıklığının bir engel oluşturmadığı belirli donanım kısıtlamalarından maksimum doğruluğu elde etmek isteyen araştırmacılar için güçlü bir adaydır.

YOLOv5ve onun modern halefi YOLO26, pratik olarak tüm üretim uygulamaları için tercih edilen seçenek olmaya devam ediyor. Düşük bellek kullanımı, kapsamlı görev desteği (segmentasyon, poz, OBB) ve sağlam Ultralytics birleşimi, projelerin prototip aşamasından üretime minimum sürtünmeyle geçmesini sağlıyor.

En son teknolojiye sahip performans ve özellikler arayanlara, araştırmacıların sevdiği uçtan uca verimliliği Ultralytics kullanışlılığıyla bir araya getiren YOLO26'yı keşfetmelerini şiddetle tavsiye ederiz.

Daha Fazla Okuma


Yorumlar