İçeriğe geç

YOLOv5 ve YOLOv8 Karşılaştırması: Ultralytics Vizyon Yapay Zekasının Evrimini Değerlendirmek

Ölçeklenebilir ve verimli bilgisayar görüşü uygulamaları geliştirirken, doğru mimariyi seçmek kritik öneme sahiptir. Ultralytics ekosisteminin evrimi, hız ve doğruluk sınırlarını sürekli zorlayarak geliştiricilere gerçek dünya dağıtımları için sağlam araçlar sunmuştur. Bu teknik karşılaştırma, bir sonraki yapay zeka projeniz için bilinçli bir karar vermenize yardımcı olmak amacıyla YOLOv5 ve YOLOv8 arasındaki farkları, mimarilerini, performans ödünleşimlerini ve ideal kullanım durumlarını incelemektedir.

Bu modellerin her ikisi de gerçek zamanlı nesne algılama tarihinde önemli kilometre taşlarını temsil etmektedir ve her ikisi de Ultralytics ekosistemini karakterize eden yüksek düzeyde optimize edilmiş bellek gereksinimlerinden ve kullanım kolaylığından faydalanmaktadır.

YOLOv5: Güvenilir Endüstri Standardı

2020'de tanıtılan YOLOv5, hızlı, erişilebilir ve güvenilir nesne algılama için hızla endüstri standardı haline geldi. Yerel bir PyTorch uygulaması kullanarak, dünya genelindeki mühendisler için eğitim ve dağıtım yaşam döngüsünü kolaylaştırdı.

Mimari Güçlü Yönler

YOLOv5, nesne sınırlarını tahmin etmek için önceden tanımlanmış anchor kutularına dayanan, anchor tabanlı bir algılama paradigması üzerinde çalışır. Mimarisi, gradyan akışını optimize eden ve hesaplama fazlalığını azaltan bir Cross-Stage Partial (CSP) ağ backbone'unu içerir. Bu, inanılmaz derecede hafif bir bellek ayak iziyle sonuçlanır ve standart tüketici GPU'larında bile eğitimi olağanüstü hızlı hale getirir.

İdeal Kullanım Senaryoları

YOLOv5, maksimum verim ve minimum kaynak kullanımı öncelikli olan projeler için şiddetle tavsiye edilir. Edge AI ortamlarında, örneğin Raspberry Pi veya mobil cihazlarda dağıtım gibi alanlarda üstün performans gösterir. Olgunluğu, binlerce ticari dağıtımda kapsamlı bir şekilde test edildiği ve geleneksel nesne algılama iş akışları için eşsiz bir kararlılık sunduğu anlamına gelir.

Eski Dağıtım Avantajı

Yaygın olarak benimsenmesi sayesinde YOLOv5, TensorRT ve ONNX gibi eski dağıtım çerçevelerine inanılmaz derecede kararlı dışa aktarma yollarına sahiptir, bu da eski teknoloji yığınlarına entegrasyonu sorunsuz hale getirir.

YOLOv5 hakkında daha fazla bilgi edinin.

YOLOv8: Birleşik Vizyon Çerçevesi

Ocak 2023'te piyasaya sürülen YOLOv8, anıtsal bir mimari değişimi temsil etti ve özel bir nesne algılayıcıdan çok yönlü, çok görevli bir vizyon çerçevesine evrildi.

Mimari Yenilikler

Selefinin aksine, YOLOv8 anchor-free bir algılama başlığı sunar. Bu, veri kümesi dağılımlarına göre anchor yapılandırmalarını manuel olarak ayarlama ihtiyacını ortadan kaldırarak, popüler COCO veri kümesi gibi çeşitli özel veri kümelerinde genellemeyi artırır.

Mimari ayrıca, eski C3 modülünün yerini alan C2f modülü (iki evrişimli Cross-Stage Partial darboğazı) ile backbone'u yükseltir. Bu geliştirme, belleği aşırı derecede zorlamadan özellik temsilini iyileştirir. Ek olarak, nesnellik, sınıflandırma ve regresyon görevlerini ayıran ayrık bir başlığın uygulanması, model eğitimi sırasında yakınsamayı önemli ölçüde iyileştirir.

Çok Yönlülük ve Python API

YOLOv8, modern ultralytics Python API'sini tanıttı ve çeşitli bilgisayar görüşü görevlerinde iş akışını standartlaştırdı. İster görüntü segmentasyonu, görüntü sınıflandırma, veya poz tahmini, birleşik API yalnızca küçük yapılandırma değişiklikleri gerektirir.

from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train on a custom dataset with built-in memory efficiency
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference and easily parse results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

YOLOv8 hakkında daha fazla bilgi edinin.

Detaylı Performans Karşılaştırması

İki nesli karşılaştırdığımızda klasik bir denge görüyoruz: YOLOv8 genel olarak daha yüksek ortalama Hassasiyet (mAP) elde ederken, YOLOv5 en küçük varyantları için mutlak ham çıkarım hızında ve parametre sayısında hafif bir avantaja sahiptir.

Aşağıda, 640 piksel görüntü boyutunda COCO veri kümesi üzerindeki performans metriklerinin ayrıntılı karşılaştırması yer almaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Veriler, YOLOv8'in doğrulukta önemli bir artış sağladığını ortaya koymaktadır. Örneğin, YOLOv8s 44.9 mAP elde ederken, YOLOv5s 37.4 mAP'ye kıyasla, yoğun ortamlarda veya küçük nesneleri tanımlarken performansı önemli ölçüde artıran büyük bir sıçramadır. Ancak, ultra kısıtlı ortamlar için, YOLOv5n inanılmaz derecede verimli kalır, en düşük parametre sayısına ve FLOPs'a sahiptir.

Bellek Gereksinimleri

Her iki model de, transformer modelleri gibi daha ağır mimarilere kıyasla eğitim sırasında daha düşük CUDA bellek kullanımı için yüksek düzeyde optimize edilmiştir. Bu, uygulayıcıların standart GPU'larda daha büyük yığın boyutları kullanmasına olanak tanıyarak araştırma yaşam döngüsünü hızlandırır.

Ekosistem Avantajı

YOLOv5 veya YOLOv8'i seçmek, geliştiricilere iyi yönetilen Ultralytics Platformu'na erişim sağlar. Bu entegre ortam, veri kümesi açıklama, hiperparametre ayarlama, bulut eğitimi ve model izleme için basit araçlar sunar. Aktif geliştirme ve güçlü topluluk desteği, geliştiricilerin sorunları hızlı bir şekilde çözmesini ve Weights & Biases ve ClearML gibi harici araçlarla entegre olmasını sağlar.

Diğer çerçeveler dik öğrenme eğrilerinden muzdarip olabilirken, Ultralytics, çeşitli gerçek dünya dağıtım senaryolarına uygun hız ve doğruluk arasında avantajlı bir denge sağlayarak kolaylaştırılmış bir kullanıcı deneyimine öncelik verir.

v8'in Ötesinde: YOLO11 ve YOLO26'yı Keşfetmek

YOLOv8 oldukça yetenekli bir çerçeve olsa da, yapay zeka alanı hızla gelişmektedir. En son teknoloji performansıyla ilgilenen geliştiriciler, v8 üzerine inşa edilmiş, geliştirilmiş hassasiyet ve hıza sahip YOLO11'i de keşfetmelidir.

Bilgisayar görüşü teknolojisinin mutlak en son noktasını arayanlar için, Ultralytics YOLO26'yı şiddetle tavsiye ediyoruz. 2026'da piyasaya sürülen YOLO26, büyük bir ilerlemeyi temsil ediyor:

  • Uçtan Uca NMS-Free Tasarım: Başlangıçta deneysel mimarilerde öncülük edilen YOLO26, Non-Maximum Suppression sonrası işlemeyi doğal olarak ortadan kaldırarak, önemli ölçüde daha basit ve daha hızlı dağıtım hatları sağlar.
  • MuSGD Optimize Edici: Kimi K2 gibi modellerde görülen LLM eğitim yeniliklerinden esinlenen YOLO26, daha kararlı eğitim ve hızlı yakınsama için hibrit bir optimize edici kullanır.
  • Uç Bilişim Uzmanlığı: Önceki nesillere kıyasla %43'e kadar daha hızlı CPU çıkarımı ile, özel GPU'ları olmayan cihazlar için nihai modeldir.
  • Geliştirilmiş Doğruluk: Yeni ProgLoss + STAL kayıp fonksiyonlarını kullanarak, robotik ve hava drone görüntüleri için kritik olan küçük nesne tanımayı önemli ölçüde iyileştirir.

YOLOv5 ile eski bir sistemi sürdürmek, YOLOv8 ile çok yönlü bir uygulamayı ölçeklendirmek veya YOLO26'nın en son yetenekleriyle yenilik yapmak olsun, Ultralytics paketi modern yapay zeka vizyonunda başarı için gerekli kapsamlı araçları sağlar.


Yorumlar