YOLOv5 ve YOLOv8: Ultralytics Vision AI'ın Evrimini Değerlendirmek
Ölçeklenebilir ve verimli bilgisayarlı görü uygulamaları oluştururken, doğru mimariyi seçmek kritik öneme sahiptir. Ultralytics ekosisteminin evrimi, hız ve doğruluk sınırlarını sürekli zorlayarak geliştiricilere gerçek dünya dağıtımları için sağlam araçlar sunmuştur. Bu teknik karşılaştırma, bir sonraki yapay zeka projeniz için bilinçli bir karar vermenize yardımcı olmak adına YOLOv5 ve YOLOv8 arasındaki farkları, mimarilerini, performans ödünleşimlerini ve ideal kullanım senaryolarını incelemektedir.
Bu modellerin her ikisi de gerçek zamanlı nesne tespiti tarihinde önemli kilometre taşlarını temsil eder ve her ikisi de Ultralytics ekosistemini karakterize eden oldukça optimize edilmiş bellek gereksinimlerinden ve kullanım kolaylığından yararlanır.
YOLOv5: Güvenilir Endüstri Standardı
2020'de tanıtılan YOLOv5, hızlı, erişilebilir ve güvenilir nesne tespiti için kısa sürede endüstri standardı haline geldi. Yerel bir PyTorch uygulamasından yararlanarak, dünya genelindeki mühendisler için eğitim ve dağıtım yaşam döngüsünü kolaylaştırdı.
- Yazarlar: Glenn Jocher
- Kuruluş: Ultralytics
- Tarih: 2020-06-26
- GitHub: ultralytics/yolov5
- Dokümanlar: YOLOv5 Dokümantasyonu
Mimari Güçlü Yönler
YOLOv5, nesne sınırlarını tahmin etmek için önceden tanımlanmış çapa kutularına dayanan çapa tabanlı bir tespit paradigması ile çalışır. Mimarisi, gradyan akışını optimize eden ve hesaplama yedekliliğini azaltan bir Cross-Stage Partial (CSP) ağ omurgasını bünyesinde barındırır. Bu, inanılmaz derecede hafif bir bellek ayak izi ile sonuçlanır ve standart tüketici GPU'larında bile eğitilmeyi son derece hızlı hale getirir.
İdeal Kullanım Durumları
YOLOv5 is highly recommended for projects where maximum throughput and minimal resource utilization are paramount. It excels in edge AI environments, such as deploying on Raspberry Pi or mobile devices. Its maturity means it has been thoroughly battle-tested in thousands of commercial deployments, offering unmatched stability for traditional object detection workflows.
YOLOv5 hakkında daha fazla bilgi edin
YOLOv8: Birleşik Görü Çerçevesi
Ocak 2023'te piyasaya sürülen YOLOv8, özel bir nesne tespit edicisinden çok yönlü, çok görevli bir görü çerçevesine evrilerek anıtsal bir mimari değişimi temsil etti.
- Yazarlar: Glenn Jocher, Ayush Chaurasia ve Jing Qiu
- Kuruluş: Ultralytics
- Tarih: 2023-01-10
- GitHub: ultralytics/ultralytics
- Dokümantasyon: YOLOv8 Dokümantasyonu
Mimari Yenilikler
Selefinin aksine YOLOv8, çapasız (anchor-free) bir tespit başlığı sunar. Bu, veri kümesi dağılımlarına göre çapa yapılandırmalarını manuel olarak ayarlama ihtiyacını ortadan kaldırır ve popüler COCO veri kümesi gibi çeşitli özel veri kümelerinde genelleştirmeyi geliştirir.
Mimari ayrıca, daha eski C3 modülünün yerini alan bir C2f modülü (iki konvolüsyonlu Cross-Stage Partial darboğaz) ile omurgayı yükseltir. Bu geliştirme, belleği ağır bir şekilde yormadan özellik temsilini iyileştirir. Ek olarak, nesnellik, sınıflandırma ve regresyon görevlerini ayıran ayrıştırılmış bir başlığın uygulanması, model eğitimi sırasındaki yakınsamayı önemli ölçüde iyileştirir.
Çok Yönlülük ve Python API
YOLOv8, çeşitli bilgisayarlı görü görevlerinde iş akışını standartlaştıran modern ultralytics Python API'sini tanıttı. İster görüntü segmentasyonu, ister görüntü sınıflandırma veya poz tahmini gerçekleştiriyor ol, birleşik API yalnızca küçük yapılandırma değişiklikleri gerektirir.
from ultralytics import YOLO
# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")
# Train on a custom dataset with built-in memory efficiency
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference and easily parse results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()YOLOv8 hakkında daha fazla bilgi edin
Ayrıntılı Performans Karşılaştırması
İki nesli karşılaştırdığımızda klasik bir ödünleşim gözlemliyoruz: YOLOv8 genel olarak daha yüksek ortalama Hassasiyet (mAP) elde ederken, YOLOv5 en küçük varyantları için mutlak ham çıkarım hızı ve parametre sayısında hafif bir üstünlüğü korur.
Aşağıda, 640 piksel görüntü boyutunda COCO veri kümesi üzerindeki performans metriklerinin ayrıntılı karşılaştırması yer almaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametre (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
Veriler, YOLOv8'in doğrulukta önemli bir artış sağladığını ortaya koyuyor. Örneğin, YOLOv8s, 37.4 mAP olan YOLOv5s ile karşılaştırıldığında 44.9 mAP elde ediyor; bu, yoğun ortamlarda veya küçük nesneleri tanımlarken performansı önemli ölçüde artıran devasa bir sıçramadır. Bununla birlikte, aşırı kısıtlanmış ortamlar için YOLOv5n, en düşük parametre sayısı ve FLOP değerleriyle inanılmaz derecede verimli kalmaya devam ediyor.
Her iki model de, transformer modelleri gibi daha ağır mimarilere kıyasla eğitim sırasında daha düşük CUDA bellek kullanımı için oldukça optimize edilmiştir. Bu, uygulayıcıların standart GPU'larda daha büyük yığın boyutları kullanmasına olanak tanıyarak araştırma yaşam döngüsünü hızlandırır.
Ekosistem Avantajı
YOLOv5 veya YOLOv8'i seçmek, geliştiricilere bakımı iyi yapılmış Ultralytics Platform erişimi sağlar. Bu entegre ortam, veri kümesi etiketleme, hiperparametre ayarı, bulut eğitimi ve model izleme için basit araçlar sunar. Aktif geliştirme ve güçlü topluluk desteği, geliştiricilerin sorunları hızlı bir şekilde çözebilmelerini ve Weights & Biases ve ClearML gibi harici araçlarla entegre olabilmelerini sağlar.
Diğer çerçeveler dik öğrenme eğrilerinden muzdarip olabilirken, Ultralytics kolaylaştırılmış bir kullanıcı deneyimine öncelik vererek çeşitli gerçek dünya dağıtım senaryoları için uygun hız ve doğruluk arasında elverişli bir ödünleşim sağlar.
v8'in Ötesinde: YOLO11 ve YOLO26'yı Keşfetmek
YOLOv8 oldukça yetenekli bir çerçeve olsa da, yapay zeka alanı hızla gelişmektedir. En son teknoloji performansı ile ilgilenen geliştiriciler, v8 üzerine inşa edilen ve geliştirilmiş hassasiyet ve hıza sahip YOLO11 modelini de keşfetmelidir.
Bilgisayarlı görü teknolojisinin mutlak sınırlarını arayanlar için Ultralytics YOLO26 modelini şiddetle tavsiye ediyoruz. 2026'da piyasaya sürülen YOLO26, ileriye doğru devasa bir sıçramayı temsil ediyor:
- Uçtan Uca NMS-Free Tasarım: Başlangıçta deneysel mimarilerde öncülük edilen YOLO26, Non-Maximum Suppression (NMS) sonrası işlemeyi yerel olarak ortadan kaldırarak çok daha basit ve hızlı dağıtım hatlarına yol açar.
- MuSGD Optimize Edici: Kimi K2 gibi modellerde görülen LLM eğitim yeniliklerinden ilham alan YOLO26, daha kararlı eğitim ve hızlı yakınsama için hibrit bir optimize edici kullanır.
- Uç Bilişim Ustalığı: Önceki nesillere kıyasla %43'e kadar daha hızlı CPU çıkarımı ile, özel GPU'lardan yoksun cihazlar için nihai modeldir.
- Gelişmiş Doğruluk: Yeni ProgLoss + STAL kayıp fonksiyonlarını kullanarak, robotik ve hava dronu görüntüleri için kritik olan küçük nesne tanımayı önemli ölçüde iyileştirir.
İster YOLOv5 ile eski bir sistemi koruyor, ister YOLOv8 ile çok yönlü bir uygulamayı ölçeklendiriyor veya YOLO26'nın en son yetenekleriyle yenilik yapıyor ol, Ultralytics paketi modern görü yapay zekasında başarı için gereken kapsamlı araçları sağlar.