İçeriğe geç

YOLOv8 - YOLO11: Gerçek Zamanlı Nesne Algılamanın Evrimi

Doğru bilgisayar görüşü mimarisini seçmek, yapay zeka projelerinizin hızını, doğruluğunu ve ölçeklenebilirliğini etkileyen kritik bir karardır. Bu kılavuz, 2023'te piyasaya sürülen ve yaygın olarak benimsenen bir endüstri standardı olan Ultralytics YOLOv8 ile üstün verimlilik ve performans için tasarlanmış YOLO serisindeki en son gelişme olan Ultralytics YOLO11 arasında derinlemesine teknik bir karşılaştırma sunar. İhtiyaçlarınız için en iyi modeli seçmenize yardımcı olmak amacıyla mimari farklılıklarını, karşılaştırma metriklerini ve ideal kullanım durumlarını analiz edeceğiz.

Ultralytics YOLOv8

Yazarlar: Glenn Jocher, Ayush Chaurasia ve Jing Qiu
Kuruluş:Ultralytics
Tarih: 2023-01-10
GitHub:https://github.com/ultralytics/ultralytics
Belgeler:https://docs.ultralytics.com/models/yolov8/

2023'ün başlarında yayınlanan YOLOv8, nesne algılama tarihinde önemli bir kilometre taşı oldu. Tek bir depoda algılama, örnek segmentasyonu, poz tahmini ve görüntü sınıflandırması dahil olmak üzere birden çok bilgisayar görüşü görevini destekleyen birleşik bir çerçeve tanıttı. YOLOv8, tasarımı basitleştiren ve farklı nesne şekillerinde genellemeyi iyileştiren ankrajsız bir yaklaşıma geçerek ankraj tabanlı algılamadan uzaklaştı.

Mimari ve Temel Özellikler

YOLOv8, YOLOv5'te bulunan C3 modüllerini C2f modülü (iki evrişimli Çapraz Aşamalı Kısmi darboğaz) ile değiştirdi. Bu değişiklik, hafif bir ayak izi korurken gradyan akışını ve özellik entegrasyonunu iyileştirdi. Mimari ayrıca, doğruluğu artırmak için nesnellik, sınıflandırma ve regresyon görevlerini ayıran ayrık bir başlığa sahiptir.

Güvenilirliğin Mirası

YOLOv8, üretim otomasyonundan otonom araçlara kadar binlerce ticari uygulamada test edilmiş olup, istikrarı ve dağıtım kolaylığı ile ün kazanmıştır.

Güçlü ve Zayıf Yönler

  • Güçlü Yönler:
    • Olgun Ekosistem: Geniş bir topluluk eğitimi, entegrasyonlar ve dağıtım kılavuzları tarafından desteklenir.
    • Çok Yönlülük: Standart algılamanın yanı sıra yerel olarak OBB'yi (Yönlendirilmiş Sınırlayıcı Kutu) ve sınıflandırmayı destekler.
    • Kanıtlanmış Kararlılık: Uzun bir geçmişe sahip bir model gerektiren üretim ortamları için güvenli bir seçimdir.
  • Zayıflıklar:
    • Hız Verimliliği: Hızlı olmasına rağmen, CPU çıkarım hızlarında ve parametre verimliliğinde YOLO11 tarafından geride bırakılır.
    • Hesaplama Gereksinimleri: Daha büyük varyantlar (L, X), optimize edilmiş YOLO11 eşdeğerlerine kıyasla daha fazla VRAM ve FLOPs gerektirir.
from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

YOLOv8 hakkında daha fazla bilgi edinin

Ultralytics YOLO11

Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş:Ultralytics
Tarih: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
Belgeler:https://docs.ultralytics.com/models/yolo11/

YOLO11, Ultralytics model ailesinin en son teknolojisini temsil eder. Gerçek zamanlı çıkarımı yeniden tanımlamak için tasarlanmış olup, YOLOv8'in başarıları üzerine inşa edilmiştir ancak önemli mimari iyileştirmeler sunar. YOLO11, hesaplama maliyetini en aza indirirken doğruluğu en üst düzeye çıkarmaya odaklanır ve bu da onu uç cihazlardan bulut sunucularına kadar modern yapay zeka uygulamaları için önde gelen bir seçim haline getirir.

Mimari ve Temel Özellikler

YOLO11, C3k2 bloğu ve C2PSA (Cross-Stage Partial with Spatial Attention) modülünü sunar. Bu bileşenler, modelin karmaşık özellikleri çıkarma ve önceki yinelemelere göre oklüzyonu daha etkili bir şekilde ele alma yeteneğini geliştirir. Mimari, GPU kaynaklarının kullanılamayabileceği uç yapay zeka dağıtımları için kritik bir faktör olan CPU'larda önemli ölçüde daha hızlı işlem süreleri sağlayarak hız için optimize edilmiştir.

Model, Ultralytics'in birleşik arayüz özelliğini koruyarak, geliştiricilerin iş akışlarını değiştirmeden OBB veya segmentasyon gibi görevler arasında geçiş yapabilmelerini sağlar.

Güçlü ve Zayıf Yönler

  • Güçlü Yönler:
    • Üstün Verimlilik: YOLOv8'e göre %22'ye kadar daha az parametreyle daha yüksek mAP elde ederek model boyutunu ve depolama ihtiyaçlarını azaltır.
    • Daha Hızlı Çıkarım: Hem CPU hem de GPU arka uçlarında daha yüksek hızlar sunarak modern donanım için özel olarak optimize edilmiştir.
    • Gelişmiş Özellik Çıkarımı: Yeni backbone, küçük nesnelerin detect edilmesini ve karmaşık sahnelerdeki performansı artırır.
    • Daha Düşük Bellek Kullanımı: RT-DETR gibi transformatör tabanlı modellere kıyasla eğitim sırasında daha az CUDA belleği gerektirir, bu da daha erişilebilir donanımlarda eğitime olanak tanır.
  • Zayıflıklar:
    • Daha Yeni Sürüm: Yeni bir model olduğundan, bazı üçüncü taraf araçlarının desteği tam olarak güncellemesi zaman alabilir, ancak temel Ultralytics ekosistemi ilk günden itibaren desteklemektedir.
from ultralytics import YOLO

# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

YOLO11 hakkında daha fazla bilgi edinin

Performans Kafa Kafaya

Aşağıdaki karşılaştırma, YOLO11'in verimlilik kazanımlarını vurgulamaktadır. YOLOv8 güçlü bir rakip olmaya devam ederken, YOLO11 sürekli olarak daha düşük hesaplama karmaşıklığı (FLOPs) ve daha hızlı çıkarım hızlarıyla daha yüksek doğruluk (mAP) sunar. Bu, özellikle "Nano" ve "Small" modellerinde belirgindir; burada YOLO11n, YOLOv8n'nin 37.3'üne kıyasla 39.5 mAP elde ederken, CPU'da önemli ölçüde daha hızlı çalışır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Metrik Analizi

YOLO11, hız-doğruluk dengesinde açık bir avantaj gösterir. Örneğin, YOLO11l modeli, YOLOv8l'yi doğrulukta (+0,5 mAP) aşarken, yaklaşık %42 daha az parametre kullanır ve CPU'da %36 daha hızlı çalışır.

Ekosistem ve Kullanım Kolaylığı

Her iki model de, en son teknolojiyi herkese erişilebilir kılarak yapay zekayı demokratikleştirmek için tasarlanmış olan güçlü Ultralytics ekosisteminden yararlanır.

  • Birleşik API: YOLOv8 ve YOLO11 arasında geçiş yapmak, model dizesini şu şekilde değiştirmek kadar basittir yolov8n.pt için yolo11n.pt. Kod yeniden düzenlemesi gerekmez.
  • Eğitim Verimliliği: Ultralytics, veri toplama işleminden model eğitimine kadar olan hattı kolaylaştıran otomatik indirme veri kümeleri ve önceden eğitilmiş ağırlıklar sağlar.
  • Dağıtım Çok Yönlülüğü: Her iki model de Raspberry Pi'ler, cep telefonları ve bulut örnekleri dahil olmak üzere çeşitli donanımlarda dağıtımı kolaylaştıran ONNX, TensorRT, CoreML ve TFLite gibi formatlara tek tıklamayla dışa aktarma özelliğini destekler.
  • İyi Yönetilen: Sık güncellemeler, Discord ve GitHub'daki aktif bir topluluk tarafından desteklenen PyTorch ve CUDA'nın en son sürümleriyle uyumluluğu sağlar.

Sonuç ve Öneriler

YOLOv8 eski sistemleri korumak için uygun, güvenilir ve oldukça yetenekli bir model olmaya devam ederken, YOLO11 tüm yeni geliştirmeler için açık bir öneridir.

  • Aşağıdaki durumlarda YOLO11'i seçin: Mümkün olan en yüksek doğruluğa, daha hızlı çıkarım hızlarına (özellikle CPU'da) ihtiyacınız varsa veya bellek ve depolama alanının önemli olduğu kaynak kısıtlı uç cihazlara dağıtım yapıyorsanız. Mimari iyileştirmeleri, ticari uygulamalar için geleceğe dönük bir temel sağlar.
  • Aşağıdaki durumlarda YOLOv8'i seçin: v8'e özgü davranışlar için yoğun bir şekilde ayarlanmış mevcut bir hattınız varsa veya en son mimariye güncelleme yapmayı engelleyen katı proje gereksinimleriyle sınırlıysanız.

Diğer mimarileri keşfetmek isteyenler için, Ultralytics belgeleri YOLOv9, YOLOv10 ve RT-DETR gibi modelleri de kapsar. Model karşılaştırma sayfamızda daha geniş karşılaştırmaları görüntüleyebilirsiniz.


Yorumlar