İçeriğe geç

YOLO11 - YOLOv8: Mimari Evrim ve Performans Analizi

Optimal bilgisayar görüşü modelini seçmek, doğruluk, hız ve kaynak verimliliğini dengelemeyi amaçlayan geliştiriciler ve araştırmacılar için kritik bir karardır. Bu sayfa, Ultralytics YOLO11 ve Ultralytics YOLOv8 arasında kapsamlı bir teknik karşılaştırma sunmaktadır; bu iki endüstri lideri mimari, nesne algılama ve gelişmiş vizyon görevleri için tasarlanmıştır. Yapay zeka uygulamalarınız için en uygun olanı belirlemenize yardımcı olmak için mimari yeniliklerini, kıyaslama metriklerini ve ideal dağıtım senaryolarını analiz ediyoruz.

Ultralytics YOLO11

Yazarlar: Glenn Jocher, Jing Qiu
Kuruluş:Ultralytics
Tarih: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
Belgeler:https://docs.ultralytics.com/models/yolo11/

YOLO11, özellik çıkarma ve işleme verimliliğinde önemli iyileştirmeler mühendisliği yaparak, ünlü YOLO serisindeki en son evrimi temsil eder. YOLO11, backbone ve neck mimarilerini iyileştirerek, seleflerine göre daha az parametre kullanırken daha yüksek ortalama Ortalama Hassasiyet (mAP) elde eder. Yerel olarak nesne segmentasyonu, görüntü sınıflandırma, poz tahmini ve yönlendirilmiş sınırlandırma kutuları (obb) dahil olmak üzere geniş bir görev yelpazesini destekler.

Mimari ve Temel Özellikler

YOLO11 mimarisi, CSP'nin (Cross Stage Partial - Çapraz Aşamalı Kısmi) optimize edilmiş bir versiyonu olan C3k2 bloğunu ve C2PSA (Spatial Attention ile Çapraz Aşamalı Kısmi) modülünü sunar. Bu bileşenler, modelin karmaşık görsel desenleri ve uzamsal ilişkileri yakalama yeteneğini geliştirirken, hesaplama yükünü en aza indirir. Bu tasarım felsefesi, YOLO11'in özellikle hesaplama kaynaklarının sınırlı olduğu uç cihazlarda gerçek zamanlı çıkarım senaryolarında mükemmel olmasını sağlar.

Güçlü Yönler

  • Son Teknoloji Doğruluğu: COCO veri kümesindeki önceki yinelemelerden sürekli olarak daha iyi performans göstererek tüm model ölçeklerinde üstün algılama performansı sunar.
  • CPU Verimliliği: Optimize edilmiş mimari seçimler, CPU'larda önemli ölçüde daha hızlı çıkarım hızları sağlar ve bu da onu sunucusuz veya uç dağıtımlar için en iyi seçenek haline getirir.
  • Parametre Verimliliği: Daha az parametre ve FLOP ile yüksek doğruluk sağlar, model depolama gereksinimlerini azaltır.
  • Birleşik Çerçeve: Tek, kullanımı kolay bir API içinde birden fazla görme görevini sorunsuz bir şekilde yönetir.

Zayıflıklar

  • Ekosistem Olgunluğu: Daha yeni bir sürüm olduğundan, üçüncü taraf eğitimlerinin ve topluluk tarafından oluşturulan içeriğin hacmi hızla artmaktadır, ancak yerleşik YOLOv8'den daha az kapsamlı olabilir.
  • Büyük Modeller için Kaynak Yoğunluğu: Verimli olmasına rağmen, en büyük varyantlar (örneğin, YOLO11x) hala eğitim ve yüksek verimli çıkarım için önemli GPU kaynakları gerektirir.

Kullanım Alanları

YOLO11, mümkün olan en yüksek doğruluk-hız oranını gerektiren uygulamalar için en iyi seçenektir:

  • Uç Yapay Zeka: NVIDIA Jetson veya Raspberry Pi cihazlarında yüksek performanslı detect dağıtımı.
  • Gerçek Zamanlı Robotik: Minimum gecikmeyle otonom navigasyonu ve nesne etkileşimini mümkün kılar.
  • Tıbbi Görüntüleme: Doğruluğun çok önemli olduğu teşhisler için hassas tıbbi görüntü analizine yardımcı olma.

YOLO11 hakkında daha fazla bilgi edinin

Ultralytics YOLOv8

Yazarlar: Glenn Jocher, Ayush Chaurasia, Jing Qiu
Kuruluş:Ultralytics
Tarih: 2023-01-10
GitHub:https://github.com/ultralytics/ultralytics
Belgeler:https://docs.ultralytics.com/models/yolov8/

2023'ün başlarında yayınlanan YOLOv8, gerçek zamanlı nesne algılama standardını yeniden tanımladı. Ankrajsız bir algılama başlığı ve C2f backbone modülünü tanıtarak ankraj tabanlı yaklaşımlardan önemli bir sapma gösterdi. YOLOv8, istikrarı, çok yönlülüğü ve etrafında gelişen devasa ekosistem ile ünlüdür ve bu da onu küresel olarak en yaygın kullanılan vizyon modellerinden biri yapmaktadır.

Mimari ve Temel Özellikler

YOLOv8, daha zengin gradyan akışına izin veren C2f modüllerini içeren CSPDarknet53 backbone'unun bir modifikasyonunu kullanır. Anchor-free tasarımı, non-maximum suppression (NMS) sürecini basitleştirir ve anchor kutularıyla ilgili hiperparametre ayarlamasının karmaşıklığını azaltır. Model, çeşitli hesaplama bütçelerine uyacak şekilde Nano (n)'dan Ekstra Büyük (x)'e kadar varyantlar sunarak son derece ölçeklenebilirdir.

Güçlü Yönler

  • Kanıtlanmış Güvenilirlik: dünya çapında üretim ortamlarında kapsamlı bir şekilde test edilmiş olup yüksek stabilite sağlar.
  • Zengin Ekosistem: binlerce eğitim, entegrasyon ve topluluk projesi tarafından desteklenmektedir.
  • Çok Yönlülük: YOLO11 gibi, algılama, segmentasyon, sınıflandırma ve poz tahmini özelliklerini destekler.
  • Güçlü Temel: Birçok YOLO dışı mimariyi aşan rekabetçi performans sunmaya devam ediyor.

Zayıflıklar

  • Performans Açığı: Genellikle doğruluk (mAP) ve çıkarım hızı açısından, özellikle CPU donanımında, YOLO11 tarafından geride bırakılır.
  • Daha Yüksek Hesaplama Maliyeti: YOLO11'e kıyasla karşılaştırılabilir doğruluğu elde etmek için biraz daha fazla parametre ve FLOP gerektirir.

Kullanım Alanları

YOLOv8 aşağıdakiler için mükemmel bir seçenektir:

  • Eski Sistemler: En son performanstan ziyade kararlılık gerektiren YOLOv8 iş akışlarıyla zaten entegre edilmiş projeler.
  • Eğitim Araçları: Kapsamlı dokümantasyona ve topluluk örneklerine sahip bir model kullanarak bilgisayarlı görü kavramlarını öğrenme.
  • Genel Amaçlı Algılama: Standart güvenlik ve izleme uygulamaları için güvenilir performans.

YOLOv8 hakkında daha fazla bilgi edinin

Performans Kafa Kafaya

Bu iki model arasındaki en önemli fark verimliliklerinde yatmaktadır. YOLO11 , YOLOv8'e göre bir "Pareto iyileştirmesi" gerçekleştirerek daha düşük hesaplama maliyeti ile daha yüksek doğruluk sunmaktadır.

Verimlilik ve Hız Analizi

YOLO11'deki (C3k2, C2PSA) mimari optimizasyonlar, daha ince ayrıntılı özellikleri korurken görüntüleri daha hızlı işlemesini sağlar. Bu durum en çok CPU çıkarımında belirgindir; burada YOLO11 modelleri önemli ölçüde hızlanma gösterir. Örneğin, YOLO11n modeli, CPU üzerinde YOLOv8n'den yaklaşık %30 daha hızlıdır ve aynı zamanda daha yüksek bir mAP elde eder.

GPU çıkarımı açısından, YOLO11 modelleri de çoğu boyutta daha düşük gecikme süresi göstererek, onları gerçek zamanlı video işleme hatları için oldukça etkili hale getirir.

Bellek Verimliliği

Hem Ultralytics YOLO11 hem de YOLOv8, RT-DETR gibi transformatör tabanlı modellere kıyasla eğitim ve çıkarım sırasında düşük bellek tüketimi için tasarlanmıştır. Bu, tüketici sınıfı donanım veya sınırlı CUDA belleğine sahip bulut ortamları kullanan geliştiriciler için onları çok daha erişilebilir kılar.

Karşılaştırmalı Metrikler

Aşağıdaki tablo, performans iyileştirmelerini göstermektedir. mAP'deki artışın yanı sıra YOLO11 için parametrelerdeki ve FLOP'lardaki azalmaya dikkat edin.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Ultralytics Ekosisteminin Avantajı

Bir Ultralytics modeli seçmek, tüm MLOps yaşam döngüsünü kolaylaştırmak için tasarlanmış kapsamlı bir ekosisteme erişim kazanmak anlamına gelir.

  • Kullanım Kolaylığı: Her iki model de aynı python API ve Komut Satırı Arayüzü (CLI). YOLOv8'den YOLO11'e geçmek genellikle kod dizenizde yalnızca tek bir karakteri değiştirmeyi gerektirir (örneğin, "yolov8n.pt" için "yolo11n.pt").
  • Eğitim Verimliliği: Ultralytics modelleri, mozaik artırma ve hiperparametre evrimi dahil olmak üzere gelişmiş eğitim rutinleri kullanır. Önceden eğitilmiş ağırlıklar kolayca bulunur ve özel veri kümelerinde verimli transfer öğrenimine olanak tanır.
  • Çok Yönlülük: Belirli görevlerle sınırlı birçok rakibin aksine, Ultralytics modelleri birleşik bir paket içinde algılama, segmentasyon, sınıflandırma, poz ve OBB için yerel destek sunar.
  • Dağıtım: Çeşitli donanımlarda optimize edilmiş dağıtım için modelleri ONNX, TensorRT, CoreML ve OpenVINO gibi formatlara kolayca aktarın.

Birleşik Kullanım Örneği

Paylaşılan API tasarımı, zahmetsiz denemelere olanak tanır. İşte her iki modelle de tahmini nasıl yükleyip çalıştırabileceğiniz:

from ultralytics import YOLO

# Load YOLO11 or YOLOv8 by simply changing the model name
model = YOLO("yolo11n.pt")  # or "yolov8n.pt"

# Train on a custom dataset
# model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

Sonuç: Hangi Modeli Seçmelisiniz?

Yeni projelerin büyük çoğunluğu için YOLO11 önerilen seçimdir. Mimari gelişmeleri, özellikle verimliliğin kritik olduğu uç bilişim uygulamaları için hem doğruluk hem de hızda açık bir avantaj sağlar. Azaltılmış parametre sayısı ayrıca mobil dağıtımlar için daha hafif depolama gereksinimleri ve daha hızlı indirme süreleri anlamına gelir.

YOLOv8, özellikle belirli YOLOv8 sürümleriyle derinlemesine entegre edilmiş mevcut boru hatlarına sahip ekipler veya dokümantasyon ekosisteminin mutlak olgunluğuna güvenenler için güçlü ve alakalı bir araç olmaya devam ediyor. Bununla birlikte, YOLO11'e geçmek genellikle basittir ve anında performans avantajları sağlar.

Her iki model de AGPL-3.0 lisansı altında yayınlanmıştır ve açık kaynak işbirliğini teşvik etmektedir. Tescilli özellikler gerektiren ticari ürünler için Kurumsal Lisanslar mevcuttur.

Diğer Modelleri İnceleyin

YOLO11 ve YOLOv8 mükemmel genel amaçlı dedektörler olsa da, özel gereksinimler Ultralytics ailesindeki diğer mimarilerden yararlanabilir:

  • YOLOv10: Daha düşük gecikme için NMS'siz eğitime odaklanır.
  • YOLOv9: Derin model eğitimi için programlanabilir gradyan bilgilerini vurgular.
  • RT-DETR: Daha yüksek bellek ve işlem gereksinimleriyle birlikte yüksek doğruluk sunan, dönüştürücü tabanlı bir dedektör.

Projeniz için mükemmel uyumu bulmak için model karşılaştırmaları yelpazemizi keşfedin.


Yorumlar