İçeriğe geç

YOLO11 vs YOLOv8: Mimari Evrim ve Performans Analizi

Doğruluk, hız ve kaynak verimliliğini dengelemeyi amaçlayan geliştiriciler ve araştırmacılar için en uygun bilgisayarla görme modelini seçmek kritik bir karardır. Bu sayfa aşağıdakiler arasında kapsamlı bir teknik karşılaştırma sunmaktadır Ultralytics YOLO11 ve Ultralytics YOLOv8nesne algılama ve gelişmiş görüş görevleri için tasarlanmış iki endüstri lideri mimari. Yapay zeka uygulamalarınız için en uygun olanı belirlemenize yardımcı olmak için mimari yeniliklerini, kıyaslama metriklerini ve ideal dağıtım senaryolarını analiz ediyoruz.

Ultralytics YOLO11

Yazarlar: Glenn Jocher, Jing Qiu
Organizasyon:Ultralytics
Tarih: 2024-09-27
GitHubultralytics
Docsultralyticsyolo11

YOLO11 , özellik çıkarma ve işleme verimliliğinde önemli gelişmeler sağlayan ünlü YOLO serisinin en son evrimini temsil etmektedir. backbone ve boyun mimarilerini iyileştiren YOLO11 , öncekilere göre daha az parametre kullanırken daha yüksek Ortalama Hassasiyet (mAP) elde eder. Örnek segmentasyonu, görüntü sınıflandırması, poz tahmini ve yönlendirilmiş sınırlayıcı kutular (OBB) dahil olmak üzere geniş bir görev yelpazesini yerel olarak destekler.

Mimari ve Temel Özellikler

YOLO11 mimarisi, CSP (Cross Stage Partial) darboğazının optimize edilmiş bir versiyonu olan C3k2 bloğunu ve C2PSA (Cross Stage Partial with Spatial Attention) modülünü sunar. Bu bileşenler, modelin karmaşık görsel desenleri ve uzamsal ilişkileri yakalama yeteneğini geliştirirken hesaplama yükünü en aza indirir. Bu tasarım felsefesi, YOLO11 ' in gerçek zamanlı çıkarım senaryolarında, özellikle de hesaplama kaynaklarının sınırlı olduğu uç cihazlarda üstün olmasını sağlar.

Güçlü Yönler

  • Son Teknoloji Doğruluk: Tüm model ölçeklerinde üstün tespit performansı sunar ve COCO veri setindeki önceki yinelemelerden sürekli olarak daha iyi performans gösterir.
  • CPU Verimliliği: Optimize edilmiş mimari seçimler, CPU'larda önemli ölçüde daha yüksek çıkarım hızları sağlayarak sunucusuz veya uç dağıtımlar için en iyi seçim haline getirir.
  • Parametre Verimliliği: Daha az parametre ve FLOP ile yüksek doğruluk elde ederek model depolama gereksinimlerini azaltır.
  • Birleşik Çerçeve: Tek, kullanımı kolay bir API içinde birden fazla görüntü görevini sorunsuz bir şekilde gerçekleştirir.

Zayıflıklar

  • Ekosistem Olgunluğu: Daha yeni bir sürüm olarak, üçüncü taraf öğreticilerin ve topluluk tarafından oluşturulan içeriğin hacmi hızla artmaktadır, ancak yerleşik YOLOv8'den daha az kapsamlı olabilir.
  • Büyük Modeller için Kaynak Yoğunluğu: Verimli olmakla birlikte, en büyük varyantlar (örneğin, YOLO11x) eğitim ve yüksek verimli çıkarım için hala önemli GPU kaynakları gerektirmektedir.

Kullanım Alanları

YOLO11 , mümkün olan en yüksek doğruluk-hız oranı gerektiren uygulamalar için önde gelen seçimdir:

  • Edge AI: NVIDIA Jetson veya Raspberry Pi cihazlarında yüksek performanslı algılama dağıtımı.
  • Gerçek Zamanlı Robotik: Minimum gecikmeyle otonom navigasyon ve nesne etkileşimini mümkün kılmak.
  • Tıbbi Görüntüleme: Doğruluğun çok önemli olduğu teşhisler için hassas tıbbi görüntü analizine yardımcı olmak.

YOLO11 hakkında daha fazla bilgi edinin

Ultralytics YOLOv8

Yazarlar Glenn Jocher, Ayush Chaurasia, Jing Qiu
Organizasyon:Ultralytics
Tarih: 2023-01-10
GitHubultralytics
Docsultralyticsyolov8

2023'ün başlarında piyasaya sürülen YOLOv8 , gerçek zamanlı nesne algılama standardını yeniden tanımladı. Çapasız bir algılama kafası ve C2f backbone modülünü tanıtarak çapa tabanlı yaklaşımlardan önemli bir ayrımı işaret etti. YOLOv8 , kararlılığı, çok yönlülüğü ve etrafında gelişen devasa ekosistemiyle ünlüdür ve bu da onu dünya çapında en yaygın şekilde benimsenen görüntü modellerinden biri haline getirmiştir.

Mimari ve Temel Özellikler

YOLOv8 , daha zengin gradyan akışına izin veren C2f modüllerini içeren CSPDarknet53 backbone bir modifikasyonunu kullanır. Çapasız tasarımı, maksimum olmayan bastırma (NMS) sürecini basitleştirir ve çapa kutularıyla ilgili hiperparametre ayarının karmaşıklığını azaltır. Model, çeşitli hesaplama bütçelerine uyacak şekilde Nano'dan (n) Ekstra Büyük'e (x) kadar varyantlar sunarak oldukça ölçeklenebilirdir.

Güçlü Yönler

  • Kanıtlanmış Güvenilirlik: Dünya çapında üretim ortamlarında kapsamlı bir şekilde test edilerek yüksek kararlılık sağlanmıştır.
  • Zengin Ekosistem: binlerce öğretici, entegrasyon ve topluluk projesi tarafından desteklenir.
  • Çok yönlülük: YOLO11 gibi algılama, segmentasyon, sınıflandırma ve poz tahminini destekler.
  • Güçlü Temel: YOLO olmayan birçok mimariyi aşan rekabetçi performans sunmaya devam ediyor.

Zayıflıklar

  • Performans Açığı: Özellikle CPU donanımında hem doğrulukmAP) hem de çıkarım hızında YOLO11 tarafından genel olarak aşılmıştır.
  • Daha Yüksek Hesaplama Maliyeti: YOLO11 ile karşılaştırılabilir doğruluk elde etmek için biraz daha fazla parametre ve FLOP gerektirir.

Kullanım Alanları

YOLOv8 , aşağıdakiler için mükemmel bir seçenek olmaya devam ediyor:

  • Eski Sistemler: YOLOv8 iş akışlarıyla halihazırda entegre olan ve son teknoloji performans yerine istikrar gerektiren projeler.
  • Eğitim Araçları: Geniş dokümantasyona ve topluluk örneklerine sahip bir model kullanarak bilgisayarla görme kavramlarını öğrenmek.
  • Genel Amaçlı Algılama: Standart güvenlik ve izleme uygulamaları için güvenilir performans.

YOLOv8 hakkında daha fazla bilgi edinin

Performans Kafa Kafaya

Bu iki model arasındaki en önemli fark verimliliklerinde yatmaktadır. YOLO11 , YOLOv8'e göre bir "Pareto iyileştirmesi" gerçekleştirerek daha düşük hesaplama maliyeti ile daha yüksek doğruluk sunmaktadır.

Verimlilik ve Hız Analizi

YOLO11 'deki mimari optimizasyonlar (C3k2, C2PSA), daha ince taneli özellikleri korurken görüntüleri daha hızlı işlemesine olanak tanır. Bu durum en çok YOLO11 modellerinin önemli hız artışları gösterdiği CPU çıkarımlarında görülmektedir. Örneğin, YOLO11n modeli CPU 'da YOLOv8n 'den yaklaşık %30 daha hızlıdır ve aynı zamanda daha yüksek bir mAP elde eder.

GPU çıkarımı açısından, YOLO11 modelleri ayrıca çoğu boyutta daha düşük gecikme süresi göstererek gerçek zamanlı video işleme ardışık düzenleri için oldukça etkili hale gelir.

Bellek Verimliliği

Hem Ultralytics YOLO11 hem de YOLOv8 , eğitim ve çıkarım sırasında transformatör tabanlı modellere kıyasla düşük bellek tüketimi için tasarlanmıştır. RT-DETR. Bu da onları tüketici sınıfı donanım veya sınırlı CUDA belleğine sahip bulut ortamları kullanan geliştiriciler için çok daha erişilebilir hale getiriyor.

Karşılaştırmalı Metrikler

Aşağıdaki tabloda performans iyileştirmeleri gösterilmektedir. YOLO11 için parametrelerdeki ve FLOP'lardaki azalmanın yanı sıra mAP'deki artışa dikkat edin.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Ultralytics Ekosistem Avantajı

Bir Ultralytics modeli seçmek, tüm MLOps yaşam döngüsünü kolaylaştırmak için tasarlanmış kapsamlı bir ekosisteme erişim kazanmak anlamına gelir.

  • Kullanım Kolaylığı: Her iki model de aynı python API ve Komut Satırı ArayüzüCLI). YOLOv8 'den YOLO11 'e geçiş genellikle kod dizenizde yalnızca tek bir karakterin değiştirilmesini gerektirir (örn, "yolov8n.pt" için "yolo11n.pt").
  • Eğitim Verimliliği: Ultralytics modelleri, mozaik büyütme ve hiperparametre evrimi dahil olmak üzere gelişmiş eğitim rutinlerini kullanır. Önceden eğitilmiş ağırlıklar kolayca kullanılabilir ve özel veri kümelerinde verimli transfer öğrenimi sağlar.
  • Çok yönlülük: Belirli görevlerle sınırlı birçok rakibin aksine, Ultralytics modelleri birleşik bir paket içinde algılama, segmentasyon, sınıflandırma, poz ve OBB için yerel destek sunar.
  • Dağıtım: Modelleri aşağıdaki gibi formatlara kolayca aktarın ONNX, TensorRT, CoreML ve OpenVINO ile farklı donanımlarda optimize edilmiş dağıtım.

Birleşik Kullanım Örneği

Paylaşılan API tasarımı, zahmetsiz denemelere olanak tanır. Her iki modelle de tahmini nasıl yükleyebileceğiniz ve çalıştırabileceğiniz aşağıda açıklanmıştır:

from ultralytics import YOLO

# Load YOLO11 or YOLOv8 by simply changing the model name
model = YOLO("yolo11n.pt")  # or "yolov8n.pt"

# Train on a custom dataset
# model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

Sonuç: Hangi Modeli Seçmelisiniz?

Yeni projelerin büyük çoğunluğu için YOLO11 önerilen seçimdir. Mimari gelişmeleri, özellikle verimliliğin kritik olduğu uç bilişim uygulamaları için hem doğruluk hem de hız açısından açık bir avantaj sağlar. Azaltılmış parametre sayısı aynı zamanda daha hafif depolama gereksinimleri ve mobil dağıtımlar için daha hızlı indirme süreleri anlamına gelir.

YOLOv8 özellikle belirli YOLOv8 sürümleriyle derinlemesine entegre edilmiş mevcut boru hatlarına sahip ekipler veya dokümantasyon ekosisteminin mutlak olgunluğuna güvenenler için güçlü ve ilgili bir araç olmaya devam etmektedir. Bununla birlikte, YOLO11 'e geçiş genellikle basittir ve anında performans avantajları sağlar.

Her iki model de AGPL-3.0lisansı, açık kaynak işbirliğini teşvik etmekte ve özel yetenekler gerektiren ticari ürünler için Kurumsal Lisanslar mevcuttur.

Diğer Modelleri İnceleyin

YOLO11 ve YOLOv8 mükemmel genel amaçlı dedektörler olsa da, özel gereksinimler Ultralytics ailesindeki diğer mimarilerden yararlanabilir:

  • YOLOv10: Daha düşük gecikme süresi için NMS'siz eğitime odaklanır.
  • YOLOv9: Derin model eğitimi için programlanabilir gradyan bilgisini vurgular.
  • RT-DETR: Daha yüksek bellek ve hesaplama gereksinimlerine rağmen yüksek doğruluk sunan transformatör tabanlı bir dedektör.

Projenize mükemmel uyumu bulmak için tüm model karşılaştırmalarımızı keşfedin.


Yorumlar