İçeriğe geç

YOLOv8 vs YOLOv8: Teknik Bir Derin Dalış

Araştırmacılar ve mühendisler hız, doğruluk ve hesaplama verimliliği gibi birbiriyle yarışan talepleri dengelemeye çalışırken nesne algılama alanı sürekli olarak gelişmektedir. Bilgisayarla görme topluluğunda önemli dalgalar yaratan iki önemli mimari, Alibaba Group tarafından geliştirilen YOLO ve YOLOv8tarafından oluşturulmuştur. Ultralytics.

Bu teknik karşılaştırma, her iki modelin mimari yeniliklerini, performans ölçümlerini ve pratik kullanılabilirliğini araştırmaktadır. YOLO , Nöral Mimari Arama (NAS) gibi yeni araştırma kavramlarını tanıtırken, Ultralytics YOLOv8 , eğitimden dağıtıma kadar iş akışını kolaylaştıran sağlam, kullanıcı dostu bir ekosistem sunmaya odaklanmaktadır.

Performans Analizi: Hız ve Doğruluk

Bu modellerin gerçek dünya senaryolarında nasıl karşılaştırıldığını anlamak için, standart COCO veri kümesi üzerindeki performanslarını analiz ediyoruz. Aşağıdaki metrikler, Ortalama Ortalama HassasiyetmAP), farklı donanımlarda çıkarım hızı ve model karmaşıklığı arasındaki değiş tokuşları vurgulamaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Temel Çıkarımlar

Veriler, dağıtım hedefine bağlı olarak farklı avantajlar ortaya koymaktadır:

  • Kenar Performansı: Bu YOLOv8n (Nano) modeli, kaynak kısıtlı ortamlar için tartışmasız liderdir. Yalnızca 3,2 milyon parametre ve 8,7 milyar FLOP ile hem CPU hem de GPU'da en yüksek çıkarım hızlarına ulaşır. Bu da onu bellek ve gücün az olduğu mobil uygulamalar veya IoT cihazları için ideal kılar.
  • En Yüksek Doğruluk: Hassasiyetin çok önemli olduğu uygulamalar için, YOLOv8x53,9 ile en yüksek mAP değerine ulaşır. YOLO modelleri iyi performans gösterirken, en büyük YOLOv8 varyantı tespit doğruluğunun sınırlarını daha da zorlamaktadır.
  • Gecikme Takasları: YOLO , NAS için optimize edilmiş backbone sayesinde özel GPU'larda (T4 gibi) etkileyici bir verim sergiler. Bununla birlikte, Ultralytics YOLOv8 , CPU'lar da dahil olmak üzere daha geniş bir donanım yelpazesinde üstün bir denge sağlar ve daha geniş dağıtım esnekliği sağlar.

YOLO: Araştırma Odaklı İnovasyon

YOLO , Alibaba Group'un araştırma girişimlerinin bir ürünüdür. "Keşif, Macera, Momentum ve Bakış Açısı" anlamına gelen bu isim, yeni mimari sınırların keşfedilmesine odaklanılmasını yansıtmaktadır.

Yazarlar Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Organizasyon:Alibaba Group
Tarih: 2022-11-23
Arxiv:2211.15444v2
GitHub:YOLO

Mimari Öne Çıkanlar

YOLO , gecikme ve doğruluk arasındaki dengeyi optimize etmek için çeşitli gelişmiş teknolojileri entegre eder:

  1. MAE-NAS Backbone: Özellikle MAE-NAS adı verilen bir yöntem kullanarak verimli ağ yapılarını otomatik olarak keşfetmek için Nöral Mimari Arama (NAS) kullanır.
  2. RepGFPN Boyun: Farklı ölçek seviyeleri arasındaki bilgi akışını en üst düzeye çıkarmak için yoğun şekilde parametrelendirilmiş Genelleştirilmiş Özellik Piramidi Ağı (GFPN) kullanılır ve farklı mesafelerdeki nesnelerin algılanmasını iyileştirir.
  3. ZeroHead: Ağır boynu dengelemek için model, son algılama aşamasında hesaplama yükünü azaltan hafif bir "ZeroHead" kullanır.
  4. AlignedOTA: Eğitim sırasında sınıflandırma ve regresyon görevlerini hizalayarak modelin daha etkili bir şekilde yakınsamasına yardımcı olan dinamik bir etiket atama stratejisi.

DAMO-YOLO hakkında daha fazla bilgi edinin

Ultralytics YOLOv8: Ekosistem Standardı

YOLOv8 , kullanılabilirlik, çok yönlülük ve son teknoloji performansa odaklanan YOLO mimarisinin iyileştirilmesini temsil eder. Saf araştırma modellerinin aksine, YOLOv8 geliştiriciler için bir ürün olarak tasarlanmıştır ve bakımlı bir ekosistem ile entegrasyon kolaylığını vurgulamaktadır.

Yazarlar Glenn Jocher, Ayush Chaurasia ve Jing Qiu
Organizasyon:Ultralytics
Tarih: 2023-01-10
Dokümanlar:Ultralytics YOLOv8

Mimari Güçlü Yönler

  • Çapasız Algılama: YOLOv8 , çapa kutularını ortadan kaldırarak geliştiricilerin ayarlaması gereken hiperparametre sayısını azaltır ve eğitim sürecini basitleştirir.
  • C2f Modülü: Mimari, C3 modülünü C2f ile değiştirerek daha zengin gradyan akış bilgisi sunarken hafif bir ayak izi sağlar.
  • Ayrıştırılmış Kafa: Kafadaki sınıflandırma ve regresyon görevlerini ayırarak, model daha yüksek lokalizasyon doğruluğu elde eder.
  • Birleşik Çerçeve: Belki de en güçlü mimari özelliği, tek bir kod tabanı içinde birden fazla görüş görevi (örneksegmentasyonu, poz tahmini, sınıflandırma ve yönlendirilmiş nesne algılama (OBB)) için yerel desteğidir.

Biliyor muydunuz?

Ultralytics , modelleri aşağıdaki gibi optimize edilmiş formatlara aktarmak için sorunsuz bir yol sağlar ONNX, TensorRT, CoreMLve OpenVINO. Bu dışa aktarma özelliği, eğitilmiş modellerinizin neredeyse tüm donanım platformlarında verimli bir şekilde çalışabilmesini sağlar.

YOLOv8 hakkında daha fazla bilgi edinin

Kullanılabilirlik ve Geliştirici Deneyimi

İki model arasındaki en önemli fark, kullanım kolaylığı ve çevreleyen ekosistemde yatmaktadır.

Ultralytics YOLO modelleri "sıfırdan kahramana" deneyimleriyle ünlüdür. Basit bir PIP kurulumu ile geliştiriciler güçlü bir CLI ve Python API'sine erişim kazanırlar. Bu, genellikle karmaşık ortam kurulumları gerektiren araştırma depolarına kıyasla giriş engelini önemli ölçüde azaltır.

Eğitim Verimliliği

Ultralytics modelleri eğitim verimliliği için tasarlanmıştır. CUDA belleğini verimli bir şekilde kullanarak daha büyük parti boyutlarına veya tüketici sınıfı GPU'larda eğitime olanak tanırlar. Ayrıca, yüksek kaliteli önceden eğitilmiş ağırlıkların kullanılabilirliği, yakınsamayı hızlandırarak değerli hesaplama süresinden ve enerjiden tasarruf sağlar.

İşte sadece üç satırlık bir Python ile YOLOv8 modelinin nasıl yükleneceğine ve tahmin edileceğine dair eksiksiz, çalıştırılabilir bir örnek:

from ultralytics import YOLO

# Load a pre-trained YOLOv8n model
model = YOLO("yolov8n.pt")

# Run inference on an image (automatically downloads image if needed)
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Show the results
for result in results:
    result.show()

Buna karşılık, YOLO güçlü performans sunarken, genellikle daha fazla manuel yapılandırma ve araştırma odaklı çerçevelere aşinalık gerektirir, bu da onu hızlı prototipleme veya ticari entegrasyon için daha az erişilebilir hale getirir.

Sonuç: Doğru Aracı Seçmek

Hem YOLO hem de YOLOv8 bilgisayarla görme alanında olağanüstü başarılardır.

YOLO, Sinirsel Mimari Arama ile ilgilenen araştırmacılar ve özellikle özel backbone tamamen optimize edildiği donanımlarda konuşlandırılanlar için mükemmel bir seçimdir.

Ancak, çoğu geliştirici, araştırmacı ve işletme için, Ultralytics YOLOv8 (ve daha yeni YOLO11) üstün bir değer önerisi sunmaktadır:

  1. Çok yönlülük: Algılama, Segmentasyon, Poz ve OBB'yi tek bir çerçevede ele alabilir.
  2. Kullanım Kolaylığı: Eşsiz dokümantasyon, basit API ve güçlü topluluk desteği.
  3. Dağıtım: Dışa aktarma modları için kapsamlı destek, cep telefonlarından bulut sunucularına kadar her şeyi kapsar.
  4. Performans Dengesi: Özellikle CPU ve Edge cihazlarında mükemmel doğruluk-hız oranı.

En son teknolojiyi takip etmek isteyenler için ayrıca şu adrese göz atmanızı öneririz YOLO11YOLOv8 'in güçlü yönlerini daha da yüksek verimlilik ve doğrulukla geliştiriyor.

Diğer Model Karşılaştırmalarını İnceleyin

Bilgisayarla görme projeleriniz için en bilinçli kararı vermenize yardımcı olmak için bu ek ayrıntılı karşılaştırmaları keşfedin:


Yorumlar