İçeriğe geç

YOLOX vs. YOLOv8: Nesne Algılama Evrimine Teknik Bir Derin Dalış

Yeni mimarilerin sürekli olarak hız ve doğruluk sınırlarını zorlamasıyla, bilgisayarla görmenin manzarası hızla değişiyor. Bu yolculuktaki iki önemli kilometre taşı YOLOX ve YOLOv8'dir. Bu karşılaştırma, YOLOX'un ankrajsız yeniliği ile YOLOX'un son teknoloji ürünü çok yönlülüğü arasındaki teknik nüansları incelemektedir. Ultralytics YOLOv8. Makine öğrenimi projeleriniz için doğru aracı seçmenize yardımcı olmak için mimarilerini, performans ölçümlerini ve gerçek dünya uygulamalarına uygunluklarını analiz ediyoruz.

En Son Teknolojiye Yükseltin

YOLOv8 güçlü bir model olsa da, alan daha da gelişti. Kontrol et YOLO11Ultralytics'in algılama, segmentasyon ve poz tahmini görevleri için daha yüksek verimlilik, daha hızlı işleme ve geliştirilmiş doğruluk sunan en son yinelemesi.

Performans Ölçütleri ve Kıyaslamalar

Nesne algılama modellerini değerlendirirken, çıkarım hızı ile ortalama Ortalama Hassasiyet (mAP) arasındaki denge kritik önem taşır. Aşağıdaki tabloda şu hususlar vurgulanmaktadır Ultralytics YOLOv8 karşılaştırılabilir model boyutlarında daha düşük gecikme süresiyle sürekli olarak daha yüksek doğruluk elde eder.

Özellikle, YOLOv8 CPU çıkarımı için şeffaf kıyaslamalar sağlar ONNXBu, özel GPU'ları olmayan donanımlarda dağıtım için çok önemli bir metriktir. Buna karşılık, standart YOLOX kıyaslamaları öncelikle GPU performansına odaklanır ve standart işlemcilerde uç yapay zeka uygulamalarını hedefleyen kullanıcılar için bir boşluk bırakır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

YOLOX: Çapasız Öncü

2021 yılında Megvii'deki araştırmacılar tarafından piyasaya sürülen YOLOX, çapasız bir mekanizma benimseyerek YOLO ailesinde önemli bir değişim yarattı. Bu tasarım tercihi, önceden tanımlanmış çapa kutularına olan ihtiyacı ortadan kaldırarak eğitim sürecini basitleştirdi ve belirli senaryolarda performansı artırdı.

Mimari ve Güçlü Yönler

YOLOX, yakınsama hızını ve doğruluğunu artırmak için sınıflandırma ve yerelleştirme görevlerini ayıran ayrıştırılmış bir kafayı entegre eder. Dinamik etiket ataması için SimOTA (Basitleştirilmiş Optimal Taşıma Ataması) kullanır ve eğitim sürecini optimal bir taşıma problemi olarak ele alır. O zamanlar devrim niteliğinde olsa da, YOLOX öncelikle bir nesne algılama modelidir ve aynı kod tabanı içinde segmentasyon veya poz tahmini gibi diğer görevler için yerel destekten yoksundur.

YOLOX hakkında daha fazla bilgi edinin

YOLOv8: Görsel Yapay Zeka için Modern Standart

2023 yılının başlarında Ultralytics tarafından piyasaya sürülen YOLOv8 , verimlilik, doğruluk ve kullanılabilirlik üzerine yapılan kapsamlı araştırmaların doruk noktasını temsil etmektedir. Anchor-free mirasını temel alır, ancak onu son teknoloji Görev Hizalamalı Atayıcı ve geniş bir donanım yelpazesinde üstünlük sağlayan modernize edilmiş bir mimari ile geliştirir.

Temel Avantajlar

YOLOv8 sadece bir algılama modeli değil; birleşik bir çerçevedir. Görüntü sınıflandırma, örnek segmentasyonu, poz tahmini ve yönlendirilmiş nesne algılama (OBB) için yerel destek sunar. Bu çok yönlülük, geliştiricilerin tek ve uyumlu bir API kullanarak karmaşık çok modlu sorunları çözmelerine olanak tanır.

YOLOv8 hakkında daha fazla bilgi edinin

Mimari Karşılaştırma ve Kullanım Örnekleri

Bu mimariler arasındaki teknik farklılıkların anlaşılması, gerçek zamanlı çıkarım ve üretim sistemleri için doğru aracın seçilmesine yardımcı olur.

1. Eğitim Verimliliği ve Hafıza

Ultralytics YOLO modellerinin öne çıkan özelliklerinden biri de eğitim verimliliğidir. YOLOv8 , yüksek eğitim hızlarını korurken aşırı uyumu önlemek için optimize edilmiş mozaik ve karıştırma gibi gelişmiş artırma stratejileri uygular.

En önemlisi, YOLOv8 hem eğitim hem de çıkarım sırasında eski mimarilere veya ağır transformatör tabanlı modellere kıyasla daha düşük bellek gereksinimi göstermektedir. Bu verimlilik, özel modellerin tüketici sınıfı GPU'larda eğitilmesini veya bellek kısıtlaması olan uç cihazlara yerleştirilmesini mümkün kılar. YOLOX verimli olsa da, optimum kararlılığa ulaşmak için hiperparametrelerin daha fazla manuel ayarlanmasını gerektirir.

2. Ekosistem ve Kullanım Kolaylığı

Geliştiriciler ve araştırmacılar için bir modeli çevreleyen ekosistem, mimarinin kendisi kadar önemlidir.

  • YOLOX geleneksel bir araştırma deposu yapısını takip eder. Kurulumu genellikle karmaşık yapılandırma dosyalarını ve manuel bağımlılık yönetimini içerir.
  • Ultralytics YOLOv8kullanım kolaylığına öncelik verir. Pip ile kurulabilen bir paket, kolaylaştırılmış bir Python API'si ve kutudan çıktığı gibi çalışan bir CLI 'ya sahiptir.

Ultralytics API ile Kullanım Kolaylığı

YOLOv8 ile tahminleri çalıştırmak inanılmaz derecede basittir ve sadece birkaç satır kod gerektirir.

from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Run inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

3. Bakımlı Ekosistem

YOLOv8 'i seçmek, bakımlı bir ekosisteme erişim kazanmak anlamına gelir. Ultralytics kapsamlı belgeler, sık güncellemeler ve aktif topluluk desteği sağlar. Daha geniş Ultralytics ekosistemi ile entegrasyon, veri açıklaması, veri kümesi yönetimi ve aşağıdaki gibi formatlara model dağıtımı dahil olmak üzere iş akışlarını basitleştirir TensorRT ve OpenVINO.

Gerçek Dünya Uygulamaları

YOLOv8 in Üstün Olduğu Noktalar

  • Akıllı Perakendecilik: Raf düzenlerini ve ürün yerleşimini piksel düzeyinde hassasiyetle anlamak için segmentasyon yeteneklerinden yararlanma.
  • Spor Analitiği: YOLOX'un yerel olarak gerçekleştiremediği bir görev olan oyuncu hareketlerini ve biyomekaniği gerçek zamanlı olarak track için poz tahmininden yararlanma.
  • Endüstriyel Denetim: Konveyör bant üzerindeki bileşenler gibi döndürülen nesneleri yüksek doğrulukla detect etmek için OBB modellerinin kullanılması.
  • Uç Dağıtım: YOLOv8 'in üstün hız/doğruluk oranı, onu mobil uygulamalar ve Raspberry Pi veya NVIDIA Jetson gibi gömülü sistemler için tercih edilen seçenek haline getirir.

YOLOX Niş

YOLOX, özellikle çapasız tespit kafalarının teorik yönlerine odaklanan akademik araştırmalar için güçlü bir aday olmaya devam etmektedir. Kod tabanı, 2021 çağında çapa tabanlı metodolojilerden çapasız metodolojilere geçişi inceleyen araştırmacılar için net bir referans sağlar.

Sonuç

YOLOX, çapasız tespitin yaygınlaşmasında önemli bir rol oynamıştır, Ultralytics YOLOv8 bu teknolojinin doğal evrimini temsil etmektedir. Üstün performans ölçümleri, çok yönlü bir çoklu görev öğrenme çerçevesi ve eşsiz bir kullanıcı deneyimi sunan YOLOv8 , modern yapay zeka geliştirme için üstün bir seçim olarak öne çıkıyor.

Hızlı prototiplemeden kurumsal dağıtıma kadar ölçeklenebilen sağlam, geleceğe dönük bir çözüm arayan geliştiriciler için Ultralytics YOLOv8daha yeni YOLO11-Başarılı olmak için gerekli araçları sağlar.

Diğer Modelleri İnceleyin

Bu karşılaştırmaları keşfederek nesne algılama ortamına ilişkin anlayışınızı genişletin:


Yorumlar