İçeriğe geç

YOLOv6.0 vs YOLOv8: Kapsamlı Bir Teknik Karşılaştırma

Optimum nesne algılama mimarisinin seçilmesi, bilgisayarla görü geliştirmede çok önemli bir karardır ve çıkarım gecikmesinden dağıtım esnekliğine kadar her şeyi etkiler. Bu kılavuz, Meituan tarafından geliştirilen YOLOv6.0 ile Meituan tarafından geliştirilen YOLOv6.0'ı karşılaştıran derinlemesine bir teknik analiz sunmaktadır. Ultralytics YOLOv8'den son teknoloji ürünü bir model Ultralytics. Bilinçli bir seçim yapmanıza yardımcı olmak için mimari farklılıklarını, performans ölçümlerini ve gerçek dünya uygulamaları için uygunluklarını inceliyoruz.

Her iki çerçeve de etkileyici sonuçlar sunarken, YOLOv8 eşsiz çok yönlülüğü, geliştirici merkezli bir ekosistemi ve farklı donanım platformlarında üstün bir hız ve doğruluk dengesi ile öne çıkıyor.

YOLOv6.0

Yazarlar Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Organizasyon: Meituan
Tarih: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: YOLOv6
Dokümanlar: https:ultralytics

YOLOv6.0, öncelikli olarak endüstriyel uygulamalara odaklanarak tasarlanmış tek aşamalı bir nesne algılama çerçevesidir. Donanım dostu ağ tasarımlarına öncelik vererek, özel GPU'larda çıkarım verimini en üst düzeye çıkarmayı amaçlar ve gecikme süresinin üretim hattı hızları tarafından sıkı bir şekilde kısıtlandığı ortamlar için güçlü bir rakip haline getirir.

Mimari ve Temel Özellikler

YOLOv6.0'ın mimarisi yeniden parametrelendirme kavramı etrafında inşa edilmiştir. Ağın eğitim sırasında karmaşık yapılara sahip olmasına izin veren ancak çıkarım sırasında basitleştirilmiş evrişimsel katmanlara dönüşen bir EfficientRep backbone ve bir Rep-PAN boynu kullanır. Bu "yapısal yeniden parametrelendirme", özellik çıkarma kabiliyetinden ödün vermeden gecikmeyi azaltmaya yardımcı olur.

Ek olarak, YOLOv6.0, sınıflandırma ve regresyon görevlerini ayıran ayrık bir kafa tasarımı kullanır ve SimOTA etiket atama stratejilerini entegre eder. Çerçeve ayrıca, daha düşük hassasiyetli aritmetik gerektiren uç cihazlarda dağıtımı kolaylaştırmak için nicelemeye duyarlı eğitimi (QAT) vurgulamaktadır.

Güçlü ve Zayıf Yönler

Model, üst düzey GPU'ların mevcut olduğu endüstriyel üretim senaryolarında rekabetçi çıkarım hızları sunarak parlıyor. Niceleme üzerine odaklanması, belirli donanım hızlandırıcılarına dağıtılmasına da yardımcı olur. Bununla birlikte, YOLOv6 öncelikle nesne algılama için tasarlanmıştır ve daha kapsamlı çerçevelerde bulunan poz tahmini veya yönlendirilmiş sınırlayıcı kutular gibi daha geniş bilgisayarla görme görevleri için yerel ve sorunsuz destekten yoksundur. Ayrıca, ekosistem daha az kapsamlıdır, bu da üçüncü taraf MLOps araçlarıyla entegre olurken veya topluluk desteği bulurken daha fazla sürtünme anlamına gelebilir.

YOLOv6 hakkında daha fazla bilgi edinin

Ultralytics YOLOv8

Yazarlar Glenn Jocher, Ayush Chaurasia ve Jing Qiu
Organizasyon: Ultralytics
Tarih: 2023-01-10
Arxiv: Yok
GitHub: ultralytics
Dokümanlar: https:yolov8

Ultralytics YOLOv8 sadece bir model olarak değil, pratik yapay zeka için birleşik bir çerçeve olarak tasarlanan YOLO serisinde önemli bir sıçramayı temsil ediyor. Mimari verimliliği sezgisel bir kullanıcı deneyimi ile birleştirerek son teknoloji (SOTA) performansını yeniden tanımlıyor ve gelişmiş bilgisayarla görmeyi hem araştırmacılar hem de geliştiriciler için erişilebilir hale getiriyor.

Mimari ve Temel Özellikler

YOLOv8 , manuel çapa kutusu hesaplamalarına olan ihtiyacı ortadan kaldıran ve çeşitli veri kümelerinde genelleştirmeyi geliştiren oldukça verimli bir çapasız algılama mekanizması sunar. Mimarisi, hafif bir ayak izini korurken gradyan akışını ve özellik zenginliğini artıran C2f modüllerini (füzyonlu Aşamalar Arası Kısmi bağlantılar) kullanan yeni bir backbone sahiptir.

YOLOv8 'deki ayrıştırılmış kafa, nesnellik, sınıflandırma ve regresyonu bağımsız olarak işleyerek daha yüksek yakınsama doğruluğu sağlar. En önemlisi, model tek bir yüklenebilir Python paketi içinde nesnealgılama, örnek segmentasyonu, görüntü sınıflandırma, poz tahmini ve yönlendirilmiş sınırlayıcı kutular (OBB) gibi tüm görev yelpazesini desteklemektedir.

Neden YOLOv8'i Seçmelisiniz?

  • Kullanım Kolaylığı: Basit bir pip install ultralyticsgeliştiriciler güçlü bir CLI ve Python API'sine erişim kazanırlar. Bu kolaylaştırılmış kullanıcı deneyimi kurulumdan ilk eğitime kadar geçen süreyi saatlerden dakikalara indirir.
  • Bakımlı Ekosistem: Ultralytics , model yönetimi için Ultralytics HUB, aktif GitHub tartışmaları ve TensorBoard ve MLflow gibi araçlarla sorunsuz entegrasyonlar dahil olmak üzere sağlam bir ekosistem sağlar.
  • Performans Dengesi: Aşağıdaki metriklerde gösterildiği gibi, YOLOv8 daha az parametre ve FLOP ile üstün mAP elde ederek hem uç cihazlarda hem de bulut sunucularında gerçek zamanlı dağıtım için optimum bir denge sunar.
  • Çok yönlülük: Yalnızca algılamaya odaklanan rakiplerin aksine, YOLOv8 segmentasyon, izleme ve sınıflandırmayı yerel olarak gerçekleştirerek yeni bir çerçeve öğrenmeden görevler arasında geçiş yapmanıza olanak tanır.

YOLOv8 hakkında daha fazla bilgi edinin

Performans Karşılaştırması

Aşağıdaki tabloda COCO val2017 veri setindeki performans metriklerinin ayrıntılı bir karşılaştırması sunulmaktadır. Önemli noktalar her kategorideki en iyi performansı göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0m64050.0-5.2834.985.8
YOLOv6.0l64052.8-8.9559.6150.7
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Eleştirel Analiz

Veriler, Ultralytics mimarisi için belirgin avantajlar ortaya koymaktadır:

  1. Verimlilik ve Kaynak Kullanımı: YOLOv8 , karşılaştırılabilir veya daha üstün doğruluk elde etmek için sürekli olarak önemli ölçüde daha az parametre ve FLOP kullanır. Mesela, YOLOv8sYOLOv6.0s (yaklaşık 45 mAP) doğruluğuyla eşleşir ancak ~%40 daha az parametre ve ~%37 daha az FLOP gerektirir. Bu azalma doğrudan daha düşük bellek tüketimi ve daha hızlı eğitim süreleri anlamına gelir.
  2. Doğruluk Liderliği: Spektrumun üst ucunda, YOLOv8 modelleri (M, L, X) doğruluk sınırlarını zorluyor ve YOLOv8x 53,9 mAP'ye ulaşarak listelenen en büyük YOLOv6 varyantlarından daha iyi performans gösteriyor.
  3. CPU Çıkarsaması: YOLOv8 , CPU çıkarımı için şeffaf kıyaslamalar sağlar ONNXBu da özel hızlandırıcılar olmadan standart donanımlarda kullanılabileceğini göstermektedir. Bu, GPU'ların her zaman mevcut olmayabileceği lojistik veya perakende sektöründeki ölçeklenebilir uygulamalar için çok önemlidir.

Bellek Verimliliği

YOLOv8'in verimli mimarisi, eğitim sırasında birçok transformatör tabanlı modele veya daha ağır konvolüsyonel ağlara kıyasla daha düşük GPU bellek gereksinimi sağlar. Bu, geliştiricilerin daha büyük parti boyutlarını eğitmesine veya tüketici sınıfı donanımlarda daha yüksek çözünürlükler kullanmasına olanak tanır.

Kullanım Alanları ve Uygulamalar

Bu modeller arasındaki seçim genellikle belirli dağıtım ortamına ve görev gereksinimlerine bağlıdır.

YOLOv8 in Üstün Olduğu Noktalar

YOLOv8 , uyarlanabilirliği nedeniyle bilgisayarla görme projelerinin büyük çoğunluğu için önerilen seçimdir:

  • Edge AI ve IoT: Düşük parametre sayısı ve yüksek verimliliği nedeniyle YOLOv8 , Raspberry Pi veya NVIDIA Jetson gibi cihazlar için idealdir.
  • Çok Görevli Sistemler: Nesne takibi (örn. trafik izleme) veya segmentasyon (örn. tıbbi görüntüleme) gerektiren projeler YOLOv8'in birleşik kod tabanından yararlanır.
  • Hızlı Prototipleme: Kullanım kolaylığı ve kapsamlı önceden eğitilmiş ağırlıklar, girişimlerin ve araştırma ekiplerinin hızlı bir şekilde yineleme yapmasına olanak tanır.
  • Kurumsal Çözümler: gibi platformlara entegrasyon ile Roboflow ve aşağıdaki gibi formatlar için destek CoreML ve TFLiteYOLOv8 , prototipten üretime sorunsuz bir şekilde ölçeklenir.

YOLOv6.0 Nereye Uyuyor

YOLOv6.0, niş endüstriyel senaryolar için güçlü bir seçenek olmaya devam etmektedir:

  • Özel GPU Hatları: TensorRT çalıştıran NVIDIA T4/A10 GPU'ları kullanan yerleşik boru hatlarına sahip fabrikalarda, YOLOv6'nın özel donanım optimizasyonları marjinal gecikme kazançları sağlayabilir.
  • Eski Entegrasyon: Halihazırda RepVGG tarzı omurgalar üzerine kurulu sistemler için YOLOv6 'yı entegre etmek daha az mimari ayarlama gerektirebilir.

Eğitim ve Geliştirici Deneyimi

En önemli farklılaştırıcılardan biri geliştirici deneyimidir. Ultralytics , düşük kod, yüksek işlevsellik yaklaşımına öncelik verir.

YOLOv8 ile Sorunsuz Eğitim

Bir YOLOv8 modelini eğitmek kolaydır. Çerçeve, veri artırma, hiperparametre gelişimi ve çizimi otomatik olarak gerçekleştirir.

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("path/to/image.jpg")

Buna karşılık, YOLOv6 eğitim için komut dosyaları sunarken, genellikle ortam değişkenlerinin ve bağımlılıkların daha manuel yapılandırılmasını içerir. YOLOv8'in Ultralytics HUB ile entegrasyonu, web tabanlı veri kümesi yönetimi ve tek tıklamayla model eğitimi sunarak bunu daha da basitleştirir.

Ekosistem Desteği

Ultralytics topluluğu, yapay zeka alanındaki en aktif topluluklardan biridir. İster özel veri kümeleri ister gelişmiş dışa aktarma seçenekleri ile ilgili yardıma ihtiyacınız olsun, kaynaklar kapsamlı dokümanlar ve topluluk forumları aracılığıyla kolayca kullanılabilir.

Sonuç

YOLOv6.0 ise belirli endüstriyel GPU algılama görevleri için sağlam bir çözüm sunar, Ultralytics YOLOv8 modern bilgisayarla görme için üstün, her şeyi kapsayan bir çözüm olarak öne çıkıyor. Mimari verimliliği, parametre başına daha yüksek doğruluk sağlar ve algılama, segmentasyon ve sınıflandırma görevleri arasındaki çok yönlülüğü onu geleceğe hazır hale getirir. Rakipsiz bir ekosistem ve kullanım kolaylığı ile birleşen YOLOv8 , geliştiricilerin yapay zeka çözümlerini güvenle oluşturmalarını, dağıtmalarını ve ölçeklendirmelerini sağlar.

Diğer Modelleri İnceleyin

Nesne algılamanın daha geniş manzarasıyla ilgilenenler için Ultralytics çok çeşitli modelleri desteklemektedir. YOLOv8 'i eski sürümle karşılaştırabilirsiniz YOLOv5 mimarinin evrimini anlamak için veya en son teknolojiyi keşfetmek için YOLO11 mutlak en son performans için. Ek olarak, transformatör tabanlı yaklaşımlar için RT-DETR modeli gerçek zamanlı tespitte benzersiz avantajlar sunar.


Yorumlar