İçeriğe geç

YOLOv6-3.0 - YOLOv8: Kapsamlı Teknik Bir Karşılaştırma

Optimal nesne algılama mimarisini seçmek, çıkarım gecikmesinden dağıtım esnekliğine kadar her şeyi etkileyen bilgisayar görüşü geliştirmede çok önemli bir karardır. Bu kılavuz, Meituan tarafından geliştirilen YOLOv6-3.0 ve Ultralytics'in son teknoloji modeli olan Ultralytics YOLOv8'i karşılaştıran derinlemesine bir teknik analiz sunmaktadır. Bilinçli bir seçim yapmanıza yardımcı olmak için mimari özelliklerini, performans metriklerini ve gerçek dünya uygulamalarına uygunluğunu inceliyoruz.

Her iki çerçeve de etkileyici sonuçlar sunarken, YOLOv8, benzersiz çok yönlülüğü, geliştirici merkezli bir ekosistemi ve çeşitli donanım platformlarında üstün hız ve doğruluk dengesi ile kendini farklılaştırır.

YOLOv6-3.0

Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Kuruluş: Meituan
Tarih: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
Belgeler: https://docs.ultralytics.com/models/yolov6/

YOLOv6-3.0, öncelikle endüstriyel uygulamalara odaklanılarak tasarlanmış tek aşamalı bir nesne algılama çerçevesidir. Donanım dostu ağ tasarımlarına öncelik vererek, özel GPU'larda çıkarım verimini en üst düzeye çıkarmayı amaçlar ve bu da onu gecikmenin üretim hattı hızları tarafından kesin olarak sınırlandığı ortamlar için güçlü bir rakip haline getirir.

Mimari ve Temel Özellikler

YOLOv6-3.0'ın mimarisi, yeniden parametrelendirme konsepti üzerine kurulmuştur. Ağın eğitim sırasında karmaşık yapılara sahip olmasına izin veren, ancak çıkarım sırasında aerodinamik evrişimli katmanlara basitleşen bir EfficientRep omurgası ve bir Rep-PAN boynu kullanır. Bu "yapısal yeniden parametrelendirme", özellik çıkarma yeteneğinden ödün vermeden gecikmeyi azaltmaya yardımcı olur.

Ek olarak, YOLOv6-3.0, sınıflandırma ve regresyon görevlerini ayıran ayrık bir başlık tasarımı kullanır ve SimOTA etiket atama stratejilerini entegre eder. Çerçeve ayrıca, daha düşük hassasiyetli aritmetik gerektiren uç cihazlarda dağıtımı kolaylaştırmak için nicemleme farkındalıklı eğitimi (QAT) vurgular.

Güçlü ve Zayıf Yönler

Model, üst düzey GPU'ların mevcut olduğu endüstriyel üretim senaryolarında rekabetçi çıkarım hızları sunarak parlıyor. Niceleme üzerine odaklanması, belirli donanım hızlandırıcılarına dağıtılmasına da yardımcı olur. Bununla birlikte, YOLOv6 öncelikle nesne algılama için tasarlanmıştır ve daha kapsamlı çerçevelerde bulunan poz tahmini veya yönlendirilmiş sınırlayıcı kutular gibi daha geniş bilgisayarla görme görevleri için yerel ve sorunsuz destekten yoksundur. Ayrıca, ekosistem daha az kapsamlıdır, bu da üçüncü taraf MLOps araçlarıyla entegre olurken veya topluluk desteği bulurken daha fazla sürtünme anlamına gelebilir.

YOLOv6 hakkında daha fazla bilgi edinin

Ultralytics YOLOv8

Yazarlar: Glenn Jocher, Ayush Chaurasia ve Jing Qiu
Kuruluş: Ultralytics
Tarih: 2023-01-10
Arxiv: Yok
GitHub: https://github.com/ultralytics/ultralytics
Belgeler: https://docs.ultralytics.com/models/yolov8/

Ultralytics YOLOv8, YOLO serisinde önemli bir sıçramayı temsil eder ve yalnızca bir model olarak değil, pratik yapay zeka için birleşik bir çerçeve olarak tasarlanmıştır. Mimari verimliliği sezgisel bir kullanıcı deneyimiyle birleştirerek son teknoloji (SOTA) performansını yeniden tanımlar ve gelişmiş bilgisayarlı görüyü hem araştırmacılar hem de geliştiriciler için erişilebilir kılar.

Mimari ve Temel Özellikler

YOLOv8, manuel anchor kutusu hesaplamalarına olan ihtiyacı ortadan kaldıran ve çeşitli veri kümelerinde genellemeyi iyileştiren yüksek verimli bir anchor-free algılama mekanizması sunar. Mimarisi, gradyan akışını ve özellik zenginliğini artırırken hafif bir ayak izini koruyan C2f modüllerini (füzyonlu Çapraz Aşamalı Kısmi bağlantılar) kullanan yeni bir backbone'a sahiptir.

YOLOv8'deki ayrıştırılmış başlık, nesne olma, sınıflandırma ve regresyonu bağımsız olarak işleyerek daha yüksek yakınsama doğruluğuna yol açar. En önemlisi, model çok çeşitli görevleri destekler: tek bir kurulabilir python paketi içinde nesne tespiti, örnek segmentasyonu, görüntü sınıflandırması, poz tahmini ve yönlendirilmiş sınırlayıcı kutular (OBB).

Neden YOLOv8'i Seçmelisiniz?

  • Kullanım Kolaylığı: Basit bir pip install ultralytics, geliştiriciler güçlü bir CLI ve python API'sine erişim kazanır. Bu akıcı kullanıcı deneyimi kurulumdan ilk eğitime kadar geçen süreyi saatlerden dakikalara indirir.
  • İyi Yönetilen Ekosistem: Ultralytics, model yönetimi için Ultralytics HUB, aktif GitHub tartışmaları ve TensorBoard ve MLflow gibi araçlarla sorunsuz entegrasyonlar dahil olmak üzere sağlam bir ekosistem sağlar.
  • Performans Dengesi: Aşağıdaki metriklerde gösterildiği gibi, YOLOv8 daha az parametre ve FLOP ile üstün mAP elde ederek, hem uç cihazlarda hem de bulut sunucularında gerçek zamanlı dağıtım için optimum bir denge sunar.
  • Çok Yönlülük: Yalnızca algılamaya odaklanan rakiplerin aksine, YOLOv8 yerel olarak segmentasyon, izleme ve sınıflandırmayı ele alır ve yeni bir çerçeve öğrenmeden görevler arasında geçiş yapmanıza olanak tanır.

YOLOv8 hakkında daha fazla bilgi edinin

Performans Karşılaştırması

Aşağıdaki tablo, COCO val2017 veri kümesindeki performans metriklerinin ayrıntılı bir karşılaştırmasını sunmaktadır. Vurgular, her kategorideki en iyi performansı göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Kritik Analiz

Veriler, Ultralytics mimarisi için farklı avantajlar ortaya koymaktadır:

  1. Verimlilik ve Kaynak Kullanımı: YOLOv8, karşılaştırılabilir veya daha üstün doğruluk elde etmek için sürekli olarak önemli ölçüde daha az parametre ve FLOP kullanır. Örneğin, YOLOv8s, YOLOv6-3.0s'nin (yaklaşık 45 mAP) doğruluğuyla eşleşir, ancak ~%40 daha az parametre ve ~%37 daha az FLOP gerektirir. Bu azalma, doğrudan daha düşük bellek tüketimine ve daha hızlı eğitim sürelerine dönüşür.
  2. Doğruluk Liderliği: Spektrumun üst ucunda, YOLOv8 modelleri (M, L, X), YOLOv8x'in 53.9 mAP'ye ulaşmasıyla doğruluğun sınırlarını zorlar ve listelenen en büyük YOLOv6 varyantlarından daha iyi performans gösterir.
  3. CPU Çıkarımı: YOLOv8, ONNX aracılığıyla CPU çıkarımı için şeffaf kıyaslamalar sağlayarak, özel hızlandırıcılar olmadan standart donanımda dağıtım için uygulanabilirliğini gösterir. Bu, GPU'ların her zaman mevcut olmayabileceği lojistik veya perakende sektöründeki ölçeklenebilir uygulamalar için çok önemlidir.

Bellek Verimliliği

YOLOv8'in verimli mimarisi, birçok transformatör tabanlı modele veya daha ağır evrişimli ağlara kıyasla eğitim sırasında daha düşük GPU bellek gereksinimlerine yol açar. Bu, geliştiricilerin daha büyük yığın boyutlarını eğitmelerine veya tüketici sınıfı donanımda daha yüksek çözünürlükler kullanmalarına olanak tanır.

Kullanım Alanları ve Uygulamalar

Bu modeller arasındaki seçim genellikle özel dağıtım ortamına ve görev gereksinimlerine bağlıdır.

YOLOv8'in Üstün Olduğu Alanlar

YOLOv8, uyarlanabilirliği nedeniyle bilgisayarlı görü projelerinin büyük çoğunluğu için önerilen seçimdir:

  • Uç Yapay Zeka ve IoT: Düşük parametre sayısı ve yüksek verimliliği sayesinde YOLOv8, Raspberry Pi veya NVIDIA Jetson gibi cihazlar için idealdir.
  • Çoklu Görev Sistemleri: Nesne takibi (ör. trafik izleme) veya segmentasyon (ör. tıbbi görüntüleme) gerektiren projeler, YOLOv8'in birleşik kod tabanından yararlanır.
  • Hızlı Prototipleme: Kullanım kolaylığı ve kapsamlı önceden eğitilmiş ağırlıklar, yeni kurulan şirketlerin ve araştırma ekiplerinin hızla yineleme yapmasına olanak tanır.
  • Kurumsal Çözümler: Roboflow gibi platformlarla entegrasyon ve CoreML ve TFLite gibi formatlar için destek sayesinde, YOLOv8 prototipten üretime sorunsuz bir şekilde ölçeklenir.

YOLOv6-3.0'ın Uygun Olduğu Alanlar

YOLOv6-3.0, niş endüstriyel senaryolar için güçlü bir seçenek olmaya devam ediyor:

  • Özel GPU Hatları: TensorRT çalıştıran NVIDIA T4/A10 GPU'ları kullanan yerleşik boru hatlarına sahip fabrikalarda, YOLOv6'nın özel donanım optimizasyonları marjinal gecikme kazanımlarını sağlayabilir.
  • Eski Entegrasyon: Hali hazırda RepVGG tarzı backbonelar üzerine inşa edilmiş sistemler için, YOLOv6'yı entegre etmek daha az mimari ayarlama gerektirebilir.

Eğitim ve Geliştirici Deneyimi

En önemli ayırt edici özelliklerden biri, geliştirici deneyimidir. Ultralytics, düşük kodlu, yüksek işlevli bir yaklaşıma öncelik verir.

YOLOv8 ile Sorunsuz Eğitim

Bir YOLOv8 modelini eğitmek kolaydır. Çerçeve, veri artırmayı, hiperparametre evrimini ve çizimi otomatik olarak işler.

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("path/to/image.jpg")

Aksine, YOLOv6 eğitim için komut dosyaları sunarken, genellikle ortam değişkenlerinin ve bağımlılıkların daha fazla manuel yapılandırılmasını içerir. YOLOv8'in Ultralytics HUB ile entegrasyonu, web tabanlı veri kümesi yönetimi ve tek tıklamayla model eğitimi sunarak bunu daha da basitleştirir.

Ekosistem Desteği

Ultralytics topluluğu, yapay zeka alanında en aktif olanlardan biridir. Özel veri kümeleriyle veya gelişmiş dışa aktarma seçenekleriyle ilgili yardıma ihtiyacınız olsun, kapsamlı belgeler ve topluluk forumları aracılığıyla kaynaklar kolayca erişilebilirdir.

Sonuç

YOLOv6.0 ise belirli endüstriyel GPU algılama görevleri için sağlam bir çözüm sunar, Ultralytics YOLOv8 modern bilgisayarla görme için üstün, her şeyi kapsayan bir çözüm olarak öne çıkıyor. Mimari verimliliği, parametre başına daha yüksek doğruluk sağlar ve algılama, segmentasyon ve sınıflandırma görevleri arasındaki çok yönlülüğü onu geleceğe hazır hale getirir. Rakipsiz bir ekosistem ve kullanım kolaylığı ile birleşen YOLOv8 , geliştiricilerin yapay zeka çözümlerini güvenle oluşturmalarını, dağıtmalarını ve ölçeklendirmelerini sağlar.

Diğer Modelleri İnceleyin

Nesne algılamanın daha geniş ortamıyla ilgilenenler için Ultralytics, çok çeşitli modelleri destekler. Mimarinin evrimini anlamak için YOLOv8'i eski YOLOv5 ile karşılaştırabilir veya performanstaki en son yenilikler için en son teknoloji YOLO11'i keşfedebilirsiniz. Ek olarak, transformatör tabanlı yaklaşımlar için RT-DETR modeli, gerçek zamanlı algılamada benzersiz avantajlar sunar.


Yorumlar