İçeriğe geç

YOLOv6-3.0 - YOLOv10: Detaylı Teknik Karşılaştırma

Optimal bilgisayar görüşü modelini seçmek, çıkarım gecikmesi, doğruluk ve hesaplama verimliliği gibi faktörleri dengeleyerek yapay zeka girişimlerinin başarısı için çok önemlidir. Bu kapsamlı teknik karşılaştırma, endüstriyel hız için tasarlanan YOLOv6-3.0 ve gerçek zamanlı uçtan uca verimliliğiyle bilinen YOLOv10 olmak üzere iki öne çıkan nesne algılama mimarisini incelemektedir. Seçim sürecinize rehberlik etmek için mimari yeniliklerini, kıyaslama metriklerini ve ideal kullanım durumlarını analiz ediyoruz.

YOLOv6-3.0: Endüstriyel Sınıf Hız ve Hassasiyet

Meituan'daki vizyon istihbarat departmanı tarafından geliştirilen YOLOv6-3.0, özellikle endüstriyel uygulamalar için optimize edilmiş tek aşamalı bir nesne algılama çerçevesidir. 2023'ün başlarında piyasaya sürülen bu model, üretim ve lojistikteki gerçek zamanlı çıkarımın zorlu taleplerini karşılayarak GPU'lar ve uç cihazlardaki verimi en üst düzeye çıkarmak için donanım dostu tasarımlara öncelik verir.

Mimari ve Temel Özellikler

YOLOv6-3.0, özellik çıkarımını ve yakınsama hızını artırmak için çeşitli gelişmiş teknikleri içeren mimarisinin "Tam Ölçekli Yeniden Yüklenmesini" sunar:

  • Verimli Yeniden Parametreleme Backbone'u: Doğruluktan ödün vermeden FLOPS'u optimize ederek, karmaşık eğitim yapılarının daha hızlı çıkarım katmanlarına basitleştirilmesini sağlayan donanım farkındalıklı bir backbone kullanır.
  • Çift Yönlü Birleştirme (BiC): Boyun tasarımı, yerelleştirme sinyallerini iyileştirmek için BiC'yi kullanır ve farklı ölçeklerde daha iyi özellik birleşimi sağlar.
  • Ankraj Destekli Eğitim (AAT): Temel olarak ankraj içermese de, YOLOv6-3.0, yakınsamayı stabilize etmek ve performansı artırmak için eğitim sırasında ankraj tabanlı yardımcı dalları yeniden tanıtır.

Güçlü ve Zayıf Yönler

Güçlü Yönler: YOLOv6-3.0, yüksek verim gerektiren senaryolarda mükemmeldir. Model nicelemesi desteği, mobil platformlarda ve gömülü sistemlerde etkili bir şekilde dağıtım yapılmasını sağlar. "Lite" varyantları, özellikle CPU kısıtlı ortamlar için kullanışlıdır.

Zayıflıklar: Tamamen nesne algılama üzerine odaklanan bir model olarak, YOLO11 gibi birleşik çerçevelerde bulunan örnek segmentasyonu veya poz tahmini gibi daha geniş görevler için yerel desteği yoktur. Ek olarak, daha yeni modellere kıyasla, parametre verimliliği daha düşüktür ve benzer doğruluk seviyeleri için daha fazla bellek gerektirir.

İdeal Kullanım Durumu: Endüstriyel Otomasyon

YOLOv6-3.0, montaj hatlarındaki kameraların kusurları detect etmek veya öğeleri ayırmak için yüksek çözünürlüklü yayınları hızla işlemesi gereken üretim otomasyonu için güçlü bir adaydır.

YOLOv6 hakkında daha fazla bilgi edinin

YOLOv10: Uçtan Uca Verimliliğin Sınırı

Mayıs 2024'te Tsinghua Üniversitesi'ndeki araştırmacılar tarafından tanıtılan YOLOv10, işlem sonrası sırasında Non-Maximum Suppression (NMS) ihtiyacını ortadan kaldırarak YOLO ailesinin sınırlarını zorlar. Bu yenilik, onu gecikme açısından kritik uygulamalar için yeni nesil bir model olarak konumlandırıyor.

Mimari ve Temel Özellikler

YOLOv10, bütünsel bir verimlilik-doğruluk odaklı tasarım stratejisi benimser:

  • NMS'siz Eğitim: Tutarlı ikili atamalar (eğitim için bire çok, çıkarım için bire bir) kullanılarak YOLOv10, her nesne için tek bir en iyi kutuyu tahmin eder. Bu, NMS son işlemeyle ilişkili hesaplama yükünü ve gecikme değişkenliğini ortadan kaldırır.
  • Bütünsel Model Tasarımı: Mimari, model parametrelerini ve hesaplama maliyetini önemli ölçüde azaltan hafif sınıflandırma başlıkları ve uzamsal-kanal ayrıştırılmış aşağı örnekleme içerir.
  • Rank-Guided Blok Tasarımı: Verimliliği artırmak için model, özellik işlemenin daha az kritik olduğu aşamalarda yedekliliği azaltmak için rank-guided blok tasarımı kullanır.

Güçlü ve Zayıf Yönler

Güçlü Yönler: YOLOv10, genellikle öncekilerden önemli ölçüde daha az parametreyle daha yüksek mAP elde ederek üstün bir hız-doğruluk dengesi sunar. Ultralytics Python ekosistemine entegrasyonu, diğer modellerle birlikte eğitilmeyi ve dağıtılmayı inanılmaz derecede kolaylaştırır.

Zayıflıklar: Göreceli olarak yeni bir giriş olduğundan, topluluk kaynakları ve üçüncü taraf araçları hala büyüyor. YOLOv6 gibi, algılama için uzmanlaşmıştır, oysa çoklu görev yeteneklerine ihtiyaç duyan kullanıcılar YOLO11'i tercih edebilir.

Uyarı: Verimlilikte Atılım

NMS'nin kaldırılması, YOLOv10'un kararlı çıkarım gecikmesi elde etmesini sağlar; bu, işlem süresinin deterministik olması gereken otonom araçlar gibi güvenlik açısından kritik sistemler için çok önemli bir faktördür.

YOLOv10 hakkında daha fazla bilgi edinin

Performans Analizi: Metrikler ve Kıyaslamalar

Aşağıdaki tablo, YOLOv6-3.0 ve YOLOv10'un COCO veri kümesi üzerindeki performansını karşılaştırmaktadır. Temel metrikler arasında model boyutu, ortalama Hassasiyet (mAP) ve CPU ve GPU'daki çıkarım hızı yer almaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Temel İçgörüler

  1. Parametre Verimliliği: YOLOv10 dikkate değer bir verimlilik gösterir. Örneğin, YOLOv10s, YOLOv6-3.0s'den (%45.0) daha yüksek bir mAP (%46.7) elde ederken, parametrelerin yarısından daha azını (7.2M'ye karşı 18.5M) kullanır. Bu azaltılmış bellek ayak izi, edge AI cihazları için hayati önem taşır.
  2. Gecikme: YOLOv6-3.0n biraz daha hızlı ham TensorRT gecikmesi (1.17ms'ye karşı 1.56ms) gösterse de, YOLOv10, ham model çıkarım sürelerinde yakalanmayan gerçek dünya işlem hatlarında genellikle ek zaman tüketen NMS adımını ortadan kaldırır.
  3. Doğruluk: Neredeyse tüm ölçeklerde, YOLOv10 daha yüksek doğruluk sağlayarak karmaşık ortamlarda zor nesneleri detect etmek için daha sağlam bir seçimdir.

Kullanım ve Uygulama

Ultralytics, bu modelleri kullanmak için kolaylaştırılmış bir deneyim sunar. YOLOv10, yerel olarak şurada desteklenir: ultralytics paketi sayesinde sorunsuz eğitim ve tahmin.

Ultralytics ile YOLOv10 çalıştırma

YOLOv10'u yalnızca birkaç satır kodla Python API'si kullanarak çalıştırabilirsiniz. Bu, Ultralytics ekosisteminde bulunan kullanım kolaylığını vurgular.

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Run inference on an image
results = model.predict("path/to/image.jpg", save=True)

# Train the model on a custom dataset
# model.train(data="coco8.yaml", epochs=100, imgsz=640)

YOLOv6.0 Kullanımı

YOLOv6-3.0, farklı bir kod tabanı yapısını izlediğinden, eğitim ve çıkarım için genellikle resmi Meituan deposunun klonlanmasını gerektirir.

# Clone the YOLOv6 repository
git clone https://github.com/meituan/YOLOv6
cd YOLOv6
pip install -r requirements.txt

# Inference using the official script
python tools/infer.py --weights yolov6s.pt --source path/to/image.jpg

Sonuç: Doğru Modeli Seçmek

Her iki model de bilgisayar görüşünde önemli başarıları temsil ediyor. YOLOv6-3.0, özellikle mimarisi için optimize edilmiş eski endüstriyel sistemler için sağlam bir seçim olmaya devam ediyor. Bununla birlikte, YOLOv10, NMS'siz mimarisi, üstün parametre verimliliği ve daha yüksek doğruluğu nedeniyle genellikle yeni projeler için daha iyi bir yatırım getirisi sunar.

Çok yönlülük ve ekosistem desteği konusunda en üst düzeyi arayan geliştiriciler için Ultralytics YOLO11 şiddetle tavsiye edilir. YOLO11 yalnızca son teknoloji detect performansı sunmakla kalmaz, aynı zamanda tek ve iyi yönetilen bir paket içinde yerel olarak poz tahmini, OBB ve sınıflandırmayı da destekler. Ultralytics ekosistemi, verimli eğitim süreçleri, düşük bellek kullanımı ve ONNX ve TensorRT gibi formatlara kolay aktarımı sağlayarak, güvenle sağlam yapay zeka çözümleri dağıtmanızı sağlar.

Daha Fazla Okuma

  • Çoklu görevli vizyon yapay zekası için çok yönlü YOLO11'i keşfedin.
  • Dönüştürücü tabanlı algılama için YOLOv10 ve RT-DETR'yi karşılaştırın.
  • Maksimum dağıtım hızı için model dışa aktarma hakkında bilgi edinin.

Yorumlar