YOLOv6.0 vs YOLOv5: Nesne Algılama için Teknik Bir Karşılaştırma
Bilgisayarla görme projeniz için doğru mimariyi seçmek, performansı, dağıtım kolaylığını ve uzun vadeli bakımı etkileyen çok önemli bir karardır. Gerçek zamanlı nesne algılama alanında öne çıkan iki rakip Meituan'ın YOLOv6.0 ve Ultralytics'in YOLOv5. Bu kılavuz, ister ham GPU verimine ister çok yönlü, kullanımı kolay bir ekosisteme öncelik versin, geliştiricilerin ve araştırmacıların kendi özel gereksinimlerine en uygun modeli seçmelerine yardımcı olmak için ayrıntılı bir teknik karşılaştırma sunar.
Performans Metrikleri Analizi
Aşağıdaki tablo COCO veri kümesindeki performans ölçümlerinin doğrudan karşılaştırmasını sunmaktadır. YOLOv6.0 ise GPU cihazlarında en yüksek doğruluk sınırlarını zorlamaktadır, Ultralytics YOLOv5 özellikle CPU üzerinde olağanüstü verimlilik ve hafif varyantları için önemli ölçüde daha düşük model karmaşıklığı (parametreler ve FLOP'lar) ile ününü korumaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv6.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Analiz: Veriler, YOLOv5n (Nano) modelinin en düşük parametre sayısına (2,6M) ve FLOP'lara (7,7B) sahip olarak kaynak kısıtlı ortamlar için öne çıktığını ve bunun da üstün CPU çıkarım hızları anlamına geldiğini vurgulamaktadır. Bu da onu bellek ve gücün az olduğu uç yapay zeka uygulamaları için son derece uygun hale getiriyor. Buna karşılık, YOLOv6.0, artan model boyutu pahasına daha yüksek mAPval 'i hedefler, bu da onu özel GPU donanımına sahip endüstriyel kurulumlar için güçlü bir aday haline getirir.
Meituan YOLOv6.0: Endüstriyel Hassasiyet
Yazarlar Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Organizasyon: Meituan
Tarih: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: YOLOv6
Dokümanlar: https:ultralytics
Meituan tarafından geliştirilen YOLOv6.0, endüstriyel uygulamalar için özel olarak tasarlanmış bir nesne algılama çerçevesidir. Özellikle GPU'larda donanıma duyarlı performans için optimize edilerek çıkarım hızı ve doğruluk arasında uygun bir denge sağlamaya odaklanır.
Mimari ve Temel Özellikler
YOLOv6 verimli bir backbone tasarımı ve eğitim sırasında karmaşık özellik çıkarma yeteneklerini korurken çıkarım sırasında modeli basitleştiren yeniden parametrelendirilebilir bir yapı (RepVGG tarzı). Sürüm 3.0, performansı daha da artırmak için kendi kendine damıtma ve çapa destekli eğitim stratejisi gibi teknikler getirmiştir.
Güçlü ve Zayıf Yönler
- Yüksek GPU Doğruluğu: COCO veri setinde rekabetçi mAP skorları sunarak üretimdeki kalite kontrol görevleri için uygun hale getirir.
- Niceleme Desteği: Dağıtımı hızlandırmak için model niceleme için özel destek sunar.
- Sınırlı Çok Yönlülük: Öncelikle nesne algılama için tasarlanmıştır, diğer çerçevelerde bulunan örnek segmentasyonu veya poz tahmini gibi daha geniş görevler için yerel destekten yoksundur.
- Daha Yüksek Kaynak Yükü: Daha büyük varyantlar, eşdeğer hafif YOLOv5 modellerine kıyasla daha fazla bellek ve hesaplama gücü gerektirir.
YOLOv6 hakkında daha fazla bilgi edinin
Ultralytics YOLOv5: Ekosistem Standardı
Yazarlar: Glenn Jocher
Organizasyon: Ultralytics
Tarih: 2020-06-26
GitHub: yolov5
Dokümanlar: https:yolov5
Ultralytics YOLOv5 kullanıcı odaklı tasarımı, güvenilirliği ve kendisini çevreleyen kapsamlı ekosistemi ile bilgisayarla görme alanında efsanevi bir modeldir. Hız, doğruluk ve kullanım kolaylığı dengesi nedeniyle dünya çapında en çok kullanılan modellerden biri olmaya devam etmektedir.
Mimari ve Temel Özellikler
YOLOv5 , sağlam özellik füzyonu için PANet boynu ile birleştirilmiş bir CSPDarknet backbone kullanır. Farklı veri kümelerinde son derece kararlı olduğu kanıtlanmış çapa tabanlı bir tespit mekanizması kullanır. Mimari son derece modülerdir ve gömülü cihazlardan bulut sunucularına kadar her şeye uyacak beş ölçek (n, s, m, l, x) sunar.
Neden YOLOv5'i Seçmelisiniz?
- Kullanım Kolaylığı: Ultralytics , basit bir Python API'si, otomatik ortam kurulumu ve kapsamlı dokümantasyon ile geliştirici deneyimine öncelik verir.
- Çok yönlülük: Birçok rakibinden farklı olarak YOLOv5 , kutudan çıkar çıkmaz görüntü sınıflandırmasını ve örnek segmentasyonunu destekler.
- Eğitim Verimliliği: Eğitim sırasında hızlı yakınsama ve düşük bellek kullanımı ile bilinir, bilgi işlem kaynaklarında maliyet tasarrufu sağlar.
- Dağıtım Esnekliği: Gibi formatlara sorunsuz bir şekilde aktarır ONNX, TensorRT, CoreML ve çeşitli donanım entegrasyonu için TFLite .
Entegre Ekosistem
YOLOv5 kullanmanın en büyük avantajlarından biri Ultralytics ekosistemidir. Ultralytics HUB gibi araçlarla entegrasyon, kodsuz model eğitimi ve önizlemesine izin verirken, deney takibi için yerleşik destek Comet ve MLflow MLOps iş akışını kolaylaştırır.
YOLOv5 hakkında daha fazla bilgi edinin
Detaylı Karşılaştırma
Mimarlık ve Tasarım Felsefesi
YOLOv6.0, belirli GPU mimarilerinde (Tesla T4 gibi) verimi en üst düzeye çıkarmak için büyük ölçüde donanıma duyarlı sinir mimarisi arama ve yeniden parametrelendirmeye dayanır. Tam tersine, YOLOv5 CPU'lar, GPU'lar ve NPU'lar arasında güvenilir bir şekilde performans gösteren evrensel bir tasarıma odaklanır. YOLOv5'in çapa tabanlı dedektörünü, bazı çapasız yaklaşımlara kıyasla küçük nesneler içeren özel veri kümeleri için ayarlamak genellikle daha kolaydır.
Kullanılabilirlik ve Eğitim Metodolojisi
Ultralytics modelleri "eğitime hazır" olacak şekilde tasarlanmıştır. YOLOv5 ile AutoAnchor gibi özellikler, bağlantı kutularını veri kümesi etiketlerinize göre otomatik olarak ayarlar ve akıllı hiperparametre evrimi, optimum eğitim ayarlarının bulunmasına yardımcı olur. YOLOv6 , yeni kullanıcılar için daha dik bir öğrenme eğrisi sunabilecek geleneksel araştırma havuzlarının daha manuel bir kurulum özelliğini gerektirir.
Gerçek Dünya Kullanım Durumları
- Ultralytics YOLOv5: hızlı prototipleme ve çeşitli dağıtımlar için idealdir. Hafif 'Nano' modeli, drone tabanlı izleme veya CPU üzerinde gerçek zamanlı çıkarım gerektiren mobil uygulamalar için mükemmeldir. Segmentasyon desteği, onu hücre segmentasyonu gibi tıbbi görüntüleme görevleri için de değerli kılar.
- YOLOv6.0: Üst düzey GPU'ların mevcut olduğu ve birincil metriğin mAP olduğu sabit endüstriyel ortamlar için en uygunudur. Örnekler arasında elektronik üretiminde otomatik optik denetim (AOI) yer alır.
Kod Örneği: YOLOv5 Çalıştırma
YOLOv5'in basitliği en iyi PyTorch Hub kullanarak sadece birkaç satır kodla çıkarım yapabilmesiyle gösterilebilir. Bu, karmaşık kurulum adımlarını ortadan kaldırır ve geliştiricilerin modeli hemen test etmesine olanak tanır.
import torch
# Load the YOLOv5s model from the official Ultralytics Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)
# Define an image URL (or local path)
img = "https://ultralytics.com/images/zidane.jpg"
# Perform inference
results = model(img)
# Display results
results.show()
# Print detailed results regarding detected objects
results.print()
Bu erişim kolaylığı, Ultralytics felsefesinin ayırt edici bir özelliğidir ve bilgisayarla görme uygulayıcılarının ortam sorunlarını ayıklamak yerine sorunları çözmeye odaklanmalarını sağlar.
Sonuç
Her iki mimari de modern görüş ortamında önemli roller üstlenmektedir. Meituan YOLOv6.0, GPU donanımında algılama doğruluğunu en üst düzeye çıkarmaya odaklanan kullanıcılar için cazip bir seçenek sunuyor.
Ancak, Ultralytics YOLOv5eşsiz çok yönlülüğü, eğitim verimliliği ve sağlam ekosistemi nedeniyle çoğu geliştirici için üstün bir seçim olmaya devam etmektedir. Uç cihazlara kolayca dağıtılabilmesi, segmentasyon ve sınıflandırma desteği ile birleştiğinde YOLOv5 'i gerçek dünyadaki yapay zeka zorlukları için kapsamlı bir çözüm haline getiriyor.
En son teknoloji ürünü performans arayanlar için şunları keşfetmenizi öneririz Ultralytics YOLO11. YOLO11 , YOLOv5 'in mirası üzerine daha da yüksek doğruluk, hız ve zengin özelliklerle inşa edilerek görsel yapay zekanın geleceğini temsil ediyor. Aşağıdakiler gibi diğer özel modeller RT-DETR transformatör tabanlı uygulamalar için de mevcuttur.
Ultralytics Modelleri Dokümantasyonu'ndaki tüm araç ve modelleri keşfedin.