YOLOv6.0 vs YOLOv9: Endüstriyel Hız Son Teknoloji Verimlilikle Buluşuyor
Optimum nesne algılama modelinin seçilmesi, bilgisayarla görü geliştirmede çok önemli bir karardır ve doğruluk, çıkarım hızı ve hesaplama verimliliği arasında stratejik bir denge gerektirir. Bu karşılaştırma, Meituan tarafından endüstriyel verim için tasarlanmış bir model olan YOLOv6.0'ın teknik nüanslarını ve YOLOv9bilgi koruma yoluyla verimliliği yeniden tanımlayan son teknoloji ürünü bir mimari.
YOLOv6.0: Endüstriyel Uygulamalar için Optimize Edildi
YOLOv6.0, ağırlıklı olarak donanım gecikmesinin birincil darboğaz olduğu pratik dağıtım senaryolarına odaklanmaktadır.
- Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
- Organizasyon:Meituan
- Tarih: 2023-01-13
- Arxiv:https://arxiv.org/abs/2301.05586
- GitHub:https://github.com/meituan/YOLOv6
- Dokümanlar:https://docs.ultralytics.com/models/yolov6/
Mimarlık ve Tasarım Felsefesi
YOLOv6.0, donanıma duyarlı bir Evrişimsel Sinir Ağı (CNN) olarak tasarlanmıştır. Mimari, GPU'lardaki verimi en üst düzeye çıkarmak için verimli bir yeniden parametrelendirme backbone ve hibrit bloklar (RepBi-PAN) kullanır. Model yapısını belirli donanım özelliklerine göre uyarlayan YOLOv6 , doğruluktan ciddi ölçüde ödün vermeden yüksek çıkarım hızları sunmayı amaçlamaktadır. Gerçek zamanlı işlemenin tartışılmaz olduğu endüstriyel otomasyon ve gözetim için optimize edilmiş tek aşamalı bir dedektör olarak hizmet vermektedir.
Güçlü Yönler ve Sınırlamalar
Güçlü Yönler:
- Çıkarım Hızı: Model, özellikle NVIDIA T4 GPU'larda düşük gecikmeli ortamlarda mükemmeldir ve bu da onu yüksek hızlı üretim hatları için uygun hale getirir.
- Donanım Optimizasyonu: "Donanım dostu" tasarımı, modelin dağıtım sırasında bellek bant genişliğini ve hesaplama birimlerini etkin bir şekilde kullanmasını sağlar.
Zayıflıklar:
- Özellik Temsili: YOLOv9 gibi daha yeni modellerde bulunan gelişmiş gradyan bilgisi koruma tekniklerinden yoksundur ve model boyutu azaldıkça daha dik bir doğruluk düşüşüne yol açar.
- Ekosistem Desteği: Etkili olmakla birlikte, araçlar, topluluk desteği ve kolay entegrasyon için çevredeki ekosistem Ultralytics çerçevesine kıyasla daha az kapsamlıdır.
- Sınırlı Çok Yönlülük: Çok yönlü Ultralytics modellerine kıyasla segmentasyon veya poz tahmini gibi karmaşık görevler için daha az yerel destek ile öncelikle sınırlayıcı kutu algılamaya odaklanmıştır.
YOLOv6 hakkında daha fazla bilgi edinin
YOLOv9: Doğruluk ve Bilgi Akışının Yeniden Tanımlanması
YOLOv9 , derin ağlardaki temel bilgi kaybı sorununu ele alan ve üstün performans metrikleri elde eden yeni mimari kavramlar sunar.
- Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
- Organizasyon:Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
- Tarih: 2024-02-21
- Arxiv:https://arxiv.org/abs/2402.13616
- GitHub:https://github.com/WongKinYiu/yolov9
- Dokümanlar:https://docs.ultralytics.com/models/yolov9/
Mimari: PGI ve GELAN
YOLOv9 , çığır açan iki yenilikle kendini farklılaştırıyor: Programlanabilir Gradyan Bilgisi (PGI ) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN).
- PGI, derin sinir ağlarının doğasında bulunan bilgi darboğazı sorunuyla mücadele eder. PGI, katmanlar arasında önemli gradyan verilerini koruyarak modelin daha güvenilir özellikler öğrenmesini ve böylece daha yüksek hassasiyet elde edilmesini sağlar.
- GELAN, parametre kullanımını optimize ederek modelin geleneksel mimarilere kıyasla daha az parametre ve hesaplama maliyeti ile daha yüksek doğruluk elde etmesini sağlar.
Yenilik Spot Işığı: Programlanabilir Gradyan Bilgisi (PGI)
Derin ağlar, bilgi darboğazı olarak bilinen bir olgu olan veri ardışık katmanlardan geçerken genellikle bilgi kaybeder. YOLOv9'un PGI 'sı, hedef nesneleri öğrenmek için gerekli verilerin ağ derinliği boyunca korunmasını sağlayan yardımcı bir denetim mekanizması görevi görür. Bu, özellikle detect edilmesi zor nesneler için önemli ölçüde daha iyi yakınsama ve doğruluk sağlar.
Ultralytics Ekosisteminin Avantajları
YOLOv9 'un Ultralytics ekosistemine entegre edilmesi, geliştiriciler için belirgin avantajlar sağlar:
- Kullanım Kolaylığı: Birleşik bir Python API 'si ve CLI Eğitim, doğrulama ve dağıtımı basitleştirir.
- Performans Dengesi: YOLOv9 en son teknolojiye ulaşıyor mAP Rekabetçi çıkarım hızlarını korurken, çeşitli uygulamalar için mükemmel bir denge sunar.
- Bellek Verimliliği: Ultralytics uygulamaları, bazı transformatör tabanlı modellerin yüksek VRAM gereksinimlerinin aksine, eğitim sırasında daha düşük bellek ayak izleri için optimize edilmiştir.
- Çok yönlülük: Algılamanın ötesinde, Ultralytics çerçevesindeki mimarinin esnekliği, sağlam bir topluluk ve sık güncellemelerle desteklenen diğer görevlere genişlemeyi destekler.
YOLOv9 hakkında daha fazla bilgi edinin
Karşılaştırmalı Performans Analizi
Performans verileri net bir ayrımı vurgulamaktadır: YOLOv6.0 belirli bir donanım üzerinde ham hız için optimizasyon yaparken, YOLOv9 verimlilikte (parametre başına doğruluk) baskındır.
Örneğin, YOLOv9c sadece 25,3M parametre ile %53, 0 mAP elde ederek, iki katından fazla parametre (59,6M) ve önemli ölçüde daha yüksek FLOP gerektiren YOLOv6.0l 'den (%52,8 mAP) daha iyi performans göstermektedir. Bu, YOLOv9'un mimari yeniliklerinin (GELAN ve PGI) "daha azıyla daha fazlasını öğrenmesine" olanak tanıdığını ve hala yüksek hassasiyet gerektiren kaynak kısıtlı ortamlar için oldukça verimli bir seçim olduğunu göstermektedir.
Buna karşılık, YOLOv6.0n son derece düşük gecikme süresi (1,17 ms) sunarak doğrulukta bir düşüşün (%37,5 mAP) kabul edilebilir olduğu ultra hızlı gerçek zamanlı çıkarım için uygun hale getirir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv6.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Eğitim ve Dağıtım İş Akışları
Geliştirici deneyimi iki model arasında önemli farklılıklar gösterir. YOLOv6.0 genellikle kabuk komut dosyaları ve manuel yapılandırma dosyalarını içeren depoya özgü bir iş akışına dayanır. Güçlü olsa da, bu yeni gelenler için daha dik bir öğrenme eğrisi sunabilir.
Buna karşılık, YOLOv9 kolaylaştırılmış Ultralytics iş akışı. Son teknoloji ürünü bir modeli eğitmek için minimum kod gerekir ve ekosistem aşağıdaki gibi formatlara sorunsuz aktarımı destekler ONNX, TensorRTve geniş dağıtım uyumluluğu için CoreML .
Örnek: Ultralytics ile YOLOv9 Eğitimi
Ultralytics Python arayüzü, yalnızca birkaç satır kodla eğitim çalıştırmalarının başlatılmasına, veri artırma, günlük kaydı ve değerlendirmenin otomatik olarak yapılmasına olanak tanır.
from ultralytics import YOLO
# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")
# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Dağıtım Esnekliği
YOLOv9 da dahil olmak üzere Ultralytics modelleri, uç yapay zeka ve bulut dağıtımı için uygun çeşitli formatlara tek tıklamayla dışa aktarmayı destekler. Bu esneklik, araştırmadan üretime geçişi kolaylaştırır.
İdeal Kullanım Senaryoları
YOLOv6.0
- Yüksek Hızlı Montaj Hatları: Konveyör hızlarının 2 ms'nin altında gecikme gerektirdiği kalite kontrol sistemleri.
- Özel Donanım: Donanıma duyarlı mimariden tam olarak yararlanılan belirli NVIDIA GPU'larda çalışan senaryolar.
YOLOv9
- Otonom Sistemler: Karmaşık ortamlarda güvenli bir şekilde gezinmek için yüksek hassasiyet gerektirensürücüsüz araçlar ve robotik.
- Tıbbi Görüntüleme: Küçük bir özelliği kaçırmanın (yanlış negatif) kabul edilemez olduğu tümör tespiti gibi uygulamalar.
- Genel Amaçlı CV: Çeşitli görevler için mükemmel dokümantasyon ve topluluk desteğine sahip sağlam, kullanımı kolay bir model arayan geliştiriciler.
Sonuç
YOLOv6.0, belirli bir donanım üzerinde ham verime öncelik veren özel endüstriyel uygulamalar için güçlü bir araç olmaya devam etmektedir, YOLOv9 modern bilgisayarla görme projelerinin çoğu için üstün bir seçim olarak öne çıkıyor.
YOLOv9'un yenilikçi PGI ve GELAN mimarisi, daha iyi bir doğruluk ve verimlilik dengesi sunarak parametre başına performans ölçümlerinde YOLOv6 'yı geride bırakır. Ayrıca, Ultralytics ekosistemi ile entegrasyon, geliştiricilerin kolaylaştırılmış bir iş akışından, aktif bakımdan ve verilerden dağıtıma kadar olan yolculuğu hızlandıran bir araç paketinden yararlanmasını sağlar. Geleceğe dönük, çok yönlü ve yüksek performanslı bir model arayanlar için YOLOv9 önerilen YOLOv9 .
Diğer Modelleri İnceleyin
Son teknoloji seçenekleri araştırıyorsanız, Ultralytics kütüphanesindeki bu diğer güçlü modelleri göz önünde bulundurun:
- YOLO11: Algılama, segmentasyon ve poz tahmini için en üstün performansı sunan YOLO serisinin en son evrimi.
- YOLOv8: Birden fazla görevde hız ve doğruluk dengesiyle bilinen oldukça popüler ve çok yönlü bir model.
- RT-DETR: Maksimum Olmayan BastırmayaNMS) ihtiyaç duymadan doğrulukta üstünlük sağlayan transformatör tabanlı bir dedektör.