YOLOv6.0 vs YOLO: Nesne Algılama için Teknik Bir Karşılaştırma
Doğru bilgisayarla görme mimarisini seçmek, mühendisler ve araştırmacılar için çok önemli bir karardır. Endüstriyel devlerin sürekli olarak hız ve doğruluk sınırlarını zorladığı nesne algılama ortamı rekabetçidir. Bu sayfa, Meituan'ın donanım açısından verimli modeli YOLOv6.0 ile Alibaba Group'un teknoloji dolu mimarisi YOLO arasında kapsamlı bir teknik karşılaştırma sunmaktadır.
YOLOv6.0 Genel Bakış
YOLOv6.0, endüstriyel uygulamalar için özel olarak tasarlanmış sağlam bir çerçeve görevi görüyor. Meituan'ın Vision AI Departmanı tarafından piyasaya sürülen bu ürün, gerçek dünya verimliliğine öncelik vererek üretim ve otomasyonda bulunan standart donanım kısıtlamalarında yüksek performans sunmayı amaçlıyor.
- Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
- Organizasyon:Meituan
- Tarih: 2023-01-13
- Arxiv:YOLOv6 v3.0: Tam Ölçekli Bir Yeniden Yükleme
- GitHub:YOLOv6
- Dokümanlar:Ultralytics YOLOv6 Dokümantasyonu
Mimari ve Temel Yenilikler
YOLOv6.0, yeniden parametrelendirmeye odaklanarak tek aşamalı dedektör paradigmasını geliştirmektedir. Bu teknik, modelin daha iyi öğrenme için eğitim sırasında karmaşık bir yapıya sahip olmasını sağlar, ancak çıkarım sırasında daha basit, daha hızlı bir yapıya dönüşür.
- EfficientRep Backbone: backbone , farklı model boyutları için farklı bloklar kullanır (küçük modeller için EfficientRep ve daha büyük modeller için CSPStackRep) ve GPU donanım özelliklerinin kullanımını optimize eder.
- Rep-PAN Boyun: Boyun, yüksek çıkarım hızlarını korurken özellik füzyonunu geliştiren bir Rep-PAN topolojisi kullanır.
- Kendi Kendine Damıtma: Dağıtım sırasında ayrı bir öğretmen modelinin hesaplama maliyeti olmadan doğruluğu artırmak için modelin kendi tahminlerinden (özellikle aynı ağ içindeki bir öğretmen dalı) öğrendiği önemli bir eğitim metodolojisi.
Endüstriyel Optimizasyon
YOLOv6 açıkça niceleme göz önünde bulundurularak tasarlanmıştır. Mimarisi, Eğitim Sonrası Niceleme (PTQ) ve Nicelemeye Uygun Eğitim (QAT) için uygundur, bu da onu INT8 hassasiyetinin hız için tercih edildiği uç cihazlarda dağıtım için güçlü bir aday haline getirir.
YOLOv6 hakkında daha fazla bilgi edinin
DAMO-YOLO'ya Genel Bakış
Alibaba Group tarafından geliştirilen YOLO, performans ve gecikme arasındaki dengeyi optimize etmek için bir dizi yeni teknoloji sunmaktadır. Sinirsel Mimari Arama (NAS) ve gelişmiş özellik füzyonu tekniklerini bir araya getirerek farklılaşıyor.
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Organizasyon:Alibaba Group
- Tarih: 2022-11-23
- Arxiv:YOLO: Gerçek Zamanlı Nesne Algılama Tasarımı Üzerine Bir Rapor
- GitHub:YOLO
- Dokümanlar:YOLO GitHub README
Mimari ve Temel Yenilikler
YOLO , verimli yapılar bulmak için kısmen otomatik arama stratejilerine güvenerek tamamen elle hazırlanmış mimarilerden uzaklaşır.
- NAS Destekli Backbone (MazeNet): backbone , MAE-NAS (Sinirsel Mimari Arama) kullanılarak oluşturulur ve sonuçta değişen hesaplama bütçeleri için son derece optimize edilmiş MazeNet adı verilen bir yapı ortaya çıkar.
- Verimli RepGFPN: Yeniden parametrelendirme ile birlikte Genelleştirilmiş Özellik Piramidi Ağı (GFPN) kullanır. Bu, çeşitli boyutlardaki nesneleri tespit etmek için kritik olan zengin çok ölçekli özellik füzyonuna olanak tanır.
- ZeroHead: Ağın son aşamasında parametre sayısını ve hesaplama karmaşıklığını azaltan basitleştirilmiş bir algılama kafası tasarımı.
- AlignedOTA: Eğitim sürecinde sınıflandırma ve regresyon görevleri arasındaki yanlış hizalamayı çözen dinamik bir etiket atama stratejisi.
Gelişmiş Özellik Füzyonu
YOLO 'daki RepGFPN boynu, özellikle üst üste binen nesnelerin bulunduğu karmaşık sahnelerin işlenmesinde etkilidir. Farklı ölçek seviyeleri arasında atlama bağlantılarına izin vererek, anlamsal bilgileri standart FPN yapılarından daha iyi korur.
DAMO-YOLO hakkında daha fazla bilgi edinin
Performans Analizi: Hız - Doğruluk Karşılaştırması
Aşağıdaki karşılaştırmada COCO val2017 veri setinden alınan veriler kullanılmıştır. Metrikler, farklı ölçeklerde iki model arasındaki değiş tokuşları vurgulamaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv6.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Temel Çıkarımlar
- Gecikme Lideri:YOLOv6.0n, T4 GPU'da 1,17 ms ile bu karşılaştırmadaki en hızlı modeldir. Bu da onu gerçek zamanlı çıkarım senaryolarındaki yüksek FPS gereksinimleri için son derece uygun hale getiriyor.
- Doğruluk Zirvesi:YOLOv6.0l en yüksek doğruluğa bir mAPYOLO'ya kıyasla daha yüksek parametreler ve FLOP'lar pahasına olsa da, ağır backbone ve kendi kendine damıtma stratejisinin etkinliğini gösteren 52,8.
- Verimlilik Tatlı Nokta:DAMO-YOLOs, daha az parametreye sahipken (16.3M'ye karşı 18.5M) doğrulukta YOLOv6.0s'den daha iyi performans gösterir (46.0'a karşı 45.0 mAP). Bu, küçük model rejiminde NAS tarafından aranan backbone verimliliğini vurgulamaktadır.
- Parametre Verimliliği: Genel olarak, YOLO modelleri orta ila büyük aralıkta karşılaştırılabilir doğruluk için daha düşük FLOP'lar ve parametre sayıları sergileyerek ZeroHead tasarımının etkinliğini doğrulamaktadır.
Ultralytics Avantajı
YOLOv6.0 ve YOLO ise belirli nişler için cazip özellikler sunuyor, Ultralytics YOLO11 modern yapay zeka gelişimi için daha bütünsel bir çözüm sunar. Bir Ultralytics modeli seçmek, tüm makine öğrenimi yaşam döngüsünü kolaylaştırmak için tasarlanmış kapsamlı bir ekosistemin kilidini açar.
Neden Ultralytics YOLO'yu Seçmelisiniz?
- Eşsiz Kullanım Kolaylığı: Genellikle karmaşık ortam kurulumları ve özel C++ operatörlerinin derlenmesini gerektiren araştırma depolarının aksine, Ultralytics modelleri basit bir
pip install ultralytics. Sezgisel python API modelleri yalnızca birkaç satır kodla eğitmenize ve dağıtmanıza olanak tanır. - Performans Dengesi: YOLO11 , çıkarım hızı ve doğruluk arasında en uygun dengeyi sağlayacak şekilde tasarlanmıştır ve eğitim sırasında daha düşük bellek gereksinimlerini korurken gerçek dünya kıyaslamalarında rakiplerinden daha iyi performans gösterir.
- Görev Çok Yönlülüğü: YOLOv6 ve YOLO öncelikle nesne algılayıcıları olsa da, Ultralytics YOLO , Örnek Segmentasyonu, Poz Tahmini, Sınıflandırma ve Yönlendirilmiş Sınırlama Kutusu (OBB) algılama dahil olmak üzere çok çeşitli görevleri yerel olarak destekler.
- İyi Korunan Ekosistem: Ultralytics , Discord ve GitHub aracılığıyla sık güncellemeler, kapsamlı belgeler ve topluluk desteği ile yaşayan bir ekosistem sağlar. Bu, projenizin geleceğe dönük kalmasını ve en yeni donanım ve yazılım kitaplıklarıyla uyumlu olmasını sağlar.
- Dağıtım Esnekliği: Eğitimli modellerinizi aşağıdaki gibi çeşitli formatlarda kolayca dışa aktarın ONNX, TensorRT, CoreML ve OpenVINO 'yu yerleşik dışa aktarma modunu kullanarak bulut sunucularından Raspberry Pi cihazlarına kadar her şeye dağıtımı kolaylaştırır.
Örnek: YOLO11 ile Nesne Algılamayı Çalıştırma
Ultralytics ile son teknoloji ürünü algılamaya başlamak son derece basittir:
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference on an image
results = model("path/to/image.jpg")
# Display the results
results[0].show()
Sonuç
Hem YOLOv6.0 hem de YOLO nesne algılamanın evriminde önemli kilometre taşlarını temsil etmektedir. YOLOv6.0, özellikle Nano varyantı ile ham hız ve niceleme desteğinin çok önemli olduğu endüstriyel ortamlarda üstünlük sağlamaktadır. YOLO , Sinirsel Mimari Arama ve yenilikçi özellik füzyonunun gücünü sergileyerek küçük-orta model aralığında yüksek verimlilik ve doğruluk sunar.
Ancak, son teknoloji performansı çok yönlülük ve kullanım kolaylığı ile birleştiren üretime hazır bir çözüm arayan geliştiriciler için, Ultralytics YOLO11 önerilen seçim olmaya devam ediyor. Sağlam ekosistemi, çoklu görev yetenekleri ve modern MLOps iş akışlarına sorunsuz entegrasyonu, proje başarısını sağlamak için belirgin bir avantaj sağlar.
Diğer Modelleri İnceleyin
Nesne algılama ortamına ilişkin anlayışınızı genişletmek için bu ilgili model karşılaştırmalarını incelemeyi düşünün:
- YOLO11 vs. YOLOv6
- DAMO-YOLO ve YOLOv8 Karşılaştırması
- DAMO-YOLO ve RT-DETR Karşılaştırması
- YOLOv6 vs. EfficientDet
- DAMO-YOLO - YOLOX Karşılaştırması