YOLOv7 vs. YOLO: Detaylı Teknik Karşılaştırma
Optimum nesne algılama mimarisinin seçilmesi, bilgisayarla görü geliştirmede çok önemli bir karardır ve çıkarım gecikmesi, doğruluk ve hesaplama kaynağı tahsisi gibi birbiriyle rekabet eden talepleri dengeler. Bu teknik analiz, 2022'nin sonlarında piyasaya sürülen ve gerçek zamanlı algılamanın sınırlarını zorlayan iki etkili model olan YOLOv7 ve YOLO'yu karşılaştırmaktadır. Seçim sürecinizi yönlendirmenize yardımcı olmak için benzersiz mimari yeniliklerini, kıyaslama performanslarını ve çeşitli dağıtım senaryolarına uygunluklarını inceliyoruz.
YOLOv7: Gerçek Zamanlı Hassasiyet için Eğitimi Optimize Etme
YOLOv7 , çıkarım maliyetlerini şişirmeden performansı artırmak için mimari verimliliğe ve gelişmiş eğitim stratejilerine öncelik vererek YOLO ailesinde önemli bir evrime işaret etti. Scaled-YOLOv4'ün orijinal yazarları tarafından geliştirilen bu sistem, ağın eğitim aşamasında daha etkili bir şekilde öğrenmesini sağlayacak yöntemler getirmiştir.
Yazarlar Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Organizasyon:Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
Tarih: 2022-07-06
Arxiv:https://arxiv.org/abs/2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
Docs:ultralytics
Mimari Yenilikler
YOLOv7 'nin çekirdeğinde Genişletilmiş Verimli Katman Toplama Ağı (E-ELAN) bulunmaktadır. Bu mimari, modelin en kısa ve en uzun gradyan yollarını kontrol ederek çeşitli özellikleri öğrenmesini sağlar ve mevcut gradyan akışını bozmadan yakınsamayı iyileştirir. Ayrıca YOLOv7 , eğitim verilerinin işlenmesi sırasında uygulanan ve dağıtım sırasında modelin yapısını etkilemeyen bir dizi optimizasyon tekniği olan "eğitilebilir bedava paket" kullanır. Bunlar arasında modelin yeniden parametrelendirilmesi ve derin denetim için yardımcı başlıklar yer almaktadır. backbone sağlam özellikler yakalar.
Ücretsiz Çantalar
"Bag-of-freebies" terimi, doğruluğu artırmak için eğitim karmaşıklığını artıran ancak gerçek zamanlı çıkarım sırasında sıfır maliyete neden olan yöntemleri ifade eder. Bu felsefe, dışa aktarılan nihai modelin hafif kalmasını sağlar.
Güçlü ve Zayıf Yönler
YOLOv7 , boyutuna göre yüksek Ortalama Hassasiyet (mAP) sunan MS COCO kıyaslamasındaki mükemmel dengesiyle ünlüdür. Birincil gücü, hassasiyetin çok önemli olduğu yüksek çözünürlüklü görevlerde yatmaktadır. Ancak mimarinin karmaşıklığı, özel araştırmalar için modifiye edilmesini zorlaştırabilir. Ayrıca, çıkarım verimli olsa da, eğitim süreci yoğun kaynak gerektirir ve daha yeni mimarilere kıyasla önemli miktarda GPU belleği gerektirir.
YOLOv7 hakkında daha fazla bilgi edinin
YOLO: Sinirsel Mimari Sınır Arayışı
Alibaba'nın araştırma ekibinden çıkan YOLO, düşük gecikmeli ortamlar için uyarlanmış verimli ağ yapılarını otomatik olarak keşfetmek için Sinirsel Mimari Arama'dan (NAS) yararlanarak farklı bir yaklaşım benimsiyor.
Yazarlar Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Organizasyon:Alibaba Group
Tarih: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444
GitHubYOLO
Mimari Yenilikler
YOLO , belirli gecikme kısıtlamaları altında verimi en üst düzeye çıkaran GiraffeNet adlı bir backbone oluşturmak için bir yöntem olan MAE-NAS'ı sunar. Bunu tamamlayan ZeroHead, sınıflandırma ve regresyon görevlerini ayrıştırırken ağır parametreleri kaldırarak model boyutunu önemli ölçüde azaltan hafif bir algılama kafasıdır. Mimari ayrıca çok ölçekli özellik füzyonu için RepGFPN (Genelleştirilmiş Özellik Piramidi Ağı) olarak bilinen verimli bir boyun kullanır ve etiket ataması için AlignedOTA kullanarak sınıflandırma puanlarını yerelleştirme doğruluğu ile hizalar.
Güçlü ve Zayıf Yönler
YOLO , uç yapay zeka senaryolarında mükemmeldir. Daha küçük varyantları (Tiny/Small) etkileyici hızlar sunarak onları mobil cihazlar ve IoT uygulamaları için uygun hale getirir. NAS kullanımı, mimarinin verimlilik için matematiksel olarak optimize edilmesini sağlar. Buna karşılık, en büyük YOLO modelleri bazen saf doğruluk açısından en üst düzey YOLOv7 modellerinin gerisinde kalmaktadır. Ayrıca, araştırma merkezli bir proje olarak, daha geniş çerçevelerde bulunan kapsamlı ekosistem ve araç desteğinden yoksundur.
DAMO-YOLO hakkında daha fazla bilgi edinin
Performans Metriklerinin Karşılaştırılması
Aşağıdaki tablo performans ödünleşimlerini vurgulamaktadır. YOLOv7 genellikle daha yüksek hesaplama karmaşıklığı (FLOP) pahasına daha yüksek doğruluk (mAP) elde ederken, YOLO özellikle daha küçük konfigürasyonlarında hız ve parametre verimliliğine öncelik vermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Gerçek Dünya Uygulamaları
Bu modeller arasında seçim yapmak genellikle dağıtım donanımına ve gereken belirli bilgisayarla görme görevlerine bağlıdır.
- Üst Düzey Güvenlik ve Analitik (YOLOv7): Güvenlik alarm sistemleri veya ayrıntılı trafik yönetimi gibi her bir doğruluk yüzdesinin önemli olduğu güçlü sunucular üzerinde çalışan uygulamalar için YOLOv7 güçlü bir adaydır. İnce ayrıntıları çözme yeteneği, onu yüksek çözünürlüklü video akışlarındaki küçük nesneleri tespit etmek için uygun hale getirir.
- Uç Cihazlar ve Robotik (YOLO): Otonom robotik veya mobil uygulamalar gibi katı gecikme bütçelerine sahip senaryolarda, YOLO'nun hafif mimarisi parlıyor. Düşük parametre sayısı, nesne algılama yapan pille çalışan cihazlar için kritik olan bellek bant genişliği baskısını azaltır.
Ultralytics Avantajı: Neden Modernize Edilmeli?
YOLOv7 ve YOLO yetenekli modeller olsa da, yapay zeka dünyası hızla ilerlemektedir. Geleceğe dönük, verimli ve kullanıcı dostu bir çözüm arayan geliştiriciler ve araştırmacılar Ultralytics ekosistemini göz önünde bulundurmalıdır, özellikle YOLO11. Modern Ultralytics modellerine yükseltme birkaç belirgin avantaj sunar:
1. Kolaylaştırılmış Kullanım Kolaylığı
Ultralytics modelleri geliştirici deneyimine öncelik verir. Genellikle karmaşık ortam kurulumları ve manuel komut dosyası yürütme gerektiren araştırma depolarının aksine, Ultralytics birleşik bir Python API ve CLI sağlar. Modelleri yalnızca birkaç satır kodla eğitebilir, doğrulayabilir ve dağıtabilirsiniz.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt")
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference
results = model("path/to/image.jpg")
2. Kapsamlı Çok Yönlülük
YOLOv7 ve YOLO öncelikle sınırlayıcı kutu tespiti için tasarlanmıştır. Buna karşılık YOLO11 , örnek segmentasyonu, poz tahmini, yönlendirilmiş nesne algılama (OBB) ve görüntü sınıflandırması dahil olmak üzere aynı çerçeve içinde yerel olarak çok çeşitli görevleri destekler. Bu, sporda insan duruşunuanaliz etmek gibi karmaşık sorunların üstesinden kütüphaneleri değiştirmedengelmenizi sağlar.
3. Üstün Performans ve Verimlilik
YOLO11 , önemli ölçüde azaltılmış hesaplama ek yükü ile son teknoloji ürünü doğruluk sunmak için yıllarca süren Ar-Ge çalışmalarına dayanmaktadır. Çapasız bir algılama kafası ve optimize edilmiş arka uç işlemleri kullanır, bu da hem eğitim hem de çıkarım sırasında eski YOLO sürümlerine veya dönüştürücü tabanlı modellere kıyasla daha düşük bellek kullanımına neden olur. RT-DETR. Bu verimlilik, daha düşük bulut bilişim maliyetleri ve uç donanımlarda daha hızlı işlem anlamına gelir.
4. Sağlam Ekosistem ve Destek
Ultralytics modelini benimsemek sizi gelişen, bakımı iyi yapılan bir ekosisteme bağlar. Sık güncellemeler, kapsamlı belgeler ve aktif topluluk kanalları sayesinde desteklenmeyen kodlarda hata ayıklama yapmak zorunda kalmazsınız. Ayrıca, Ultralytics HUB gibi araçlarla sorunsuz entegrasyonlar, kolay model dağıtımı ve veri kümesi yönetimini kolaylaştırır.
YOLO11 hakkında daha fazla bilgi edinin
Sonuç
Hem YOLOv7 hem de YOLO 2022'de nesne algılama alanına önemli katkılarda bulundu. YOLOv7 , eğitilebilir optimizasyon tekniklerinin doğruluğu nasıl artırabileceğini gösterirken, YOLO , verimli, uç noktalara hazır modeller oluşturmak için Sinir Mimarisi Aramasının gücünü sergiledi.
Ancak günümüzün üretim ortamları için, YOLO11 vizyon yapay zeka teknolojisinin zirvesini temsil etmektedir. YOLO'nun hızını, YOLOv7'nin hassasiyetini ve Ultralytics çerçevesinin eşsiz kullanılabilirliğini bir araya getiren YOLO11 , geliştirme döngülerini hızlandıran ve uygulama performansını artıran çok yönlü bir çözüm sunar. İster akıllı şehir altyapısı kuruyor ister üretim kalite kontrolünü optimize ediyor olun, Ultralytics modelleri başarı için gereken güvenilirliği ve verimliliği sağlar.
Diğer Modelleri İnceleyin
Bilgisayarla görme alanındaki diğer seçenekleri keşfetmekle ilgileniyorsanız, bu modelleri göz önünde bulundurun:
- Ultralytics YOLOv8: YOLO11'in öncülü, sağlamlığı ve sektörde geniş çapta benimsenmesiyle bilinir.
- YOLOv10: Düşük gecikme süresi için NMS'siz eğitime odaklanan gerçek zamanlı bir dedektör.
- YOLOv9: Derin ağlardaki bilgi kaybını azaltmak için Programlanabilir Gradyan Bilgisini (PGI) sunar.
- RT-DETR: Yüksek doğruluk sunan ancak tipik olarak daha fazla GPU belleği gerektiren transformatör tabanlı bir dedektör.
- YOLOv6: Endüstriyel uygulamalar için optimize edilmiş bir başka verimlilik odaklı model.