İçeriğe geç

YOLOv7 vs. YOLOv6.0: Kapsamlı Bir Teknik Karşılaştırma

Bilgisayarla görmenin hızla gelişen ortamında, doğru nesne algılama modelini seçmek projenin başarısı için çok önemlidir. Alanı şekillendiren iki önemli çerçeve YOLOv7 ve YOLOv6.0'dır. Her ikisi de YOLO (You Only Look Once - Yalnızca Bir Kez Bakarsınız) çizgisini paylaşsa da mimari felsefeleri ve optimizasyon hedefleri açısından önemli ölçüde farklılaşmaktadır.

Bu kılavuz, bu iki modelin mimarilerini, performans ölçümlerini ve ideal dağıtım senaryolarını karşılaştırarak derinlemesine bir teknik analiz sunmaktadır. gibi modern alternatiflerin nasıl kullanıldığını da araştırıyoruz. Ultralytics YOLO11 bu öncüllerin en iyi özelliklerini birleşik, kullanıcı dostu bir ekosisteme entegre eder.

YOLOv7: Doğruluk Mimarisi

YOLOv7Temmuz 2022'de piyasaya sürülen YOLO , gerçek zamanlı çıkarım yeteneklerinden ödün vermeden doğruluğu en üst düzeye çıkarmak için mimari yeniliklere öncelik vererek YOLO ailesinde büyük bir değişimi temsil etti. COCO veri kümesi kıyaslamalarının sınırlarını zorlamak için tasarlanmıştır.

Yazarlar Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Organizasyon:Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
Tarih: 2022-07-06
Arxiv:https://arxiv.org/abs/2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
Docs:ultralytics

Temel Mimari Özellikler

YOLOv7 , çıkarım maliyetini artırmadan doğruluğu artıran bir dizi optimizasyon yöntemi olan "eğitilebilir ücretsiz torba "yı tanıttı.

  • E-ELAN (Genişletilmiş Verimli Katman Toplama Ağları): Bu mimari, en kısa ve en uzun gradyan yollarını kontrol ederek ağın öğrenme kabiliyetini geliştirir. Hesaplama bloklarının kardinalitesini genişleterek modelin daha çeşitli özellikler öğrenmesini sağlar.
  • Model Ölçeklendirme: YOLOv7 , derinlik ve genişliği aynı anda değiştiren bileşik ölçeklendirme teknikleri kullanarak farklı model boyutlarında (Tiny'den E6E'ye) optimum performans sağlar.
  • Yardımcı Kafa Eğitimi: Model, derin denetim sağlamak için eğitim sırasında yardımcı bir kafa kullanır ve bu kafa daha sonra çıkarım sırasında çıkarılır. Bu, derin öğrenme modelinin yakınsamasını iyileştirir.

Güçlü ve Zayıf Yönler

YOLOv7 , özellikle küçük ve tıkalı nesnelerde yüksek Ortalama Hassasiyeti (mAP) ile ünlüdür. Hassasiyetin çok önemli olduğu araştırma ve senaryolar için mükemmel bir seçimdir. Bununla birlikte, büyük ölçüde birleştirme tabanlı katmanlara dayanan karmaşık mimarisi, aerodinamik endüstriyel modellere kıyasla eğitim sırasında daha yüksek bellek tüketimine neden olabilir.

YOLOv7 hakkında daha fazla bilgi edinin

YOLOv6.0: Endüstriyel Hız için Tasarlandı

Meituan'daki görsel hesaplama departmanı tarafından geliştirilen YOLOv6.0, büyük ölçüde pratik endüstriyel uygulamalara odaklanıyor. 2023'ün başlarında piyasaya sürülen bu sürüm, çıkarım hızına ve donanım verimliliğine öncelik vererek uç bilişim için güçlü bir aday haline geliyor.

Yazarlar Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Organizasyon: Meituan
Tarih: 2023-01-13
ArxivYOLOv6
GitHubYOLOv6
DocsYOLOv6ultralytics

Temel Mimari Özellikler

YOLOv6.0, özellikle GPU ve CPU verimi için optimize edilmiş, donanıma duyarlı tasarımı ile farklıdır.

  • RepVGG Backbone: Model yeniden parametrelendirme (RepVGG) bloklarını kullanır. Eğitim sırasında, model daha iyi öğrenme için çok dallı bir topolojiye sahiptir ve bu topoloji çıkarım için matematiksel olarak tek dallı bir yapıda birleştirilir. Bu, NVIDIA Jetson gibi donanımlarda daha hızlı yürütme sağlar.
  • Ayrılmış Kafa: Sınıflandırma ve lokalizasyon için özellikleri paylaşan önceki YOLO sürümlerinin aksine, YOLOv6 ayrılmış bir kafa kullanır. Bu ayrım, yakınsama hızını ve tespit doğruluğunu artırır.
  • Niceleme Dostu: Mimari, kaynak kısıtlı cihazlara yerleştirmek için gerekli olan model nicelemesine (örn. INT8) dost olacak şekilde tasarlanmıştır.

Güçlü ve Zayıf Yönler

YOLOv6.0 ham verim açısından üstündür. Milisaniyelerin önemli olduğu endüstriyel otomasyon hatları veya robotik için optimize edilmiş çıkarım grafiği önemli bir avantajdır. Bununla birlikte, YOLO11 gibi daha sonraki yinelemelerde bulunan yerel çoklu görev çok yönlülüğünden yoksun olduğu için öncelikle algılamaya odaklanmaktadır.

YOLOv6.0 hakkında daha fazla bilgi edinin

Performans Karşılaştırması

Aşağıdaki tablo iki model arasındaki dengeleri göstermektedir. YOLOv6.0 genellikle benzer doğruluk seviyeleri için üstün hız sunarken, YOLOv7 algılama hassasiyetinin tavanını zorlar.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0m64050.0-5.2834.985.8
YOLOv6.0l64052.8-8.9559.6150.7

Sonuçların Analizi

  • Hız ve Doğruluk: YOLOv6.0n, T4 GPU'larda 1,17 ms çıkarım elde ederek yüksek hızlı video analizi için ideal hale getiren aşırı hızıyla öne çıkıyor.
  • Tepe Doğruluk: YOLOv7x daha yüksek bir doğruluğa ulaşır mAP (%53,1), YOLOv6.0l (%52,8) ile karşılaştırıldığında zor örnekleri tespit etmedeki gücünü ortaya koymaktadır.
  • Hesaplama Verimliliği: YOLOv6 , karşılaştırılabilir performans seviyeleri için daha az FLOP kullanarak "EfficientRep" tasarım felsefesini doğruluyor.

Dağıtımla İlgili Hususlar

Kıyaslamalar bir temel oluştursa da, gerçek dünya performansı büyük ölçüde dağıtım donanımına bağlıdır. YOLOv6'nın yeniden parametrelendirmesi GPU'larda parlarken, YOLOv7'nin birleştirme tabanlı mimarisi sağlamdır ancak bellek bant genişliği açısından yoğun olabilir.

Ultralytics Avantajı: Karşılaştırmanın Ötesinde

YOLOv7 ve YOLOv6.0 bilgisayarla görme tarihinde önemli başarıları temsil ederken, alan hızla ilerliyor. Sürdürülebilir, geleceğe dönük bir çözüm arayan geliştiriciler için, Ultralytics YOLO11 bireysel model mimarilerinin sınırlamalarını ortadan kaldıran kapsamlı bir ekosistem sunmaktadır.

Neden Ultralytics YOLO11'i Seçmelisiniz?

  1. Eşsiz Kullanım Kolaylığı: Karmaşık depo klonlama ve ortam kurulumu gerektiren birçok açık kaynaklı modelin aksine, Ultralytics modellerine basit bir pip kurulumu ile erişilebilir. Python API tasarımı sezgiseldir ve sadece birkaç kod satırında eğitim ve çıkarıma izin verir.
  2. Performans Dengesi: YOLO11 , hem YOLOv6 hem de YOLOv7'nin mimari dersleri üzerine inşa edilmiştir. Gerçek zamanlı uygulamalar için gereken çıkarım hızlarını korurken son teknoloji doğruluğa ulaşan rafine bir mimari kullanır.
  3. Çok yönlülük: Ultralytics ekosisteminin en güçlü avantajlarından biri, birden fazla görevi desteklemesidir. YOLOv6 ve YOLOv7 öncelikle algılamaya odaklanırken, YOLO11 yerel olarak Örnek Segmentasyonu, Poz Tahmini, Sınıflandırma ve Yönlendirilmiş Nesne Algılamayı (OBB) destekler.
  4. Eğitim Verimliliği: Ultralytics modelleri, eğitim sırasında daha hızlı yakınsama ve daha düşük bellek kullanımı için optimize edilmiştir. Bu verimli kaynak yönetimi, genellikle eski dönüştürücü veya birleştirme ağırlıklı mimarilerle ilişkili büyük CUDA bellek ek yükü olmadan tüketici sınıfı GPU'larda eğitime olanak tanır.
  5. Bakımlı Ekosistem: Sık güncellemeler, kapsamlı belgeler ve canlı bir topluluk ile Ultralytics , projelerinizin en son PyTorch sürümleriyle ve aşağıdaki gibi dışa aktarma biçimleriyle uyumlu kalmasını sağlar ONNX, TensorRT ve CoreML.

Uygulama Örneği

Ultralytics ile son teknoloji ürünü bir model dağıtmak basittir. İşte nesne algılamayı ne kadar kolay uygulayabileceğiniz:

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for result in results:
    result.save(filename="output.jpg")  # save to disk

Sonuç

Hem YOLOv7 hem de YOLOv6.0 belirli nişlere hizmet eder: Yüksek doğruluklu araştırma görevleri için YOLOv7 ve endüstriyel hız optimizasyonu için YOLOv6.0. Ancak, geliştiricilerin ve araştırmacıların çoğu için Ultralytics YOLO11 ekosistemi en dengeli, çok yönlü ve sürdürülebilir çözümü sağlar. Ultralytics , yüksek performansı olağanüstü bir kullanıcı deneyimi ve geniş görev desteği ile birleştirerek, kullanıcıların model mimarileriyle boğuşmak yerine gerçek dünya sorunlarını çözmeye odaklanmalarını sağlar.

Diğer Modelleri İnceleyin

Bilgisayarla görme alanında daha fazla seçenek keşfetmekle ilgileniyorsanız, bu karşılaştırmaları göz önünde bulundurun:

  • YOLOv7 vs. RT-DETR: CNN tabanlı dedektörlerin Transformatör tabanlı mimarilerle karşılaştırılması.
  • YOLOv6 vs. YOLOv8: Önceki nesil Ultralytics modellerinin endüstriyel standartlara kıyasla nasıl olduğuna bir bakış.
  • YOLOv7 vs. YOLOX: Çapasız ve çapa tabanlı tespit stratejilerinin analizi.

Yorumlar