İçeriğe geç

YOLOv6.0 vs YOLOv7: Endüstriyel Hız ve Doğruluğa Derinlemesine Bir Bakış

En uygun nesne algılama modelinin seçilmesi, çıkarım hızı, doğruluk ve hesaplama verimliliğinin dengelenmesine bağlı olan kritik bir karardır. Bu teknik karşılaştırma, endüstriyel odaklı bir çerçeve olan YOLOv6.0 ile YOLOv7eğitilebilir "bedava çantalar" kullanarak doğruluk sınırlarını zorlamak için tasarlanmış bir model. Geliştiriciler mimarilerini, kıyaslama ölçütlerini ve ideal kullanım durumlarını analiz ederek hangi çözümün kendi özel dağıtım kısıtlamalarına en uygun olduğunu belirleyebilirler.

YOLOv6.0: Endüstriyel Verimlilik için Tasarlandı

YOLOv6.0, gerçek zamanlı hız ve donanım verimliliğinin tartışılmaz olduğu endüstriyel uygulamalar için özel olarak tasarlanmış YOLO serisinde önemli bir evrimi temsil etmektedir. Meituan tarafından geliştirilen bu sürüm, gecikme ve doğruluk arasındaki dengeyi optimize etmeye odaklanarak onu uç bilişim ve yüksek verimli ortamlar için zorlu bir seçim haline getiriyor.

Yazarlar Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Organizasyon:Meituan
Tarih: 2023-01-13
ArxivYOLOv6
GitHubYOLOv6
DocsYOLOv6ultralytics

Mimari ve Temel Özellikler

YOLOv6.0'ın mimarisi, donanıma duyarlı tasarım kavramı etrafında inşa edilmiştir. Modelin daha iyi özellik öğrenimi için eğitim sırasında karmaşık yapıları kullanmasına ve çıkarım sırasında daha basit, daha hızlı yapılara daralmasına olanak tanıyan yeniden parametrelendirilebilir bir backbone (EfficientRep) kullanır. Bu teknik, bellek erişim maliyetlerini önemli ölçüde azaltır ve çıkarım gecikmesini iyileştirir.

Başlıca mimari yenilikler şunlardır:

  • Çift Yönlü Birleştirme (BiC): Bu modül, özellik yayılımını geliştirerek yerelleştirme doğruluğunu artırır.
  • Çapa Destekli Eğitim (AAT): Eğitimi stabilize etmek ve performansı artırmak için çapa tabanlı ve çapasız dedektörlerin faydalarını birleştiren bir strateji.
  • Kendi Kendine Damıtma: YOLOv6.0, öğrenci modelinin kendi öğretmen modeli tahminlerinden öğrendiği ve harici büyük modellere ihtiyaç duymadan doğruluğu iyileştirdiği kendi kendine damıtma tekniklerini kullanır.

Güçlü ve Zayıf Yönler

YOLOv6.0'ın birincil gücü çıkarım hızında yatmaktadır. Kıyaslamaların gösterdiği gibi, daha küçük varyantlar ( YOLOv6.0n gibi) GPU donanımında son derece hızlıdır ve bu da onları yüksek kare hızlarını işlemesi gereken video analizi işlem hatları için ideal hale getirir. Ek olarak, modelin model niceleme desteği, kaynak kısıtlı donanımlarda dağıtımı kolaylaştırır.

Bununla birlikte, YOLOv6 'nın önceki sürümleri öncelikle nesne algılama ile sınırlıydı ve kutudan çıkar çıkmaz segmentasyonu veya poz tahminini destekleyen daha kapsamlı çerçevelerde bulunan yerel çok yönlülükten yoksundu. Ayrıca, son derece verimli olmasına rağmen, ekosistem desteği diğer topluluk odaklı projeler kadar kapsamlı değildir.

İdeal Kullanım Senaryoları

YOLOv6.0 aşağıdaki gibi senaryolarda üstünlük sağlar:

  • Üretim hatları: Konveyör bantlarında yüksek hızlı hata tespitinin gerekli olduğu yerler.
  • Perakende analitiği: Hesaplama kaynaklarının sınırlı olduğu kuyruk yönetimi ve envanter takibi için.
  • Gömülü sistemler: NVIDIA Jetson serisi gibi cihazlara yerleştirme.

YOLOv6 hakkında daha fazla bilgi edinin

YOLOv7: Eğitilebilir Ücretsiz Çantaları Optimize Etme

YOLOv7 çıkarım maliyetini artırmadan doğruluğu en üst düzeye çıkarmak için mimari reformlara odaklanarak farklı bir yaklaşım benimsiyor. Yazarlar, eğitim sırasında modelin performansını artıran ancak çıkarım mimarisini veya hızını değiştirmeyen "eğitilebilir bedava torba"-optimizasyon yöntemlerini tanıttı.

Yazarlar Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Organizasyon:Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
Tarih: 2022-07-06
Arxiv:https://arxiv.org/abs/2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
Docs:ultralytics

Mimari ve Temel Özellikler

YOLOv7 , E-ELAN'ı (Genişletilmiş Verimli Katman Toplama Ağı) tanıtmaktadır. Bu mimari, en kısa ve en uzun gradyan yollarını kontrol ederek modelin daha çeşitli özellikleri öğrenmesine olanak tanır ve ağın etkili bir şekilde yakınsamasını sağlar.

Öne çıkan özellikler şunlardır:

  • Model Ölçeklendirme: Yalnızca derinliği veya genişliği ölçeklendiren önceki yöntemlerin aksine YOLOv7 , katmanları yeniden boyutlandırmak yerine birleştiren ve modelin optimizasyon özelliklerini koruyan bir bileşik ölçeklendirme yöntemi önermektedir.
  • Yardımcı Başlık Eğitimi: Model, eğitim sırasında lider kafaya yardımcı olmak için bir yardımcı kafa kullanır. Bu derin denetim tekniği ara katmanların öğrenilmesini iyileştirir ancak hızı korumak için çıkarım sırasında kaldırılır.
  • Planlı Yeniden Parametrelendirilmiş Konvolüsyon: Performans düşüşünü önlemek için belirli katmanlardaki kimlik bağlantılarını önleyen özel bir yeniden parametrelendirme uygulaması.

Güçlü ve Zayıf Yönler

YOLOv7 , COCO veri setinde etkileyici ortalama hassasiyet (mAP) puanları elde ederek yüksek doğruluğu ile tanınır. Gerçek zamanlı kısıtlamalar ile yüksek doğruluklu tespitlere duyulan ihtiyaç arasındaki boşluğu etkili bir şekilde doldurur.

Olumsuz tarafı ise, mimari karmaşıklık ve yardımcı başlıkların kullanımı, eğitim sürecini daha basit mimarilere kıyasla daha bellek yoğun hale getirebilir. Çıkarım sırasında verimli olsa da, eğitim aşaması, özellikle daha büyük "E6E" varyantları için önemli miktarda GPU belleği gerektirir.

İdeal Kullanım Senaryoları

YOLOv7 özellikle aşağıdakiler için uygundur:

  • Detaylı Gözetim: Karmaşık güvenlik görüntülerinde küçük nesneleri veya ince eylemleri tanımlama.
  • Otonom Sürüş: Hassasiyetin güvenlik ve navigasyon için kritik olduğu yerlerde.
  • Bilimsel Araştırma: Tıbbi görüntüleme veya biyolojik araştırmalar gibi yüksek AP ölçümleri gerektiren uygulamalar.

YOLOv7 hakkında daha fazla bilgi edinin

Performans Karşılaştırması: Metrikler ve Analiz

Aşağıdaki tablo, YOLOv6.0 ve YOLOv7 varyantlarının COCO doğrulama veri kümesi üzerindeki performansını karşılaştırmaktadır. Model boyutu, hesaplama yükü (FLOP'lar) ve hız arasındaki değiş tokuşları vurgular.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0m64050.0-5.2834.985.8
YOLOv6.0l64052.8-8.9559.6150.7
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Karşılaştırma Ölçütlerinin Yorumlanması

YOLOv7x en yüksek doğruluğa(%53,1 mAP) ulaşırken, önemli ölçüde daha fazla parametre (71,3M) ve FLOP (189,9B) gerektirir. Buna karşılık, YOLOv6.0n aşırı hız için optimize edilmiştir ve T4 GPU'da 1,17 ms çıkarım elde ederek, daha düşük doğrulukla da olsa en büyük YOLOv7 varyantından yaklaşık 10 kat daha hızlıdır.

Veriler net bir ayrımı ortaya koymaktadır: YOLOv6.0 düşük gecikmeli ortamlarda baskınken, YOLOv7 maksimum algılama kalitesinin öncelikli olduğu ve donanım kaynaklarının daha bol olduğu durumlarda üstündür.

Ultralytics Avantajı: Ham Metriklerin Ötesinde

YOLOv6 ve YOLOv7 güçlü yetenekler sunarken, bilgisayarla görme alanı hızla gelişmektedir. Geleceğe dönük, çok yönlü ve kullanıcı dostu bir çözüm arayan geliştiriciler ve araştırmacılar için, Ultralytics YOLO11 ve YOLOv8 ham kıyaslamaların ötesine geçen cazip avantajlar sunar.

Kullanım Kolaylığı ve Ekosistem

Gelişmiş yapay zeka modellerinin benimsenmesinin önündeki en önemli engellerden biri uygulama karmaşıklığıdır. Ultralytics modelleri, kolaylaştırılmış kullanıcı deneyimi ile ünlüdür. Basit bir Python API ve CLI ile kullanıcılar modelleri sadece birkaç satır kodla eğitebilir, doğrulayabilir ve dağıtabilir. Bu, genellikle karmaşık ortam kurulumları ve yapılandırma ayarlamaları gerektiren araştırma odaklı depolarla tezat oluşturmaktadır.

from ultralytics import YOLO

# Load a model (YOLO11n recommended for speed/accuracy balance)
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

Görevler Arasında Çok Yönlülük

Öncelikli olarak algılama için olan önceki YOLO sürümlerinin aksine, Ultralytics modelleri doğal olarak çok modludur. Tek bir çerçeve destekler:

Performans Dengesi ve Verimlilik

Ultralytics modelleri, örneğin YOLO11hız ve doğruluk arasında en uygun dengeyi sağlamak üzere tasarlanmıştır. YOLOv6 gibi verimli mimarilerle ilişkili çıkarım hızlarını korurken genellikle YOLOv7 'den daha yüksek mAP elde ederler. Ayrıca, Ultralytics modelleri eğitim verimliliği için tasarlanmıştır, transformatör tabanlı modellere ( RT-DETR gibi) kıyasla daha düşük GPU bellek kullanımı gerektirir, bu da deneme döngülerini hızlandırır ve bulut hesaplama maliyetlerini azaltır.

Bakımlı Ekosistem

Bir Ultralytics modeli seçmek, desteklenen bir ekosistemi satın almak anlamına gelir. Buna aşağıdakiler dahildir:

  • Sık Güncellemeler: Mimari ve ağırlıklarda düzenli iyileştirmeler.
  • Geniş İhracat Desteği: Sorunsuz dışa aktarma ONNX, TensorRT, CoreML ve herhangi bir cihazda dağıtım için TFLite .
  • Topluluk: Büyük bir geliştirici topluluğu ve yardımın her zaman mevcut olmasını sağlayan kapsamlı belgeler.

Sonuç

Hem YOLOv6.0 hem de YOLOv7 bilgisayarla görme alanına önemli katkılarda bulunmuştur. YOLOv6.0, ultra hızlı çıkarım ve niceleme desteği gerektiren endüstriyel uygulamalar için tercih edilen bir seçenektir. YOLOv7 algılama doğruluğunun çok önemli olduğu ve donanım kısıtlamalarının esnek olduğu senaryolar için güçlü bir rakip olmaya devam etmektedir.

Bununla birlikte, son teknoloji ürünü performansı eşsiz kullanım kolaylığı, çok yönlülük ve dağıtım esnekliği ile birleştiren bütünsel bir çözüm için, Ultralytics YOLO11 modern yapay zeka geliştirme için üstün bir seçim olarak öne çıkıyor. İster uca dağıtıyor ister bulutta ölçeklendiriyor olun, Ultralytics ekosistemi başarılı olmak için gerekli araçları sağlar.

Daha fazla okuma için YOLOX ile ilgili karşılaştırmalarımızı inceleyebilir veya RT-DETR transformatör tabanlı algılama için.


Yorumlar