YOLOv6.0 vs YOLOv7: Endüstriyel Hız ve Doğruluğa Derinlemesine Bir Bakış
En uygun nesne algılama modelinin seçilmesi, çıkarım hızı, doğruluk ve hesaplama verimliliğinin dengelenmesine bağlı olan kritik bir karardır. Bu teknik karşılaştırma, endüstriyel odaklı bir çerçeve olan YOLOv6.0 ile YOLOv7eğitilebilir "bedava çantalar" kullanarak doğruluk sınırlarını zorlamak için tasarlanmış bir model. Geliştiriciler mimarilerini, kıyaslama ölçütlerini ve ideal kullanım durumlarını analiz ederek hangi çözümün kendi özel dağıtım kısıtlamalarına en uygun olduğunu belirleyebilirler.
YOLOv6.0: Endüstriyel Verimlilik için Tasarlandı
YOLOv6.0, gerçek zamanlı hız ve donanım verimliliğinin tartışılmaz olduğu endüstriyel uygulamalar için özel olarak tasarlanmış YOLO serisinde önemli bir evrimi temsil etmektedir. Meituan tarafından geliştirilen bu sürüm, gecikme ve doğruluk arasındaki dengeyi optimize etmeye odaklanarak onu uç bilişim ve yüksek verimli ortamlar için zorlu bir seçim haline getiriyor.
Yazarlar Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Organizasyon:Meituan
Tarih: 2023-01-13
ArxivYOLOv6
GitHubYOLOv6
DocsYOLOv6ultralytics
Mimari ve Temel Özellikler
YOLOv6.0'ın mimarisi, donanıma duyarlı tasarım kavramı etrafında inşa edilmiştir. Modelin daha iyi özellik öğrenimi için eğitim sırasında karmaşık yapıları kullanmasına ve çıkarım sırasında daha basit, daha hızlı yapılara daralmasına olanak tanıyan yeniden parametrelendirilebilir bir backbone (EfficientRep) kullanır. Bu teknik, bellek erişim maliyetlerini önemli ölçüde azaltır ve çıkarım gecikmesini iyileştirir.
Başlıca mimari yenilikler şunlardır:
- Çift Yönlü Birleştirme (BiC): Bu modül, özellik yayılımını geliştirerek yerelleştirme doğruluğunu artırır.
- Çapa Destekli Eğitim (AAT): Eğitimi stabilize etmek ve performansı artırmak için çapa tabanlı ve çapasız dedektörlerin faydalarını birleştiren bir strateji.
- Kendi Kendine Damıtma: YOLOv6.0, öğrenci modelinin kendi öğretmen modeli tahminlerinden öğrendiği ve harici büyük modellere ihtiyaç duymadan doğruluğu iyileştirdiği kendi kendine damıtma tekniklerini kullanır.
Güçlü ve Zayıf Yönler
YOLOv6.0'ın birincil gücü çıkarım hızında yatmaktadır. Kıyaslamaların gösterdiği gibi, daha küçük varyantlar ( YOLOv6.0n gibi) GPU donanımında son derece hızlıdır ve bu da onları yüksek kare hızlarını işlemesi gereken video analizi işlem hatları için ideal hale getirir. Ek olarak, modelin model niceleme desteği, kaynak kısıtlı donanımlarda dağıtımı kolaylaştırır.
Bununla birlikte, YOLOv6 'nın önceki sürümleri öncelikle nesne algılama ile sınırlıydı ve kutudan çıkar çıkmaz segmentasyonu veya poz tahminini destekleyen daha kapsamlı çerçevelerde bulunan yerel çok yönlülükten yoksundu. Ayrıca, son derece verimli olmasına rağmen, ekosistem desteği diğer topluluk odaklı projeler kadar kapsamlı değildir.
İdeal Kullanım Senaryoları
YOLOv6.0 aşağıdaki gibi senaryolarda üstünlük sağlar:
- Üretim hatları: Konveyör bantlarında yüksek hızlı hata tespitinin gerekli olduğu yerler.
- Perakende analitiği: Hesaplama kaynaklarının sınırlı olduğu kuyruk yönetimi ve envanter takibi için.
- Gömülü sistemler: NVIDIA Jetson serisi gibi cihazlara yerleştirme.
YOLOv6 hakkında daha fazla bilgi edinin
YOLOv7: Eğitilebilir Ücretsiz Çantaları Optimize Etme
YOLOv7 çıkarım maliyetini artırmadan doğruluğu en üst düzeye çıkarmak için mimari reformlara odaklanarak farklı bir yaklaşım benimsiyor. Yazarlar, eğitim sırasında modelin performansını artıran ancak çıkarım mimarisini veya hızını değiştirmeyen "eğitilebilir bedava torba"-optimizasyon yöntemlerini tanıttı.
Yazarlar Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Organizasyon:Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
Tarih: 2022-07-06
Arxiv:https://arxiv.org/abs/2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
Docs:ultralytics
Mimari ve Temel Özellikler
YOLOv7 , E-ELAN'ı (Genişletilmiş Verimli Katman Toplama Ağı) tanıtmaktadır. Bu mimari, en kısa ve en uzun gradyan yollarını kontrol ederek modelin daha çeşitli özellikleri öğrenmesine olanak tanır ve ağın etkili bir şekilde yakınsamasını sağlar.
Öne çıkan özellikler şunlardır:
- Model Ölçeklendirme: Yalnızca derinliği veya genişliği ölçeklendiren önceki yöntemlerin aksine YOLOv7 , katmanları yeniden boyutlandırmak yerine birleştiren ve modelin optimizasyon özelliklerini koruyan bir bileşik ölçeklendirme yöntemi önermektedir.
- Yardımcı Başlık Eğitimi: Model, eğitim sırasında lider kafaya yardımcı olmak için bir yardımcı kafa kullanır. Bu derin denetim tekniği ara katmanların öğrenilmesini iyileştirir ancak hızı korumak için çıkarım sırasında kaldırılır.
- Planlı Yeniden Parametrelendirilmiş Konvolüsyon: Performans düşüşünü önlemek için belirli katmanlardaki kimlik bağlantılarını önleyen özel bir yeniden parametrelendirme uygulaması.
Güçlü ve Zayıf Yönler
YOLOv7 , COCO veri setinde etkileyici ortalama hassasiyet (mAP) puanları elde ederek yüksek doğruluğu ile tanınır. Gerçek zamanlı kısıtlamalar ile yüksek doğruluklu tespitlere duyulan ihtiyaç arasındaki boşluğu etkili bir şekilde doldurur.
Olumsuz tarafı ise, mimari karmaşıklık ve yardımcı başlıkların kullanımı, eğitim sürecini daha basit mimarilere kıyasla daha bellek yoğun hale getirebilir. Çıkarım sırasında verimli olsa da, eğitim aşaması, özellikle daha büyük "E6E" varyantları için önemli miktarda GPU belleği gerektirir.
İdeal Kullanım Senaryoları
YOLOv7 özellikle aşağıdakiler için uygundur:
- Detaylı Gözetim: Karmaşık güvenlik görüntülerinde küçük nesneleri veya ince eylemleri tanımlama.
- Otonom Sürüş: Hassasiyetin güvenlik ve navigasyon için kritik olduğu yerlerde.
- Bilimsel Araştırma: Tıbbi görüntüleme veya biyolojik araştırmalar gibi yüksek AP ölçümleri gerektiren uygulamalar.
YOLOv7 hakkında daha fazla bilgi edinin
Performans Karşılaştırması: Metrikler ve Analiz
Aşağıdaki tablo, YOLOv6.0 ve YOLOv7 varyantlarının COCO doğrulama veri kümesi üzerindeki performansını karşılaştırmaktadır. Model boyutu, hesaplama yükü (FLOP'lar) ve hız arasındaki değiş tokuşları vurgular.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv6.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Karşılaştırma Ölçütlerinin Yorumlanması
YOLOv7x en yüksek doğruluğa(%53,1 mAP) ulaşırken, önemli ölçüde daha fazla parametre (71,3M) ve FLOP (189,9B) gerektirir. Buna karşılık, YOLOv6.0n aşırı hız için optimize edilmiştir ve T4 GPU'da 1,17 ms çıkarım elde ederek, daha düşük doğrulukla da olsa en büyük YOLOv7 varyantından yaklaşık 10 kat daha hızlıdır.
Veriler net bir ayrımı ortaya koymaktadır: YOLOv6.0 düşük gecikmeli ortamlarda baskınken, YOLOv7 maksimum algılama kalitesinin öncelikli olduğu ve donanım kaynaklarının daha bol olduğu durumlarda üstündür.
Ultralytics Avantajı: Ham Metriklerin Ötesinde
YOLOv6 ve YOLOv7 güçlü yetenekler sunarken, bilgisayarla görme alanı hızla gelişmektedir. Geleceğe dönük, çok yönlü ve kullanıcı dostu bir çözüm arayan geliştiriciler ve araştırmacılar için, Ultralytics YOLO11 ve YOLOv8 ham kıyaslamaların ötesine geçen cazip avantajlar sunar.
Kullanım Kolaylığı ve Ekosistem
Gelişmiş yapay zeka modellerinin benimsenmesinin önündeki en önemli engellerden biri uygulama karmaşıklığıdır. Ultralytics modelleri, kolaylaştırılmış kullanıcı deneyimi ile ünlüdür. Basit bir Python API ve CLI ile kullanıcılar modelleri sadece birkaç satır kodla eğitebilir, doğrulayabilir ve dağıtabilir. Bu, genellikle karmaşık ortam kurulumları ve yapılandırma ayarlamaları gerektiren araştırma odaklı depolarla tezat oluşturmaktadır.
from ultralytics import YOLO
# Load a model (YOLO11n recommended for speed/accuracy balance)
model = YOLO("yolo11n.pt")
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
Görevler Arasında Çok Yönlülük
Öncelikli olarak algılama için olan önceki YOLO sürümlerinin aksine, Ultralytics modelleri doğal olarak çok modludur. Tek bir çerçeve destekler:
- Nesne Algılama: Nesneleri ve konumlarını tanımlama.
- Örnek Segmentasyonu: Piksel düzeyinde nesne maskeleme.
- Poz Tahmini: İskelet kilit noktalarının belirlenmesi.
- Sınıflandırma: Tüm görüntüleri kategorize etme.
- Yönlendirilmiş Sınırlayıcı Kutu (OBB): Nesnelerin belli bir açıyla algılanması (örn. hava görüntüleri).
Performans Dengesi ve Verimlilik
Ultralytics modelleri, örneğin YOLO11hız ve doğruluk arasında en uygun dengeyi sağlamak üzere tasarlanmıştır. YOLOv6 gibi verimli mimarilerle ilişkili çıkarım hızlarını korurken genellikle YOLOv7 'den daha yüksek mAP elde ederler. Ayrıca, Ultralytics modelleri eğitim verimliliği için tasarlanmıştır, transformatör tabanlı modellere ( RT-DETR gibi) kıyasla daha düşük GPU bellek kullanımı gerektirir, bu da deneme döngülerini hızlandırır ve bulut hesaplama maliyetlerini azaltır.
Bakımlı Ekosistem
Bir Ultralytics modeli seçmek, desteklenen bir ekosistemi satın almak anlamına gelir. Buna aşağıdakiler dahildir:
- Sık Güncellemeler: Mimari ve ağırlıklarda düzenli iyileştirmeler.
- Geniş İhracat Desteği: Sorunsuz dışa aktarma ONNX, TensorRT, CoreML ve herhangi bir cihazda dağıtım için TFLite .
- Topluluk: Büyük bir geliştirici topluluğu ve yardımın her zaman mevcut olmasını sağlayan kapsamlı belgeler.
Sonuç
Hem YOLOv6.0 hem de YOLOv7 bilgisayarla görme alanına önemli katkılarda bulunmuştur. YOLOv6.0, ultra hızlı çıkarım ve niceleme desteği gerektiren endüstriyel uygulamalar için tercih edilen bir seçenektir. YOLOv7 algılama doğruluğunun çok önemli olduğu ve donanım kısıtlamalarının esnek olduğu senaryolar için güçlü bir rakip olmaya devam etmektedir.
Bununla birlikte, son teknoloji ürünü performansı eşsiz kullanım kolaylığı, çok yönlülük ve dağıtım esnekliği ile birleştiren bütünsel bir çözüm için, Ultralytics YOLO11 modern yapay zeka geliştirme için üstün bir seçim olarak öne çıkıyor. İster uca dağıtıyor ister bulutta ölçeklendiriyor olun, Ultralytics ekosistemi başarılı olmak için gerekli araçları sağlar.
Daha fazla okuma için YOLOX ile ilgili karşılaştırmalarımızı inceleyebilir veya RT-DETR transformatör tabanlı algılama için.