YOLOv7 vs. YOLOv7: Detaylı Teknik Karşılaştırma
Nesne algılama için en uygun mimarinin seçilmesi, bilgisayarlı görü geliştirmede çok önemli bir karardır. Bu seçim, dağıtım donanımı kısıtlamalarını göz önünde bulundururken, genellikle çıkarım gecikmesini algılama doğruluğuna karşı dengelemeyi gerektirir. Bu teknik karşılaştırma, 2022 yılında piyasaya sürülen ve gerçek zamanlı algılamanın sınırlarını zorlayan iki etkili model olan YOLO ve YOLOv7'yi incelemektedir. Model seçim sürecinizde size yardımcı olmak için mimari yeniliklerini, kıyaslama performanslarını ve ideal uygulama senaryolarını analiz ediyoruz.
YOLO: Kenar Verimliliği için Sinir Mimarisi Araması
YOLO , Alibaba Group tarafından endüstriyel uygulamalar için performansı en üst düzeye çıkarmaya odaklanarak geliştirilmiştir. backbone tasarımını otomatikleştirmek için Nöral Mimari Arama (NAS) özelliğini kullanarak optimum verimlilik sağlar.
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Organizasyon:Alibaba Group
- Tarih: 2022-11-23
- Arxiv:https://arxiv.org/abs/2211.15444v2
- GitHub:https://github.com/tinyvision/DAMO-YOLO
- Dokümanlar:https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md
Mimari Yenilikler
YOLO , yüksek hassasiyeti korurken hesaplama yükünü azaltmayı amaçlayan çeşitli ileri teknolojiler sunar:
- MAE-NAS Backbone (GiraffeNet): Geleneksel elle tasarlanmış omurgaların aksine YOLO , Yöntem Farkında Verimlilik (MAE) NAS yaklaşımını kullanmaktadır. Bu, çeşitli donanım kısıtlamaları altında kayan nokta işlemleri (FLOP'lar) ve gecikme arasında üstün bir denge sağlayan GiraffeNet adlı bir backbone serisi ile sonuçlanır.
- Verimli RepGFPN: Model, yeniden parametrelendirme ile optimize edilmiş bir Genelleştirilmiş Özellik Piramidi Ağına (GFPN) sahiptir. Bu "RepGFPN", standart FPN'lerle ilişkili ağır hesaplama maliyeti olmadan farklı boyutlardaki nesneleri tespit etmek için gerekli olan verimli çok ölçekli özellik füzyonuna olanak tanır.
- ZeroHead: Yeni bir "ZeroHead" tasarımı, algılama kafasını önemli ölçüde basitleştirir. Sınıflandırma ve regresyon görevlerini birbirinden ayırarak ve karmaşık özel katmanı kaldırarak, çıkarım sırasında kafanın parametre sayısını sıfıra indirir, bellek tasarrufu sağlar ve hızı artırır.
- AlignedOTA: Eğitim kararlılığını ve doğruluğunu artırmak için YOLO , sınıflandırma güveni ve regresyon doğruluğu arasındaki yanlış hizalama sorununu çözen dinamik bir etiket atama stratejisi olan AlignedOTA'yı kullanır.
Güçlü Yönler ve Kullanım Örnekleri
YOLO , gecikmenin kritik olduğu ortamlarda üstünlük sağlar. Daha küçük varyantları (Tiny/Small) özellikle uç yapay zeka dağıtımları için etkilidir.
- Endüstriyel Otomasyon: Milisaniyelerin önemli olduğu yüksek hızlı montaj hatları için idealdir.
- Mobil Uygulamalar: Düşük parametre sayısı, sınırlı işlem gücüne sahip akıllı telefonlarda çalışmaya uygun hale getirir.
DAMO-YOLO hakkında daha fazla bilgi edinin
YOLOv7: Gerçek Zamanlı Doğruluğu Optimize Etme
YOLO'dan kısa bir süre önce piyasaya sürülen YOLOv7, 5 FPS ila 160 FPS aralığında son teknoloji performans için yeni bir ölçüt belirledi. Çıkarım maliyetlerini artırmadan daha yüksek doğruluk elde etmek için büyük ölçüde eğitim sürecini ve gradyan akışını optimize etmeye odaklandı.
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Organizasyon:Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
- Tarih: 2022-07-06
- Arxiv:https://arxiv.org/abs/2207.02696
- GitHub:https://github.com/WongKinYiu/yolov7
- Dokümanlar:https://docs.ultralytics.com/models/yolov7/
Mimari Yenilikler
YOLOv7 , çıkarım modeli yapısını etkilemeden eğitim sırasında doğruluğu artıran "bag-of-freebies" yöntemlerini tanıttı:
- E-ELAN (Genişletilmiş Verimli Katman Toplama Ağı): Bu mimari en kısa ve en uzun gradyan yollarını kontrol ederek ağın daha çeşitli özellikleri öğrenmesini sağlar. Orijinal gradyan yolu durumunu yok etmeden "kardinalitenin" öğrenme kapasitesini geliştirir.
- Birleştirme Tabanlı Modeller için Model Ölçeklendirme: YOLOv7 , birleştirme tabanlı mimariler için derinlik ve genişliği aynı anda ölçeklendiren ve parametrelerin optimum kullanımını sağlayan bir bileşik ölçeklendirme yöntemi önermektedir.
- Eğitilebilir Ücretsiz Çantalar: Planlı yeniden parametrelendirme ve yardımcı kafa denetimi (kabadan inceye) gibi teknikler kullanılır. Bunlar eğitim sırasında modelin sağlamlığını ve doğruluğunu artırır, ancak çıkarım sırasında birleştirilir veya atılır ve modeli hızlı tutar.
Güçlü Yönler ve Kullanım Örnekleri
YOLOv7 , MS COCO gibi standart veri kümelerinde mükemmel Ortalama Hassasiyet (mAP) sunan genel amaçlı nesne algılama için bir güç merkezidir.
- Akıllı Şehir Gözetimi: Yüksek doğruluğu, karmaşık kentsel ortamlarda yayaları ve araçları tespit etmek için güvenilir olmasını sağlar.
- Otonom Sistemler: Daha yüksek çözünürlüklü girdilerin faydalı olduğu daha uzun mesafelerde güvenilir algılama gerektiren robotik ve dronlar için uygundur.
YOLOv7 hakkında daha fazla bilgi edinin
Performans Karşılaştırması
Aşağıdaki tabloda YOLO ve YOLOv7'nin performansları karşılaştırılmaktadır. YOLO genellikle boyutuna göre daha düşük gecikme süresi (daha yüksek hız) elde ederken, YOLOv7 özellikle daha büyük konfigürasyonlarında doğruluk konusunda güçlü bir üne sahiptir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Veriler, son derece kısıtlı ortamlar için YOLO 'nun çok hafif bir çözüm sunduğunu göstermektedir (küçük sürüm için 8,5 milyon parametre). Ancak, YOLOv7 daha yüksek hesaplama maliyetlerine rağmen %53,1 mAP elde eden X varyantı ile doğruluk konusunda sınırları zorlamaktadır.
Mimari Ödünleşimler
YOLO'nun NAS tabanlı backbone özellikle gecikme için optimizasyon yaparken, YOLOv7'nin manuel mimari tasarımı gradyan akış verimliliğine odaklanmaktadır. Teorik FLOP'lar her zaman gerçek dünyadaki çıkarım hızıyla mükemmel bir korelasyon göstermediğinden, kullanıcılar her ikisini de kendi donanımlarında kıyaslamalıdır.
Ultralytics Avantajı: Neden Yükseltme?
Hem YOLOv7 hem de YOLOv7 bilgisayarla görme tarihinde önemli başarıları temsil ederken, bu alan hızla gelişmektedir. En sağlam, çok yönlü ve kullanımı kolay çözümleri arayan geliştiriciler için, Ultralytics YOLO11 ve YOLOv8 önerilen seçeneklerdir.
Ultralytics modelleri sadece araştırma eserleri olarak değil, kapsamlı üretim araçları olarak tasarlanmıştır. Yapay zeka dağıtımındaki "son kilometre" sorunlarını ele alırlar - kullanılabilirlik, entegrasyon ve bakım.
Ultralytics Modellerin Temel Avantajları
- Kullanım Kolaylığı: Birleştirilmiş Python API ve CLI ile son teknoloji ürünü bir modeli birkaç satır kodla eğitebilirsiniz. Karmaşık yapılandırma dosyalarını manuel olarak ayarlamaya veya bağımlılıklarla mücadele etmeye gerek yoktur.
- Bakımlı Ekosistem: Ultralytics , sık güncellemelerle gelişen bir ekosistem sağlar, hataları hızla belirler ve düzeltir. Destek, kapsamlı belgeler ve aktif topluluk kanalları aracılığıyla kolayca kullanılabilir.
- Performans Dengesi: Gibi modeller YOLO11 hem YOLOv7 hem de YOLO'ya kıyasla üstün doğruluk-hız oranları elde etmek için gelişmiş çapasız tespit başlıkları ve optimize edilmiş omurgalar kullanır.
- Çok yönlülük: Genellikle algılama ile sınırlı olan eski modellerin aksine, Ultralytics YOLO örnek segmentasyonunu, poz tahminini, yönlendirilmiş nesne algılamayı (OBB) ve kutudan çıkar çıkmaz sınıflandırmayı destekler.
- Eğitim Verimliliği: Önceden eğitilmiş ağırlıklar ve optimize edilmiş veri yükleyiciler daha hızlı yakınsama sağlayarak GPU saatlerinden ve enerjisinden tasarruf sağlar.
from ultralytics import YOLO
# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")
# Train on COCO8 dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
YOLO11 hakkında daha fazla bilgi edinin
Sonuç
YOLOv7 ve YOLOv7 'nin her biri farklı avantajlara sahiptir. YOLO, milisaniyeleri kısaltmak için NAS'tan yararlanarak kenar çıkarım hızının birincil kısıtlama olduğu projeler için güçlü bir adaydır. YOLOv7 kanıtlanmış bir mimari soyağacı ile yüksek doğrulukta tespit arayan araştırmacılar için sağlam bir seçim olmaya devam etmektedir.
Bununla birlikte, günümüzde çoğu ticari ve araştırma uygulaması için Ultralytics YOLO ekosistemi üstün bir deneyim sunar. Ultralytics modelleri, son teknoloji performansı benzersiz kullanım kolaylığı ve çok yönlülükle birleştirerek geliştiricilerin kodda hata ayıklamak yerine değer oluşturmaya odaklanmasını sağlar. İster bir bulut sunucusuna ister NVIDIA Jetson gibi bir uç cihaza dağıtım yapıyor olun, Ultralytics üretime giden en kolay yolu sağlar.
Diğer Modeller
Nesne algılama mimarilerini araştırıyorsanız, bu modeller de ilginizi çekebilir:
- Ultralytics YOLOv8: Algılama, segmentasyon ve pozlama görevlerini destekleyen çok yönlü bir model.
- Ultralytics YOLO11: YOLO serisindeki en son evrim, son teknoloji verimlilik sunuyor.
- RT-DETR: NMS gecikmelerini önleyen gerçek zamanlı transformatör tabanlı bir dedektör.
- YOLOv9: Gelişmiş öğrenme için Programlanabilir Gradyan Bilgisi (PGI) içerir.
- YOLOv10: Düşük gecikme süresi için NMS'siz uçtan uca eğitime odaklanır.