YOLOv7 vs YOLO11: Gerçek Zamanlı Mirastan Son Teknoloji Verimliliğe
Bilgisayarlı görü modellerinin manzarasında gezinmek, yerleşik mimariler ile en son teknoloji ürünü (SOTA) yenilikler arasındaki nüansı anlamayı gerektirir. Bu kılavuz, YOLO serisinde önemli bir kilometre taşı olan YOLOv7 ile aşağıdaki YOLOv7 arasında kapsamlı bir teknik karşılaştırma sunmaktadır Ultralytics YOLO11üstün performans ve çok yönlülük için tasarlanmış en son model.
Geliştiricilerin ve araştırmacıların nesne algılamadan karmaşık örnek segmentasyonuna kadar çeşitli görevler için en uygun aracı seçmelerine yardımcı olmak için mimari farklılıklarını, kıyaslama ölçümlerini ve pratik uygulamaları inceleyeceğiz.
YOLOv7: Verimli Mimaride Bir Karşılaştırma Ölçütü
Temmuz 2022'de piyasaya sürülen YOLOv7 , eğitim verimliliği ve çıkarım hızı arasındaki dengede büyük bir sıçramayı temsil ediyordu. Doğruluktan ödün vermeden parametre sayısını azaltan mimari optimizasyonlara odaklanarak önceki dedektörlerden daha iyi performans gösterecek şekilde tasarlanmıştır.
Yazarlar Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Organizasyon:Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
Tarih: 2022-07-06
Arxiv:https://arxiv.org/abs/2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
Docs:ultralytics
Mimari Öne Çıkanlar
YOLOv7 , Genişletilmiş Verimli Katman Toplama Ağını (E-ELAN) tanıttı. Bu mimari, en kısa ve en uzun gradyan yollarını kontrol ederek modelin daha çeşitli özellikler öğrenmesini sağlar ve eğitim sırasında yakınsamayı artırır. Ayrıca, modelin yeniden parametrelendirilmesi ve dinamik etiket ataması gibi bir dizi optimizasyon stratejisi olan ve çıkarım maliyetini artırmadan doğruluğu artıran "eğitilebilir ücretsiz torba" kullanılmıştır.
Öncelikle bir nesne algılama modeli olsa da, açık kaynak topluluğu poz tahmini için YOLOv7 'yi genişletmeyi araştırmıştır. Ancak bu uygulamalar genellikle birleşik çerçevelerde bulunan sorunsuz entegrasyondan yoksundur.
Güçlü Yönler ve Sınırlamalar
YOLOv7 'ye saygı duyulmaktadır:
- Sağlam Performans: Piyasaya sürüldükten sonra COCO veri setinde iyi performans göstererek gerçek zamanlı dedektörler için yeni bir temel oluşturdu.
- Mimari Yenilik: E-ELAN'ın tanıtımı, ağ tasarımında sonraki araştırmaları etkilemiştir.
Ancak modern iş akışlarında zorluklarla karşılaşmaktadır:
- Karmaşıklık: Eğitim hattı karmaşık olabilir ve modern standartlara kıyasla önemli ölçüde manuel yapılandırma gerektirebilir.
- Sınırlı Çok Yönlülük: Sınıflandırma veya yönlendirilmiş sınırlayıcı kutular (OBB) gibi görevleri kutudan çıkar çıkmaz yerel olarak desteklemez.
- Kaynak Kullanımı: YOLOv7x gibi daha büyük varyantların eğitimi önemli ölçüde GPU bellek, sınırlı donanıma sahip araştırmacılar için bir darboğaz olabilir.
YOLOv7 hakkında daha fazla bilgi edinin
Ultralytics YOLO11: Hız, Doğruluk ve Kullanım Kolaylığını Yeniden Tanımlıyor
Ultralytics YOLO11 ünlü YOLO serisinin en son evrimidir ve çok çeşitli bilgisayarla görme görevlerinde SOTA performansı sunmak üzere tasarlanmıştır. Sürekli iyileştirme mirası üzerine inşa edilen YOLO11 , gerçek dünya dağıtımı için verimliliği en üst düzeye çıkaran rafine bir mimari sunar.
Yazarlar: Glenn Jocher ve Jing Qiu
Organizasyon:Ultralytics
Tarih: 2024-09-27
GitHubultralytics
Docsultralyticsyolo11
Gelişmiş Mimari ve Çok Yönlülük
YOLO11 modernize edilmiş bir backbone C3k2 bloklarını ve çeşitli ölçeklerdeki özellikleri daha etkili bir şekilde yakalamak için geliştirilmiş bir SPPF modülünü kullanır. Bu tasarım, yalnızca daha doğru değil, aynı zamanda öncekilere ve rakiplerine kıyasla parametreler ve FLOP 'lar açısından önemli ölçüde daha hafif bir modelle sonuçlanır.
YOLO11 'in belirleyici özelliklerinden biri de yerel çoklu görev desteğidir. Tek bir çerçeve içinde, kullanıcılar gerçekleştirebilir:
- Algılama: Nesneleri sınırlayıcı kutularla tanımlama.
- Segmentasyon: Hassas şekil analizi için piksel düzeyinde maskeleme.
- Sınıflandırma: tüm görüntülere sınıf etiketleri atama.
- Poz Tahmini: İnsan vücudundaki anahtar noktaları tespit etme.
- OBB: Hava görüntüleri için çok önemli olan döndürülmüş nesneleri algılama.
Birleşik Ekosistem
Ultralytics YOLO11 , veri kümesi yönetimi, kodsuz eğitim ve tek tıklamayla dağıtım için bir platform olan Ultralytics HUB ile sorunsuz bir şekilde entegre olur. Bu entegrasyon MLOps yaşam döngüsünü önemli ölçüde hızlandırır.
Geliştiriciler Neden YOLO11i Seçiyor?
- Kullanım Kolaylığı: Kullanıcı merkezli bir tasarıma sahip olan YOLO11 , sadece birkaç satır Python koduyla veya basit bir CLI.
- İyi Korunan Ekosistem: Aktif bir topluluk ve Ultralytics ekibi tarafından desteklenen model, sık sık güncellenerek en son sürümlerle uyumluluk sağlar. PyTorch sürümleri ve donanım hızlandırıcıları.
- Performans Dengesi: Çıkarım hızı ve Ortalama Ortalama Hassasiyet (mAP) arasında olağanüstü bir denge kurarak hem uç cihazlar hem de bulut sunucuları için idealdir.
- Bellek Verimliliği: YOLO11 modelleri, eğitim sırasında eski mimarilere veya transformatör tabanlı modellere kıyasla tipik olarak daha az CUDA belleği gerektirir ve bu da daha büyük parti boyutlarına veya mütevazı donanımlarda eğitime olanak tanır.
YOLO11 hakkında daha fazla bilgi edinin
Performans Karşılaştırması: Teknik Karşılaştırmalar
Aşağıdaki tabloda YOLOv7 ve YOLO11 arasındaki performans farkları gösterilmektedir. Veriler, modern optimizasyonların YOLO11 'in hesaplama maliyetinin bir kısmıyla üstün doğruluk elde etmesine nasıl izin verdiğini vurgulamaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Analiz:
- Verimlilik: YOLO11m, parametrelerin neredeyse yarısını (20,1 milyona karşı 36,9 milyon) ve önemli ölçüde daha az FLOP kullanırken YOLOv7l'nin doğruluğuyla (51,5'e karşı 51,4 mAP) eşleşir.
- Hız: Gerçek zamanlı uygulamalar için YOLO11n, T4 GPU'da 1,5 ms'de çalışarak çok daha hızlıdır ve yüksek FPS video işleme için mükemmeldir.
- Doğruluk: En büyük model olan YOLO11x, doğruluk açısından YOLOv7x'i geride bırakırken (54,7'ye karşı 53,1 mAP) rekabetçi parametre sayısını da koruyor.
Gerçek Dünya Kullanım Durumları
Tarım ve Çevresel İzleme
Hassas tarımda, mahsul hastalıklarının tespit edilmesi veya büyümenin izlenmesi, dronlar veya tarla sensörleri gibi sınırlı güce sahip cihazlarda çalışabilen modeller gerektirir.
- YOLO11: Hafif mimarisi (özellikle YOLO11n/s), Raspberry Pi veya NVIDIA Jetson cihazlarında dağıtıma izin vererek gerçek zamanlı ürün sağlığı izlemesine olanak tanır.
- YOLOv7: Doğru olmakla birlikte, daha yüksek hesaplama talebi, pille çalışan uç cihazlarda kullanımını kısıtlamaktadır.
Akıllı Üretim ve Kalite Kontrol
Otomatik görsel denetim sistemleri, üretim hatlarındaki küçük kusurları detect etmek için yüksek hassasiyet gerektirir.
- YOLO11: Modelin segmentasyon ve OBB gerçekleştirme kabiliyeti burada çok önemlidir. Örneğin, OBB, YOLO11 tarafından yerel olarak desteklenen ancak YOLOv7'de özel uygulamalar gerektiren bir özellik olan konveyör bant üzerindeki döndürülmüş bileşenleri tespit etmek için gereklidir.
- YOLOv7: Standart sınırlayıcı kutu tespiti için uygundur, ancak önemli bir değişiklik yapılmadan karmaşık geometrik kusurlar için daha az uyarlanabilir.
Gözetim ve Güvenlik
Güvenlik sistemleri genellikle birden fazla video akışını aynı anda işler.
- YOLO11: Yüksek çıkarım hızı, tek bir sunucunun daha fazla akışı paralel olarak işlemesine olanak tanıyarak altyapı maliyetlerini düşürür.
- YOLOv7: Etkili, ancak kare başına daha yüksek gecikme süresi, tek bir birimin işleyebileceği toplam kanal sayısını azaltır.
Uygulama ve Eğitim Verimliliği
Ultralytics ekosisteminin öne çıkan özelliklerinden biri, kolaylaştırılmış geliştirici deneyimidir. Aşağıda nasıl başlayacağınıza dair bir karşılaştırma bulunmaktadır.
Kodda Basitlik
Ultralytics YOLO11 , karmaşık şablon kodunu soyutlayarak "piller dahil" olacak şekilde tasarlanmıştır.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
Buna karşılık, eski depolar genellikle depoyu klonlamayı, yapılandırma dosyalarını manuel olarak ayarlamayı ve eğitim ve çıkarım için karmaşık kabuk komut dosyalarını çalıştırmayı gerektirir.
İhracat Esnekliği
YOLO11 , dağıtım için aşağıdakiler dahil çeşitli formatlara tek tıklamayla dışa aktarmayı destekler ONNX, TensorRT, CoreML ve TFLite. Bu esneklik, modelinizin her ortamda üretime hazır olmasını sağlar.
Sonuç: Açık Ara Kazanan
Bir yandan YOLOv7 bilgisayarla görme tarihinde saygın bir model olmaya devam etmektedir, Ultralytics YOLO11 geleceği temsil ediyor. Geliştiriciler ve araştırmacılar için YOLO11 cazip bir paket sunuyor:
- Üstün Metrikler: Daha yüksek mAP ve daha yüksek çıkarım hızları.
- Zengin Ekosistem: Ultralytics HUB'a erişim, kapsamlı dokümanlar ve topluluk desteği.
- Çok yönlülük: Algılama, segmentasyon, poz, sınıflandırma ve OBB için tek bir çerçeve.
- Geleceğe Hazırlama: Sürekli güncellemeler ve bakım, yeni donanım ve yazılım kütüphaneleriyle uyumluluğu sağlar.
Herhangi bir yeni proje için, aşağıdakilerin verimliliğinden ve kullanım kolaylığından yararlanmak YOLO11 en az sürtünme ile en son teknolojiye sahip sonuçlar elde etmek için önerilen yoldur.
Diğer Modelleri İnceleyin
Daha fazla karşılaştırmayla ilgileniyorsanız, belgelerdeki bu ilgili sayfaları inceleyin:
- YOLO11 - YOLOv8 karşılaştırması
- YOLO11 vs YOLOv10
- YOLOv7 vs RT-DETR
- YOLOv7 vs YOLOv5
- Keşfedin YOLOv9 mimari.