YOLOv7'ye karşı YOLO11: Gerçek Zamanlı Mirastan Son Teknoloji Verimliliğine
Bilgisayar görüşü modelleri dünyasında gezinmek, yerleşik mimariler ile en son teknoloji (SOTA) yenilikleri arasındaki nüansı anlamayı içerir. Bu kılavuz, YOLO serisinde önemli bir kilometre taşı olan YOLOv7 ile üstün performans ve çok yönlülük için tasarlanmış en son model olan Ultralytics YOLO11 arasında kapsamlı bir teknik karşılaştırma sunar.
Geliştiricilerin ve araştırmacıların nesne tespitinden karmaşık örnek segmentasyonuna kadar değişen görevler için en uygun aracı seçmelerine yardımcı olmak amacıyla mimari farklılıklarını, kıyaslama metriklerini ve pratik uygulamalarını inceleyeceğiz.
YOLOv7: Verimli Mimaride Bir Kriter
Temmuz 2022'de piyasaya sürülen YOLOv7, eğitim verimliliği ve çıkarım hızı arasındaki dengede büyük bir atılımı temsil etmiştir. Doğruluktan ödün vermeden parametre sayısını azaltan mimari optimizasyonlara odaklanarak önceki dedektörlerden daha iyi performans göstermek üzere tasarlanmıştır.
Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş:Institute of Information Science, Academia Sinica, Tayvan
Tarih: 2022-07-06
Arxiv:https://arxiv.org/abs/2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
Belgeler:https://docs.ultralytics.com/models/yolov7/
Mimari Öne Çıkanlar
YOLOv7, Genişletilmiş Verimli Katman Toplama Ağı (E-ELAN)'nı tanıttı. Bu mimari, en kısa ve en uzun gradyan yollarını kontrol ederek modelin daha çeşitli özellikler öğrenmesini sağlar ve eğitim sırasında yakınsamayı geliştirir. Ek olarak, çıkarım maliyetini artırmadan doğruluğu artıran modelin yeniden parametrelendirilmesi ve dinamik etiket ataması gibi bir dizi optimizasyon stratejisi olan "eğitilebilir bedava hediyeler" kullandı.
Öncelikle bir nesne algılama modeli olmasına rağmen, açık kaynak topluluğu YOLOv7'yi poz tahmini için genişletmeyi araştırmıştır. Ancak, bu uygulamalar genellikle birleşik çerçevelerde bulunan kusursuz entegrasyondan yoksundur.
Güçlü Yönler ve Sınırlamalar
YOLOv7 aşağıdakiler için saygı görmektedir:
- Sağlam Performans: Yayınlandığında gerçek zamanlı detectorler için yeni bir temel oluşturdu ve COCO veri kümesinde iyi performans gösterdi.
- Mimari Yenilik: E-ELAN'ın tanıtımı, ağ tasarımındaki sonraki araştırmaları etkiledi.
Ancak, modern iş akışlarında zorluklarla karşılaşıyor:
- Karmaşıklık: Eğitim hattı karmaşık olabilir ve modern standartlara kıyasla önemli ölçüde manuel yapılandırma gerektirebilir.
- Sınırlı Çok Yönlülük: Kullanıma hazır olarak sınıflandırma veya yönlendirilmiş sınırlayıcı kutular (OBB) gibi görevleri yerel olarak desteklemez.
- Kaynak Kullanımı: YOLOv7x gibi daha büyük varyantları eğitmek, önemli miktarda GPU belleği gerektirir ve bu da sınırlı donanıma sahip araştırmacılar için bir darboğaz olabilir.
YOLOv7 hakkında daha fazla bilgi edinin
Ultralytics YOLO11: Hız, Doğruluk ve Kullanım Kolaylığını Yeniden Tanımlıyor
Ultralytics YOLO11, ünlü YOLO soyundaki en son evrimdir ve çok çeşitli bilgisayarlı görü görevlerinde SOTA performansı sunmak üzere tasarlanmıştır. Sürekli iyileştirme mirası üzerine inşa edilen YOLO11, gerçek dünya dağıtımı için verimliliği en üst düzeye çıkaran gelişmiş bir mimari sunar.
Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş:Ultralytics
Tarih: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
Belgeler:https://docs.ultralytics.com/models/yolo11/
Gelişmiş Mimari ve Çok Yönlülük
YOLO11, C3k2 bloklarını ve çeşitli ölçeklerdeki özellikleri daha etkili bir şekilde yakalamak için geliştirilmiş bir SPPF modülünü kullanan modern bir backbone kullanır. Bu tasarım, yalnızca daha doğru olmakla kalmayıp aynı zamanda parametreler ve FLOPs açısından da seleflerine ve rakiplerine kıyasla önemli ölçüde daha hafif olan bir modelle sonuçlanır.
YOLO11'in tanımlayıcı bir özelliği, yerel çoklu görev desteğidir. Kullanıcılar tek bir çerçeve içinde şunları gerçekleştirebilir:
- Algılama: Sınırlandırma kutuları ile nesneleri belirleme.
- Bölütleme: Hassas şekil analizi için piksel düzeyinde maskeleme.
- Sınıflandırma: Tüm görüntülere sınıf etiketleri atama.
- Poz Tahmini: İnsan vücutlarındaki kilit noktaları detect eder.
- OBB: Döndürülmüş nesneleri detect etmek, hava görüntüleri için çok önemlidir.
Birleşik Ekosistem
Ultralytics YOLO11, veri kümesi yönetimi, kodsuz eğitim ve tek tıklamayla dağıtım için bir platform olan Ultralytics HUB ile sorunsuz bir şekilde entegre olur. Bu entegrasyon, MLOps yaşam döngüsünü önemli ölçüde hızlandırır.
Geliştiriciler Neden YOLO11'i Seçiyor
- Kullanım Kolaylığı: Kullanıcı merkezli bir tasarımla YOLO11, yalnızca birkaç satır Python koduyla veya basit bir CLI aracılığıyla uygulanabilir.
- İyi Yönetilen Ekosistem: Aktif bir topluluk ve Ultralytics ekibi tarafından desteklenen model, sık sık güncellemeler alır ve en son PyTorch sürümleri ve donanım hızlandırıcılarıyla uyumluluk sağlar.
- Performans Dengesi: Çıkarım hızı ve ortalama Ortalama Hassasiyet (mAP) arasında olağanüstü bir denge sağlayarak hem uç cihazlar hem de bulut sunucuları için idealdir.
- Bellek Verimliliği: YOLO11 modelleri, eski mimarilere veya transformatör tabanlı modellere kıyasla eğitim sırasında genellikle daha az CUDA belleği gerektirir ve bu da daha büyük toplu iş boyutlarına veya mütevazı donanımlarda eğitime olanak tanır.
YOLO11 hakkında daha fazla bilgi edinin
Performans Karşılaştırması: Teknik Kıyaslamalar
Aşağıdaki tablo, YOLOv7 ve YOLO11 arasındaki performans farklılıklarını göstermektedir. Veriler, modern optimizasyonların YOLO11'in hesaplama maliyetinin çok küçük bir kısmıyla nasıl üstün doğruluk elde etmesini sağladığını vurgulamaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Analiz:
- Verimlilik: YOLO11m, YOLOv7l'nin doğruluğuyla (51.5'e karşı 51.4 mAP) eşleşirken neredeyse parametrelerin yarısını (20.1M'ye karşı 36.9M) ve önemli ölçüde daha az FLOP kullanır.
- Hız: Gerçek zamanlı uygulamalar için YOLO11n, T4 GPU'da 1,5 ms'de çalışarak önemli ölçüde daha hızlıdır ve bu da onu yüksek FPS video işleme için mükemmel kılar.
- Doğruluk: En büyük model olan YOLO11x, rekabetçi parametre sayısını korurken YOLOv7x'i doğruluk açısından geride bırakıyor (54.7'ye karşı 53.1 mAP).
Gerçek Dünya Kullanım Durumları
Tarım ve Çevre İzleme
Hassas tarımda, mahsul hastalıklarını detect etmek veya büyümeyi izlemek, dronlar veya saha sensörleri gibi sınırlı güce sahip cihazlarda çalışabilen modeller gerektirir.
- YOLO11: Hafif mimarisi (özellikle YOLO11n/s), Raspberry Pi veya NVIDIA Jetson cihazlarında dağıtıma olanak tanıyarak gerçek zamanlı ekin sağlığı izleme sağlar.
- YOLOv7: Doğru olmasına rağmen, daha yüksek işlem gücü ihtiyacı, pille çalışan uç cihazlardaki kullanımını kısıtlar.
Akıllı Üretim ve Kalite Kontrolü
Otomatik görsel inceleme sistemleri, üretim hatlarındaki küçük kusurları tespit etmek için yüksek hassasiyet gerektirir.
- YOLO11: Modelin segmentasyon ve OBB gerçekleştirme yeteneği burada çok önemlidir. Örneğin, OBB, bir konveyör bandında dönen bileşenleri algılamak için gereklidir; bu, YOLO11 tarafından yerel olarak desteklenen ancak YOLOv7'de özel uygulamalar gerektiren bir özelliktir.
- YOLOv7: Standart sınırlayıcı kutu algılama için uygundur, ancak önemli bir değişiklik yapılmadan karmaşık geometrik kusurlar için daha az uyarlanabilir.
Gözetim ve Güvenlik
Güvenlik sistemleri genellikle aynı anda birden fazla video akışını işler.
- YOLO11: Yüksek çıkarım hızı, tek bir sunucunun daha fazla akışı paralel olarak işlemesine olanak tanıyarak altyapı maliyetlerini azaltır.
- YOLOv7: Etkili, ancak çerçeve başına daha yüksek gecikme, tek bir birimin işleyebileceği toplam kanal sayısını azaltır.
Uygulama ve Eğitim Verimliliği
Ultralytics ekosisteminin öne çıkan özelliklerinden biri, kolaylaştırılmış geliştirici deneyimidir. Aşağıda, nasıl başlayacağınızın bir karşılaştırması bulunmaktadır.
Kodda Basitlik
Ultralytics YOLO11, karmaşık standart kodları soyutlayarak "pilleri dahil" olacak şekilde tasarlanmıştır.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
Aksine, eski depolar genellikle depoyu klonlamayı, yapılandırma dosyalarını manuel olarak ayarlamayı ve eğitim ve çıkarım için karmaşık kabuk komut dosyaları çalıştırmayı gerektirir.
Dışa Aktarma Esnekliği
YOLO11, ONNX, TensorRT, CoreML ve TFLite dahil olmak üzere dağıtım için çeşitli formatlara tek tıklamayla dışa aktarmayı destekler. Bu esneklik, modelinizin herhangi bir ortamda üretime hazır olmasını sağlar.
Sonuç: Açık Kazanan
YOLOv7 bilgisayarla görme tarihinde saygın bir model olmaya devam ederken, Ultralytics YOLO11 geleceği temsil ediyor. Geliştiriciler ve araştırmacılar için YOLO11 cazip bir paket sunuyor:
- Üstün Metrikler: Daha yüksek mAP ve daha hızlı çıkarım hızları.
- Zengin Ekosistem: Ultralytics HUB, kapsamlı belgeler ve topluluk desteğine erişim.
- Çeşitlilik: Detect, segment, poz, sınıflandırma ve OBB için tek bir çerçeve.
- Geleceğe Hazırlık: Sürekli güncellemeler ve bakım, yeni donanım ve yazılım kitaplıklarıyla uyumluluğu sağlar.
Herhangi bir yeni proje için, YOLO11'in verimliliğinden ve kullanım kolaylığından yararlanmak, minimum sürtünmeyle son teknoloji sonuçlar elde etmek için önerilen yoldur.
Diğer Modelleri İnceleyin
Daha fazla karşılaştırma yapmak isterseniz, dokümantasyondaki bu ilgili sayfalara göz atın:
- YOLO11 - YOLOv8 karşılaştırması
- YOLO11 - YOLOv10
- YOLOv7'ye karşı RT-DETR
- YOLOv7'ye karşı YOLOv5
- YOLOv9 mimarisini keşfedin.