YOLO11 vs YOLOv7: Nesne Algılama için Detaylı Teknik Karşılaştırma
Doğru nesne algılama modelini seçmek, bilgisayarla görme görevlerinde optimum performans elde etmek için çok önemlidir. Bu sayfa, verimli ve doğru nesne algılama için tasarlanmış iki gelişmiş model olan Ultralytics YOLO11 ve YOLOv7 arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Bilinçli bir karar vermenizde size rehberlik etmek için mimari nüanslarını, performans kıyaslamalarını ve uygun uygulamaları inceleyeceğiz.
Ultralytics YOLO11
Ultralytics 'ten Glenn Jocher ve Jing Qiu tarafından yazılan ve 2024-09-27 tarihinde piyasaya sürülen Ultralytics YOLO11, YOLO serisindeki en son gelişmedir. Nesne algılamada hem doğruluğu hem de verimliliği artırmaya odaklanarak çok çeşitli gerçek dünya uygulamaları için çok yönlü hale getirir. Ultralytics YOLO11 önceki YOLO modellerini temel alarak, gerçek zamanlı performansı korurken en son teknoloji algılama hassasiyetini elde etmek için ağ yapısını iyileştirir.
Mimari ve Temel Özellikler:
YOLO11'in mimarisi, YOLOv8 gibi modellere kıyasla daha az parametre sayısı ile daha yüksek doğruluk sağlayan gelişmiş özellik çıkarma tekniklerini içerir. Bu optimizasyon, daha hızlı çıkarım motoru hızları ve daha düşük hesaplama talepleri sağlayarak uç cihazlardan bulut altyapısına kadar çeşitli platformlarda dağıtım için uygun hale getirir. YOLO11 nesne algılama, örnek segmentasyonu, görüntü sınıflandırma ve poz tahmini gibi çok sayıda bilgisayarla görme görevini desteklemektedir. Model GitHub'da mevcuttur.
Performans Ölçütleri ve Kıyaslamalar:
YOLO11 , farklı model boyutlarında etkileyici Ortalama Hassasiyet (mAP) puanları göstermektedir. Örneğin, YOLO11m 640 görüntü boyutunda 51,5 mAPval50-95 elde ederek hız ve doğruluğu etkili bir şekilde dengeler. YOLO11n ve YOLO11s gibi daha küçük modeller, hıza öncelik veren uygulamalar için daha hızlı gerçek zamanlı çıkarım sunarken, YOLO11x gibi daha büyük modeller doğruluğu en üst düzeye çıkarır. Ayrıntılı YOLO performans ölçümleri için Ultralytics belgelerine bakın.
Kullanım Örnekleri:
YOLO11 'in gelişmiş hassasiyeti ve verimliliği, onu doğru, gerçek zamanlı nesne algılama gerektiren uygulamalar için ideal hale getirir:
- Robotik: Dinamik ortamlarda hassas navigasyon ve nesne etkileşimi için.
- Güvenlik Sistemleri: Doğru izinsiz giriş tespiti ve kapsamlı izleme için gelişmiş güvenlik alarm sistemlerinde.
- Perakende Analitiği: Perakendede envanter yönetimini ve derinlemesine müşteri davranış analizini iyileştirmek için yapay zeka.
- Endüstriyel Otomasyon: Üretim süreçlerinde sıkı kalite kontrolü ve etkin hata tespiti için.
Güçlü yönler:
- Yüksek Doğruluk: Rafine mimariler ile son teknoloji mAP elde eder.
- Verimli Çıkarım: Gerçek zamanlı uygulamalar için uygun hızlı işleme.
- Çok Yönlü Görevler: Nesne algılama, segmentasyon, sınıflandırma ve poz tahminini destekler.
- Ölçeklenebilirlik: Uç cihazlardan bulut sistemlerine kadar farklı donanımlarda etkili performans gösterir.
Zayıflıklar:
- Daha büyük modeller, hız optimizasyonu yapılmış daha küçük modellere kıyasla daha fazla hesaplama kaynağı gerektirebilir.
- Belirli uç cihazlar için optimizasyon, ek model dağıtım yapılandırmaları gerektirebilir.
YOLO11 hakkında daha fazla bilgi edinin
YOLOv7
Tayvan, Academia Sinica, Bilgi Bilimi Enstitüsü'nden Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao tarafından Temmuz 2022'de tanıtılan YOLOv7, gerçek zamanlı nesne dedektörleri için yeni bir son teknoloji belirleyen eğitilebilir ücretsiz çantasıyla tanınıyor. ArXiv makalesinde ve GitHub deposunda ayrıntılı olarak açıklanan YOLOv7, nesne algılama görevlerinde yüksek doğruluğu korurken hız ve verimliliği vurgulamaktadır.
Mimari ve Temel Özellikler:
YOLOv7, Verimli Katman Toplama Ağı (ELAN) üzerine inşa edilmiş ve ağın öğrenme kabiliyetini geliştirmek için Genişletilmiş-ELAN'ı (E-ELAN) tanıtmıştır. Eğitim verimliliğini ve çıkarım hızını artırmak için model yeniden parametrelendirme ve dinamik etiket atama gibi teknikler kullanır. YOLOv7, çeşitli uygulamalarda yüksek performanslı nesne tespiti için tasarlanmıştır.
Performans Ölçütleri ve Kıyaslamalar:
YOLOv7, 640 görüntü boyutunda COCO veri kümesinde %51,4'lük bir mAP elde ederek mükemmel performans ölçümleri sergilemektedir. Temel YOLOv7 modelinin toplu iş 1 çıkarımında 161 FPS'ye ulaşmasıyla hızı da dikkate değerdir. Ayrıntılı performans kıyaslamaları için resmi YOLOv7 GitHub deposuna bakın.
Kullanım Örnekleri:
YOLOv7'nin hız ve doğruluk dengesi, onu aşağıdakiler de dahil olmak üzere çok çeşitli uygulamalar için uygun hale getirir:
- Gerçek Zamanlı Nesne Algılama: Otonom sürüş ve hızlı video analizi gibi hızlı algılama gerektiren uygulamalar için idealdir.
- Yüksek Performanslı Hesaplama: Hesaplama kaynaklarının mevcut olduğu ve hızın yanı sıra yüksek doğruluğun öncelikli olduğu ortamlar için uygundur.
- Araştırma ve Geliştirme: Nesne algılama mimarileri ve eğitim metodolojilerinde daha ileri araştırmalar için güçlü bir temel model.
Güçlü yönler:
- Yüksek Hız: Gerçek zamanlı sistemler için uygun olan etkileyici çıkarım hızlarına ulaşır.
- İyi Doğruluk: Karşılaştırmalı veri kümelerinde rekabetçi mAP puanları sunar.
- Verimli Mimari: Gelişmiş performans için E-ELAN ve model yeniden parametrelendirmeyi kullanır.
Zayıflıklar:
- Uç dağıtım senaryoları için YOLO11n gibi daha küçük, daha yeni modellere kıyasla daha fazla hesaplama kaynağı gerektirebilir.
- Mimari verimli olmakla birlikte, YOLO11'e kıyasla nesne algılamanın ötesinde çeşitli görme görevlerini destekleme konusunda daha az çok yönlüdür.
YOLOv7 hakkında daha fazla bilgi edinin
Model Karşılaştırma Tablosu
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4TensorRT10 (ms) |
params (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Sonuç
Hem YOLO11 hem de YOLOv7, her biri benzersiz güçlere sahip güçlü nesne algılama modelleridir. YOLO11 , çok yönlülük ve verimlilikte üstündür, çoklu görüş görevlerini son teknoloji doğruluk ve hız ile destekler, bu da onu çeşitli uygulamalar ve dağıtım ortamları için güçlü bir seçim haline getirir. YOLOv7, aynı zamanda verimli olmakla birlikte, özellikle gerçek zamanlı uygulamalar ve araştırma amaçları için uygun olan yüksek hızlı nesne algılama için optimize edilmiştir. Bunlar arasındaki seçim, görev çok yönlülüğü, doğruluk ihtiyaçları ve dağıtım kısıtlamaları gibi faktörleri dengeleyerek projenizin özel gereksinimlerine bağlıdır.
Diğer modelleri keşfetmek isteyen kullanıcılar için Ultralytics , aerodinamik verimliliği ve çok yönlülüğü ile bilinen YOLOv8'i ve hızı ve kullanım kolaylığı ile yaygın olarak benimsenen YOLOv5'i de sunmaktadır. Ayrıca YOLO11 'i YOLOv9 ile karşılaştırmayı veya nesne algılamaya yönelik farklı mimari yaklaşımlar için RT-DETR gibi modelleri keşfetmeyi düşünebilirsiniz.