YOLOv7 ve YOLO11: Ayrıntılı Teknik Karşılaştırma
Optimal nesne algılama modelini seçmek, farklı mimarilerin belirli yetenekleri ve ödünleşimleri hakkında derin bir anlayış gerektirir. Bu sayfa, YOLO soyundaki iki güçlü model olan YOLOv7 ve Ultralytics YOLO11 arasında kapsamlı bir teknik karşılaştırma sunmaktadır. Bilgisayar görüşü projeleriniz için en uygun olanı seçmenize yardımcı olmak için mimari farklılıklarını, performans kıyaslamalarını ve ideal kullanım durumlarını inceleyeceğiz.
YOLOv7: Verimli ve Doğru Nesne Algılama
YOLOv7, çıkarım maliyetlerini artırmadan eğitim verimliliğini ve doğruluğunu optimize etmeye odaklanarak gerçek zamanlı nesne algılamada önemli bir ilerleme olarak tanıtıldı. Yayınlandığı anda gerçek zamanlı dedektörler için yeni bir son teknoloji standardı belirledi.
Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
Tarih: 2022-07-06
Arşiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Belgeler: https://docs.ultralytics.com/models/yolov7/
Mimari ve Temel Özellikler
YOLOv7, önceki YOLO mimarileri üzerine çeşitli önemli yenilikler getirerek inşa edilmiştir. Özellik çıkarımını ve öğrenmeyi geliştirmek için backbone'da Genişletilmiş Verimli Katman Toplama Ağları (E-ELAN) gibi teknikler kullanır. Önemli bir katkı, eğitim sırasında uygulanan optimizasyon stratejilerini (yardımcı bir algılama başlığı ve kaba-ince kılavuzluk gibi) içeren ve çıkarım sırasında hesaplama yükü eklemeden nihai model doğruluğunu artıran "eğitilebilir serbestlik çantası" kavramıdır. Öncelikli olarak nesne algılamaya odaklanmış olsa da, resmi depo poz tahmini ve örnek segmentasyonu gibi görevler için topluluk uzantılarını göstermektedir.
Performans ve Kullanım Alanları
YOLOv7, piyasaya sürüldüğünde son teknoloji performansı sergileyerek hız ve doğruluk arasında çekici bir denge sunmuştur. Örneğin, YOLOv7x modeli, MS COCO veri kümesinde 640 görüntü boyutunda %53,1 mAPtest elde etmektedir. Verimliliği, gelişmiş güvenlik sistemleri ve hızlı, doğru algılama gerektiren otonom sistemler gibi gerçek zamanlı uygulamalar için uygun hale getirir.
Güçlü Yönler
- Yüksek Doğruluk ve Hız Dengesi: GPU üzerindeki gerçek zamanlı görevler için güçlü bir mAP ve çıkarım hızı kombinasyonu sunar.
- Verimli Eğitim: Çıkarım maliyetini artırmadan doğruluğu artırmak için gelişmiş eğitim teknikleri ("bedava hediyeler") kullanır.
- Yerleşik Performans: MS COCO gibi standart kıyaslamalarda kanıtlanmış sonuçlar.
Zayıflıklar
- Karmaşıklık: Mimari ve eğitim tekniklerini tam olarak kavramak ve optimize etmek karmaşık olabilir.
- Kaynak Yoğun: Daha büyük YOLOv7 modelleri, eğitim için önemli miktarda GPU kaynağı gerektirir.
- Sınırlı Görev Çok Yönlülüğü: Öncelikli olarak nesne algılamaya odaklanmıştır ve YOLO11 gibi entegre modellere kıyasla segmentasyon veya sınıflandırma gibi diğer görevler için ayrı uygulamalar gerektirir.
- Daha Az Bakımı Yapılıyor: Çerçeve, Ultralytics ekosistemi kadar aktif olarak geliştirilmemekte veya bakımı yapılmamaktadır, bu da daha az güncellemeye ve daha az topluluk desteğine yol açmaktadır.
YOLOv7 hakkında daha fazla bilgi edinin
Ultralytics YOLO11: Son Teknoloji Verimlilik ve Çok Yönlülük
Ultralytics YOLO11, Ultralytics'in YOLO serisindeki en son evrimi temsil eder ve kullanıcı dostu bir çerçeve içinde üstün doğruluk, gelişmiş verimlilik ve daha geniş görev çok yönlülüğü için tasarlanmıştır. Son teknoloji bir deneyim sunmak için YOLOv8 gibi önceki modellerin başarıları üzerine inşa edilmiştir.
Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş: Ultralytics
Tarih: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Belgeler: https://docs.ultralytics.com/models/yolo11/
Mimari ve Temel Özellikler
YOLO11'in mimarisi, gelişmiş özellik çıkarma tekniklerini ve aerodinamik bir ağ tasarımını içerir ve bu da genellikle önceki modellere kıyasla daha yüksek doğruluk ve daha az parametre sayısı ile sonuçlanır. Bu optimizasyon, daha hızlı çıkarım hızlarına ve daha düşük hesaplama gereksinimlerine yol açar; bu da uç cihazlardan bulut altyapısına kadar çeşitli platformlarda dağıtım için çok önemlidir.
YOLO11'in temel avantajlarından biri çok yönlülüğüdür. Yerel olarak nesne tespiti, örnek segmentasyonu, görüntü sınıflandırması, poz tahmini ve yönlendirilmiş sınırlayıcı kutular (OBB) dahil olmak üzere birden fazla bilgisayarlı görü görevini destekler. Ultralytics ekosistemine sorunsuz bir şekilde entegre olarak basit Python ve CLI arayüzleri, kapsamlı belgeler ve verimli eğitim için hazır bulunan önceden eğitilmiş ağırlıklar aracılığıyla kolaylaştırılmış bir kullanıcı deneyimi sunar.
Performans ve Kullanım Alanları
YOLO11, farklı model boyutlarında etkileyici ortalama Hassasiyet (mAP) puanları sergileyerek, hız ve doğruluk arasında olumlu bir denge elde etmektedir. Örneğin, YOLO11m, YOLOv7l'den önemli ölçüde daha az parametreyle 640 görüntü boyutunda 51,5'lik bir mAPval değerine ulaşır. YOLO11n gibi daha küçük varyantlar olağanüstü hızlı çıkarım sunarken, YOLO11x gibi daha büyük modeller doğruluğu en üst düzeye çıkarır. Özellikle, YOLO11 modelleri genellikle diğer mimarilere kıyasla eğitim ve çıkarım sırasında daha düşük bellek kullanımı sergiler.
YOLO11'in gelişmiş hassasiyeti ve verimliliği, doğru, gerçek zamanlı işleme gerektiren uygulamalar için idealdir:
- Robotik: Yapay zekanın robotikteki rolü konusunda araştırıldığı gibi, hassas navigasyon ve nesne etkileşimini mümkün kılar.
- Güvenlik Sistemleri: İzinsiz giriş algılama için gelişmiş güvenlik alarm sistemlerine güç sağlar.
- Perakende Analitiği: Envanter yönetimini ve müşteri davranış analizini iyileştirme.
- Endüstriyel Otomasyon: Üretimde kalite kontrolü destekleme.
Güçlü Yönler
- Son Teknoloji Performansı: Optimize edilmiş, ankrajsız bir mimari ile yüksek mAP skorları.
- Verimli Çıkarım: Özellikle CPU'da mükemmel hız, gerçek zamanlı ihtiyaçlar için uygundur.
- Çok Yönlü Görev Desteği: Tek bir çerçevede algılama, segmentasyon, sınıflandırma, poz ve OBB'yi yerel olarak destekler.
- Kullanım Kolaylığı: Kodsuz eğitim ve dağıtım için basit API, kapsamlı dokümantasyon ve entegre Ultralytics HUB desteği.
- İyi Yönetilen Ekosistem: Aktif geliştirme, güçlü topluluk, sık güncellemeler ve verimli eğitim süreçleri.
- Ölçeklenebilirlik: Daha düşük bellek gereksinimleriyle uç noktadan buluta kadar donanım genelinde etkili bir şekilde performans gösterir.
Zayıflıklar
- Daha yeni bir model olduğundan, bazı belirli üçüncü taraf araç entegrasyonları, daha eski, daha yerleşik modellere kıyasla hala gelişiyor olabilir.
- Daha büyük modeller, eğitim için önemli miktarda işlem kaynağı gerektirebilir, ancak performans sınıfları için oldukça verimli kalırlar.
YOLO11 hakkında daha fazla bilgi edinin
Performans Karşılaştırması: YOLOv7 - YOLO11
Aşağıdaki tabloda, COCO veri kümesi üzerinde YOLOv7 ve YOLO11 modelleri arasında ayrıntılı bir performans karşılaştırması sunulmaktadır. YOLO11 modelleri, doğruluk, hız ve verimliliğin üstün bir dengesini sergilemektedir. Örneğin, YOLO11l, YOLOv7x'ten daha yüksek bir mAP'ye, parametrelerin ve FLOP'ların yarısından daha azıyla ulaşır ve GPU'da önemli ölçüde daha hızlıdır. Benzer şekilde, YOLO11m, parametrelerin ve hesaplama maliyetinin yaklaşık yarısıyla YOLOv7l'nin doğruluğunu karşılar. En küçük model olan YOLO11n, hem CPU hem de GPU'da minimum kaynak kullanımıyla dikkat çekici bir hız sağlayarak, onu uç uygulamalar için ideal hale getirir.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Sonuç: Hangi Modeli Seçmelisiniz?
YOLOv7, kendi zamanı için güçlü bir model olmasına ve hala gerçek zamanlı nesne tespiti için güçlü bir performans sunmasına rağmen, Ultralytics YOLO11 önemli bir sıçramayı temsil ediyor. YOLO11, yalnızca temel performans metriklerinde YOLOv7'yi aşmakla kalmıyor, aynı zamanda çok daha yönlü, kullanıcı dostu ve iyi desteklenen bir çerçeve sunuyor.
Modern, hepsi bir arada bir çözüm arayan geliştiriciler ve araştırmacılar için YOLO11 açık bir seçimdir. Avantajları şunlardır:
- Üstün Performans Dengesi: YOLO11, doğruluk, hız ve hesaplama maliyeti arasında daha iyi bir denge sağlar.
- Çoklu Görev Çok Yönlülüğü: Algılama, segmentasyon, sınıflandırma, poz ve OBB için yerel destek, birden çok model ihtiyacını ortadan kaldırır ve geliştirme iş akışlarını basitleştirir.
- Kullanım Kolaylığı: Kolaylaştırılmış API, kapsamlı belgelendirme ve basit eğitim prosedürleri, onu hem yeni başlayanlar hem de uzmanlar için erişilebilir kılar.
- Aktif Geliştirme: Ultralytics ekosisteminin bir parçası olarak YOLO11, sürekli güncellemelerden, güçlü bir açık kaynak topluluğundan ve sorunsuz MLOps için Ultralytics HUB gibi araçlarla entegrasyondan yararlanır.
Özetle, önceliğiniz dağıtım kolaylığına ve geleceğe yönelik uyumluluğa odaklanarak çok çeşitli uygulamalar için yapay zekadaki en son gelişmeleri kullanmaksa, Ultralytics YOLO11 önerilen modeldir.
Diğer Modelleri İnceleyin
Daha fazla inceleme için, Ultralytics belgelerinde YOLOv7, YOLO11 ve diğer ilgili modelleri içeren bu karşılaştırmaları göz önünde bulundurun:
- YOLO11 - YOLOv8 karşılaştırması
- YOLO11 - YOLOv10 Karşılaştırması
- YOLOv7 - YOLOv8 karşılaştırması
- YOLOv7 - YOLOv5 karşılaştırması
- YOLOv9 ve YOLOv10 gibi en son modelleri keşfedin.