Model Karşılaştırması: Nesne Algılama için YOLOv7 - YOLOv8
Doğru nesne algılama modelini seçmek, bilgisayar görüşü görevlerinde optimum performans elde etmek için çok önemlidir. Bu sayfa, alandaki iki önemli model olan YOLOv7 ve Ultralytics YOLOv8 arasında teknik bir karşılaştırma sunmaktadır. Model seçim sürecinize rehberlik etmek amacıyla, mimari nüanslarını, performans kıyaslamalarını ve ideal uygulamalarını analiz edecek ve Ultralytics ekosisteminin sunduğu avantajları vurgulayacağız.
YOLOv7: Gerçek Zamanlı Algılamada Bir Kriter
YOLOv7, çıkarım maliyetlerini artırmadan eğitim verimliliğini ve doğruluğunu optimize etmeye odaklanarak gerçek zamanlı nesne algılamada önemli bir ilerleme olarak tanıtıldı. Yayınlandığı anda gerçek zamanlı dedektörler için yeni bir son teknoloji standardı belirledi.
Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
Tarih: 2022-07-06
Arşiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Belgeler: https://docs.ultralytics.com/models/yolov7/
Mimari ve Temel Özellikler
YOLOv7, önceki YOLO mimarileri üzerine çeşitli temel yenilikler getirerek inşa edilmiştir. Özellik çıkarma verimliliğini artırmak için backbone'unda Genişletilmiş Verimli Katman Toplama Ağları (E-ELAN) gibi teknikler kullanır. Önemli bir katkı, çıkarım sırasında hesaplama yükü eklemeden nihai model doğruluğunu artırmak için eğitim sırasında uygulanan optimizasyon stratejilerini (yardımcı başlıklar ve kabadan inceye rehberlik gibi) içeren "eğitilebilir bedava hediyeler çantası" kavramıdır. YOLOv7 öncelikle nesne algılama görevine odaklanan, ankraj tabanlı bir dedektördür, ancak topluluk uzantıları onu poz tahmini gibi diğer görevler için uyarlamıştır.
Güçlü Yönler
- Yüksek Doğruluk ve Hız Dengesi: mAP ve çıkarım hızının güçlü bir kombinasyonunu sunarak, gerçek zamanlı çıkarım görevleri için oldukça etkili olmasını sağlar.
- Verimli Eğitim: Son çıkarım maliyetini artırmadan doğruluğu artırmak için gelişmiş eğitim teknikleri ("bedava hediyeler") kullanır.
- Yerleşik Performans: MS COCO veri kümesi gibi standart kıyaslamalarda kanıtlanmış sonuçlara sahiptir.
Zayıflıklar
- Mimari Karmaşıklık: Mimari ve yeni eğitim tekniklerini tam olarak kavramak ve özel kullanım durumları için optimize etmek karmaşık olabilir.
- Kaynak Yoğun: Daha büyük YOLOv7 modelleri, eğitim için önemli miktarda GPU kaynağı gerektirir.
- Sınırlı Görev Çok Yönlülüğü: Öncelikli olarak nesne algılamaya odaklanmıştır. Örnek segmentasyonu veya görüntü sınıflandırması gibi diğer görevleri uygulamak, YOLOv8'in birleşik yaklaşımının aksine ayrı, entegre olmayan uygulamalar gerektirir.
YOLOv7 hakkında daha fazla bilgi edinin
Ultralytics YOLOv8: Son Teknoloji Verimlilik ve Uyarlanabilirlik
Ultralytics YOLOv8, Ultralytics'in önceki YOLO sürümlerinin başarıları üzerine inşa ettiği sonraki büyük sürümüdür. Üstün performans, esneklik ve verimlilik için tasarlanmış son teknoloji bir modeldir. YOLOv8, hem performansı hem de kullanım kolaylığını artıran anchor-free bir tasarım ve daha aerodinamik bir mimari sunar.
Yazarlar: Glenn Jocher, Ayush Chaurasia ve Jing Qiu
Kuruluş: Ultralytics
Tarih: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Belgeler: https://docs.ultralytics.com/models/yolov8/
Güçlü Yönler
- Son Teknoloji Performansı: YOLOv8, uç yapay zeka'dan bulut tabanlı hizmetlere kadar çok çeşitli uygulamalar için uygun hale getiren olağanüstü bir doğruluk ve hız dengesi sağlar.
- Kullanıcı Dostu Tasarım: Ultralytics, eğitim ve dağıtım için kapsamlı belgeler, basit iş akışları ve basit Python ve CLI arayüzleri sunarak basitliğe öncelik verir.
- Rakipsiz Çok Yönlülük: Algılama, segmentasyon, sınıflandırma, poz tahmini ve yönlendirilmiş nesne algılama (OBB) dahil olmak üzere birden çok görme görevini yerel olarak destekleyerek çeşitli bilgisayarla görme ihtiyaçları için birleşik bir çözüm sunar.
- İyi Yönetilen Ekosistem: Kodsuz eğitim ve dağıtım için Ultralytics HUB ile sorunsuz bir şekilde entegre olur. Aktif geliştirme, sık güncellemeler, güçlü topluluk desteği ve kapsamlı kaynaklardan yararlanır.
- Eğitim ve Bellek Verimliliği: Hazırda bulunan önceden eğitilmiş ağırlıklarla verimli eğitim süreçleri sunar. Mimarisi, genellikle transformatörler gibi diğer karmaşık mimarilere kıyasla eğitim sırasında daha düşük bellek kullanımı gerektirir; bu da eğitilmesi daha yavaş olabilir ve daha fazla CUDA belleği gerektirebilir.
Zayıflıklar
- Daha büyük modeller önemli miktarda işlem kaynağı gerektirir, ancak kaynak kısıtlı ortamlar için YOLOv8n gibi daha küçük, yüksek verimli varyantlar mevcuttur.
İdeal Kullanım Senaryoları
YOLOv8'in çok yönlülüğü, gerçek zamanlı performans ve yüksek doğruluk gerektiren uygulamalar için idealdir, örneğin:
- Güvenlik alarm sistemleri ve otonom araçlarda gerçek zamanlı nesne tespiti.
- Tarım ve sağlık hizmetleri gibi sektörlerde çok yönlü yapay görme çözümleri.
- Ultralytics ekosistemi içindeki kullanım kolaylığı ve güçlü araçları sayesinde hızlı prototipleme ve dağıtım.
YOLOv8 hakkında daha fazla bilgi edinin
Performans ve Kıyaslamalar: YOLOv7 - YOLOv8
Performansı karşılaştırırken, YOLOv8, model yelpazesi genelinde hem doğruluk hem de verimlilik açısından belirgin avantajlar göstermektedir. Örneğin, YOLOv8x modeli, daha verimli olurken YOLOv7x'ten daha yüksek bir mAP elde etmektedir. Daha küçük YOLOv8 modelleri de uç nokta dağıtımı için mükemmel bir denge sağlamaktadır.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
Sonuç: Hangi Modeli Seçmelisiniz?
YOLOv7, gerçek zamanlı performansın sınırlarını zorlayan etkileyici bir nesne tespit aracı olsa da, Ultralytics YOLOv8, modern uygulamaların büyük çoğunluğu için daha cazip bir seçeneği temsil etmektedir.
YOLOv8'in temel avantajları şunlardır:
- Üstün Çok Yönlülük: Daha geniş bir görev yelpazesi için yerel destek, onu karmaşık bilgisayarlı görü projeleri için tek elden bir çözüm haline getirir.
- Kullanım Kolaylığı: Kolaylaştırılmış API, kapsamlı belgelendirme ve Ultralytics ekosistemiyle entegrasyon, hem yeni başlayanlar hem de uzmanlar için giriş engelini önemli ölçüde azaltır.
- Daha İyi Performans-Verimlilik Dengesi: YOLOv8 modelleri genellikle belirli sayıda parametre ve hesaplama maliyeti için daha iyi doğruluk sunarak farklı donanım kısıtlamalarına daha uyarlanabilir hale getirir.
- Aktif Geliştirme ve Destek: Ultralytics'in amiral gemisi modeli olarak YOLOv8, sürekli güncellemelerden, güçlü bir topluluktan ve profesyonel destekten yararlanarak projeler için uzun vadeli uygulanabilirlik sağlar.
Güçlü, esnek ve kullanımı kolay bir çerçeve arayan geliştiriciler ve araştırmacılar için, Ultralytics YOLOv8, son teknoloji ürünü AI çözümleri oluşturmak için önerilen seçimdir.
Diğer Modelleri İnceleyin
Daha fazla inceleme için, Ultralytics belgeleri içinde YOLOv7, YOLOv8 ve diğer ilgili modelleri içeren bu karşılaştırmaları göz önünde bulundurun:
- YOLOv7 ve YOLOv5
- YOLOv8 - YOLOv5 karşılaştırması
- YOLOv8 - RT-DETR karşılaştırması
- YOLOv10 ve YOLO11 gibi en son modelleri keşfedin.