YOLOv9 vs YOLOv7: Nesne Algılama Evrimine Derinlemesine Bir Bakış
Bilgisayarlı görü dünyası, mimari atılımların hız ve doğruluk sınırlarını sürekli olarak yeniden tanımladığı hızlı yeniliklerle karakterize edilmektedir. Bu yolculuktaki iki önemli kilometre taşı YOLOv9 ve YOLOv7. Her iki model de Chien-Yao Wang ve meslektaşlarının araştırmalarından kaynaklanıyor ve "You Only Look Once" ailesinin farklı nesillerini temsil ediyor.
Bir yandan YOLOv7 2022'de piyasaya sürüldüğünde gerçek zamanlı nesne algılama standardını belirledi, YOLOv9 2024 yılında derin ağlardaki bilgi kaybını ele almak için yeni mekanizmalarla ortaya çıktı. Bu karşılaştırma, geliştiricilerin ihtiyaçları için en uygun modeli seçmelerine yardımcı olmak için teknik özelliklerini, mimari farklılıklarını ve pratik uygulamalarını araştırmaktadır.
Performans Ölçütleri ve Verimlilik
YOLOv7 'den YOLOv9 'a evrim, en çok hesaplama maliyeti ile tespit performansı arasındaki dengede görülebilir. YOLOv9 , selefine kıyasla daha az parametre ile daha yüksek Ortalama Hassasiyet (mAP) elde etmesini sağlayan önemli verimlilik kazanımları sunmaktadır.
Örneğin, YOLOv9m modeli YOLOv7l ile aynı %51,4 mAPval mAPine ulaşır, ancak neredeyse yarı yarıya daha az parametre (20,0M'ye karşı 36,9M) ve önemli ölçüde daha az FLOP kullanır. Bu verimlilik, YOLOv9 'u donanım kaynaklarının kısıtlı olduğu uç yapay zeka uygulamaları için özellikle cazip kılmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv9: Programlanabilir Gradyan Bilgileri
YOLOv9 , derin sinir ağlarının katmanlar arasında veri iletimini nasıl ele aldığı konusunda bir paradigma değişikliğini temsil ediyor. 2024 yılının başlarında piyasaya sürülen bu ürün, özellikle verilerin derin bir ağın birbirini izleyen katmanlarından geçerken kaybolduğu "bilgi darboğazı" sorununu hedef alıyor.
Yazarlar Chien-Yao Wang, Hong-Yuan Mark Liao
Organizasyon:Bilgi Bilimleri Enstitüsü, Academia Sinica
Tarih: 2024-02-21
Arxiv:2402.13616
GitHub:WongKinYiu/yolov9
Dokümanlar:Ultralytics YOLOv9
Mimari Yenilik
YOLOv9 'daki temel yenilik Programlanabilir Gradyan Bilgisinin (PGI) kullanıma sunulmasıdır. PGI, gradyanların güvenilir bir şekilde ilk katmanlara geri yayılmasını sağlayan ve aksi takdirde özellik çıkarma sırasında kaybolabilecek temel girdi bilgilerini koruyan yardımcı bir denetim çerçevesi sağlar.
PGI'yı tamamlayan Genelleştirilmiş Verimli Katman Toplama Ağı'dır (GELAN). Bu mimari, geliştiricilerin çeşitli hesaplama bloklarını (CSP veya ResBlocks gibi) esnek bir şekilde istiflemesine ve doğruluktan ödün vermeden belirli donanım kısıtlamaları için model ağırlıklarını optimize etmesine olanak tanır.
Güçlü ve Zayıf Yönler
- Güçlü Yönler:
- Üstün Doğruluk: YOLOv9 modeli %55,6 mAP değerine ulaşarak COCO veri setinde en son teknolojiye sahip sonuçları elde eder.
- Parametre Verimliliği: Önemli ölçüde daha az parametre kullanarak eski modellerle karşılaştırılabilir performans sunar ve çıkarım sırasında bellek gereksinimlerini azaltır.
- Bilgi Koruma: Gradyan akışındaki teorik iyileştirmeler daha iyi yakınsama ve özellik temsiline yol açar.
- Zayıflıklar:
- Eğitim Karmaşıklığı: Eğitim sırasında kullanılan (ve çıkarım için kaldırılan) yardımcı dallar, daha basit mimarilere kıyasla eğitim aşamasında GPU bellek kullanımını artırabilir.
YOLOv9 hakkında daha fazla bilgi edinin
YOLOv7: Bedava Çanta Standardı
YOLOv9'dan önce, YOLOv7YOLO ailesinin hüküm süren şampiyonuydu. Çıkarım maliyetlerini artırmadan eğitim sürecini optimize etmeye odaklanan mimari iyileştirmeler getirdi, bu kavram "bedava torba" olarak bilinir.
Yazarlar Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
Organizasyon: Bilgi Bilimleri Enstitüsü, Academia Sinica
Tarih: 2022-07-06
Arxiv:2207.02696
GitHub:WongKinYiu/yolov7
Dokümanlar:Ultralytics YOLOv7
Mimari Genel Bakış
YOLOv7 , ağın öğrenme kabiliyetini geliştirmek için en kısa ve en uzun gradyan yollarını kontrol eden E-ELAN'ı (Genişletilmiş Verimli Katman Toplama Ağı) tanıttı. Ayrıca, ağın derinliğini ve genişliğini aynı anda değiştirerek farklı hedef cihazlar için en uygun mimariyi sağlayan model ölçeklendirme tekniklerini kullanmıştır.
Güçlü ve Zayıf Yönler
- Güçlü Yönler:
- Kanıtlanmış Güvenilirlik: Birkaç yıl boyunca kapsamlı topluluk kullanımı ve doğrulama, onu eski sistemler için istikrarlı bir seçim haline getirir.
- Yüksek Hız: Standart GPU donanımında gerçek zamanlı çıkarım için özel olarak optimize edilmiştir.
- Zayıflıklar:
- Daha Düşük Verimlilik: YOLOv9 gibi daha yeni modellerin doğruluk seviyelerine uymak için daha fazla parametre ve FLOP gerektirir. YOLO11 daha hafif mimarilerle başarabilir.
- Eski Araçlar: Modern Ultralytics ekosisteminde bulunan bazı yerel entegrasyonlardan ve kullanım kolaylığı özelliklerinden yoksundur.
YOLOv7 hakkında daha fazla bilgi edinin
İdeal Kullanım Örnekleri ve Uygulamalar
Bu iki model arasındaki seçim genellikle dağıtım ortamının özel kısıtlamalarına ve görevin gerekli hassasiyetine bağlıdır.
YOLOv9 Ne Zaman Seçilmeli
YOLOv9 , en yüksek doğruluk-verimlilik oranı gerektiren senaryolar için mükemmeldir.
- Otonom Navigasyon: Sürücüsüz araçlarda, uzun mesafelerdeki küçük nesneleri tespit etmek kritik önem taşır. YOLOv9'un bilgileri koruma yeteneği uzaktaki tehlikeleri tanımaya yardımcı olur.
- Tıbbi Görüntüleme: Pozitif bir tespiti kaçırmanın kritik olduğu tümör tespiti gibi görevler için YOLOv9 'un yüksek geri çağırma ve doğruluğu faydalıdır.
- Uç Cihazlar:
yolov9tvaryantı aşağıdakiler için sağlam bir çözüm sağlar IoT cihazları Raspberry Pis gibi, minimum hesaplama yükü ile iyi doğruluk sunar.
YOLOv7 Ne Zaman Seçilmeli
YOLOv7 , mimarisi için zaten optimize edilmiş olan mevcut boru hatları için geçerliliğini korumaktadır.
- Eski Sistemler: Kalite kontrol için YOLOv7 'yi doğrulamış olan endüstriyel üretim hatları, hemen yükseltme yapmak yerine tutarlılığı korumayı tercih edebilir.
- Araştırma Temelleri: Yeni tespit stratejilerini akademik araştırmalardaki yerleşik standartlarla karşılaştırmak için mükemmel bir ölçüt görevi görür.
Ultralytics ile Performans Dengesi
YOLOv9 ve YOLOv7 güçlü olsa da, hız, doğruluk ve geliştirici deneyimi arasında en üst düzeyde denge arayan geliştiriciler şunları göz önünde bulundurmalıdır Ultralytics YOLO11. YOLO11 , önceki nesillerin en iyi özelliklerini kolaylaştırılmış bir API ile entegre ederek algılama, segmentasyon, poz tahmini ve sınıflandırmayı tek bir çerçevede destekler.
Ultralytics Avantajı
Bu modelleri Ultralytics ekosistemi içinde kullanmak, ham araştırma havuzlarını kullanmaya göre belirgin avantajlar sağlar. Ultralytics Python API'si, karmaşık şablon kodlarını soyutlayarak araştırmacıların ve mühendislerin verilere ve sonuçlara odaklanmasına olanak tanır.
- Kullanım Kolaylığı: Birleştirilmiş bir arayüz, tek bir kod satırıyla YOLOv8, YOLOv9 ve YOLO11 arasında geçiş yapmanızı sağlar.
- Eğitim Verimliliği: Ultralytics modelleri daha hızlı yakınsama için optimize edilmiştir ve yüksek doğruluğa ulaşmak için genellikle daha az eğitim verisi gerektirir.
- Bellek Gereksinimleri: Çerçeve, CUDA bellek kullanımını en aza indirecek şekilde tasarlanmıştır ve bellek ağırlıklı Transformer modellerine kıyasla tüketici sınıfı donanımlarda daha büyük parti boyutlarının eğitilmesine olanak tanır.
- Çok yönlülük: Ekosistem, basit sınırlayıcı kutuların ötesinde örnek segmentasyonu, poz tahmini ve Yönlendirilmiş Sınırlayıcı Kutu (OBB ) görevlerini destekleyerek çeşitli yapay zeka zorlukları için kapsamlı bir araç haline gelir.
Uygulama Örneği
Ultralytics kütüphanesi ile bu modelleri çalıştırmak kolaydır. Aşağıdaki kod parçacığı, önceden eğitilmiş bir modelin nasıl yükleneceğini ve bir görüntü üzerinde çıkarımın nasıl çalıştırılacağını göstermektedir.
from ultralytics import YOLO
# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")
# Run inference on a local image
results = model.predict("path/to/image.jpg", save=True, conf=0.5)
# Process results
for result in results:
result.show() # Display predictions
Özel veri kümeleri üzerinde eğitim almak isteyenler için, çerçevede yerleşik olarak bulunan sağlam hiperparametre ayarlama ve veri artırma stratejilerini kullanarak süreç eşit derecede basittir.
# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
Sonuç
Hem YOLOv9 hem de YOLOv7 bilgisayarla görme alanında önemli başarıları temsil etmektedir. YOLOv9 yenilikçi PGI ve GELAN mimarileri sayesinde üstün parametre verimliliği ve doğruluğu sunan açık bir teknik haleftir. Belirli Wang ve ark. araştırma serisinden yüksek performans arayan kullanıcılar için önerilen seçimdir.
Ancak, en bütünsel yapay zeka geliştirme deneyimini arayan geliştiriciler için, Ultralytics YOLO11 en iyi tavsiye olmaya devam ediyor. Aktif bakımı, kapsamlı dokümantasyonu ve çok modlu görevler için geniş desteği ile YOLO11 , projelerinizin geleceğe dönük ve üretime hazır olmasını sağlar.
Diğer Modelleri İnceleyin
Nesne algılama ortamına ilişkin anlayışınızı daha da genişletmek için bu ilgili modelleri ve karşılaştırmaları incelemeyi düşünün:
- YOLO11 vs. YOLOv9 - En son Ultralytics modelini YOLOv9 ile karşılaştırın.
- YOLOv8 vs. YOLOv7 - Önceki neslin ne durumda olduğunu görün.
- RT-DETR vs. YOLOv9 - CNN'lere karşı Transformatör tabanlı algılamaya bir bakış.
- YOLOv10 - Gerçek zamanlı, uçtan uca nesne algılama modelini keşfedin.
- Ultralytics HUB - Modellerinizi eğitmenin ve dağıtmanın en kolay yolu.