YOLOv9 YOLOv7: En Son Teknoloji Nesne Algılama Teknolojisinin Evrimini Keşfetmek
Hızla gelişen bilgisayar görme alanında, verimli ve doğru uygulamalar geliştirmek için en son mimarilerle güncel kalmak çok önemlidir. Bu karşılaştırma, YOLO You Only Look Once) serisinin iki önemli dönüm noktasını ele almaktadır: YOLOv9, 2024'ün başlarında yeni gradyan optimizasyon teknikleriyle tanıtılan ve YOLOv7, 2022'nin gerçek zamanlı algılama standardı. Her iki model de nesne algılama alanını şekillendirmiş ve araştırmacılar ve geliştiriciler için benzersiz avantajlar sunmuştur.
Performans Kıyaslaması
Aşağıdaki tablo, COCO YOLOv9 YOLOv7 performans ölçütlerini göstermektedir. YOLOv7 , 2022 yılında hız ve doğruluk açısından yüksek bir çıta YOLOv7 , YOLOv9 , özellikle parametre verimliliği açısından bu sınırları daha da ileriye taşıyan mimari iyileştirmeler YOLOv9 .
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv9: Programlanabilir Gradyan Bilgisi
YOLOv9 , derin öğrenme mimarilerinin bilgi akışını yönetme biçiminde bir değişimi YOLOv9 . Şubat 2024'te Chien-Yao Wang ve Hong-Yuan Mark Liao tarafından piyasaya sürülen bu mimari, verilerin derin katmanlardan geçerken kaybolduğu "bilgi darboğazı" sorununu ele alıyor.
Temel Mimari Yenilikler
YOLOv9 temel yeniliği PGI (Programlanabilir Gradyan Bilgisi) YOLOv9 . PGI, ana dalın eğitim süreci boyunca kritik özellik bilgilerini korumasını sağlayan yardımcı bir denetim çerçevesi sunar. Bu, CSPNet gibi önceki yöntemlerin ötesinde parametre kullanımını optimize eden GELAN (Genelleştirilmiş Verimli Katman Toplama Ağı) mimarisi ile tamamlanır.
- Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
- Kuruluş:Institute of Information Science, Academia Sinica
- Tarih: 21 Şubat 2024
- Bağlantılar:Arxiv, GitHub
YOLOv9 hakkında daha fazla bilgi edinin.
YOLOv7: Eğitilebilir "Bag-of-Freebies"
YOLOv7 Temmuz 2022'de piyasaya sürüldüğünde en hızlı ve en doğru gerçek zamanlı nesne algılayıcı olarak YOLOv7 . Tahmin maliyetini artırmadan doğruluğu artıran birkaç "bag-of-freebies" optimizasyon yöntemi getirmiştir.
Temel Mimari Yenilikler
YOLOv7 , ağın en kısa ve en uzun gradyan yollarını kontrol ederek daha çeşitli özellikleri öğrenmesini sağlayan E-ELAN (Genişletilmiş Verimli Katman Toplama Ağı) üzerine YOLOv7 . Ayrıca, derinliği ve genişliği aynı anda ayarlayan model ölçeklendirme tekniklerinde öncü olmuştur, bu da onu farklı donanım kısıtlamalarına son derece uyumlu hale getirmiştir.
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
- Kuruluş:Institute of Information Science, Academia Sinica
- Tarih: 6 Temmuz 2022
- Bağlantılar:Arxiv, GitHub
YOLOv7 hakkında daha fazla bilgi edinin.
Karşılaştırmalı Analiz: Mimari ve Kullanım Alanları
Hassasiyet ve Özellik Korunması
YOLOv9 YOLOv7 küçük veya örtülü nesnelerin algılanmasını gerektiren YOLOv7 YOLOv9 YOLOv7 daha iyi performans gösterir. PGI çerçevesi, gradyanların seyreltilmemesini sağlar, bu da küçük bir anomaliyi gözden kaçırmanın kritik öneme sahip olabileceği tıbbi görüntü analizinde özellikle faydalıdır. YOLOv7 , genel amaçlı algılama için sağlam bir seçenek YOLOv7 , ancak çok derin ağlarda aşırı bilgi darboğazlarında biraz daha zorlanabilir.
Çıkarım Hızı ve Verimlilik
Her iki model de gerçek zamanlı uygulamalar için tasarlanmış olsa da, YOLOv9 parametreler ve doğruluk arasında daha iyi bir denge YOLOv9 . Örneğin, YOLOv9c, YOLOv7x ile benzer bir doğruluk elde eder, ancak önemli ölçüde daha az parametre (25,3 milyon karşı 71,3 milyon) ve FLOP kullanır. Bu, YOLOv9 , kenar AI kameraları gibi bellek bant genişliğinin kısıtlı olduğu cihazlarda kullanıma YOLOv9 uygun hale getirir.
Dağıtım Esnekliği
Ultralytics taşınabilirlikleriyle ünlüdür. Hem YOLOv9 YOLOv7 , aşağıdaki formatlara kolayca YOLOv7 ONNX ve TensorRTUltralytics kolaycaPython araştırmadan üretime giden yolu kolaylaştırır.
Eğitim Verimliliği
Ultralytics en büyük avantajı, eğitim sırasında bellek kullanımının optimize edilmesidir. Ultralytics yerel olarak entegre edilen YOLOv9, verimli veri yükleyiciler ve bellek yönetiminden yararlanır. Bu, geliştiricilerin, transformatör ağırlıklı mimarilerde veya optimize edilmemiş depolarda sıkça görülen Bellek Dışı (OOM) hatalarıyla karşılaşmadan, tüketici sınıfı GPU'larda (ör. RTX 3060 veya 4070) rekabetçi modeller eğitmelerine olanak tanır.
Gerçek Dünya Uygulamaları
Bu modeller arasındaki seçim genellikle özel dağıtım ortamına bağlıdır.
- Otonom Araçlar:YOLOv7otonom sürüş senaryolarında kapsamlı bir şekilde test edilmiş ve yüksek kare hızlarında yayaları ve trafik işaretlerini algılama konusunda güvenilirliğini kanıtlamıştır.
- Sağlık Görüntüleme:YOLOv9 , derin katmanlar aracılığıyla ince ayrıntıları korumak çok önemli olan tümör veya kırık tespiti gibi tıbbi görüntülemede üstün performans gösterir.
- Perakende Analitiği: Envanter yönetimi için, YOLOv9 , üstün özellik entegrasyon yeteneklerinden yararlanarak raflarda yoğun bir şekilde yerleştirilmiş ürünleri saymak için yüksek doğruluk sağlar.
- Akıllı Şehirler: Trafik izleme sistemleri YOLOv7'nin kanıtlanmış kararlılığı ve hızından yararlanır. Bu özellikler, gerçek zamanlı trafik yönetimi için çok önemlidir.
Ultralytics'in Avantajı
Ultralytics ekosisteminde her iki modeli de kullanmak, bağımsız uygulamalara göre belirgin avantajlar sağlar:
- Kullanım Kolaylığı: Birleşik API, tek bir kod satırı ile YOLOv7, YOLOv9 ve daha yeni modeller arasında geçiş yapmanızı sağlar.
- İyi Bakımlı Ekosistem: Aktif topluluk desteği ve sık güncellemeler, en son sürümlerle uyumluluğu garanti eder. PyTorch sürümleri ve CUDA ile uyumluluğu sağlar.
- Çok yönlülük: Algılama ötesinde, Ultralytics örnek segmentasyonu, poz tahmini ve yönlendirilmiş sınırlayıcı kutu (OBB) görevlerini destekleyerek, yeni araçlar öğrenmeden projenizin kapsamını genişletmenize olanak tanır.
Kod Örneği: Ultralytics ile Eğitim
Her iki modelin eğitimi de sorunsuzdur. Özel bir veri kümesinde YOLOv9 nasıl eğitebileceğiniz aşağıda açıklanmıştır:
from ultralytics import YOLO
# Load a model (YOLOv9c or YOLOv7)
model = YOLO("yolov9c.pt") # or "yolov7.pt"
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model
model.val()
YOLO26 ile Geleceğe Hazırlık
YOLOv9 YOLOv7 güçlü araçlar YOLOv7 de, bu alan hızla gelişmektedir. Ocak 2026'da piyasaya sürülen en son YOLO26, bilgisayar görüşünün en son teknolojisini temsil etmektedir.
YOLO26, daha basit dağıtım için sonradan işleme gecikmesini ortadan kaldıran, yerel uçtan uca NMS bir tasarıma sahiptir. Daha iyi kenar uyumluluğu için Dağıtım Odak Kaybını (DFL) ortadan kaldırır ve benzeri görülmemiş bir istikrar için LLM eğitiminden esinlenen SGD Muon'un bir karışımı olan MuSGD optimizasyon aracınısunar. ProgLoss + STAL gibi özel kayıp fonksiyonları ile YOLO26, küçük nesnelerin tanınmasını önemli ölçüde iyileştirir ve yeni yüksek performanslı uygulamalar için önerilen seçim haline gelir.
YOLO26 hakkında daha fazla bilgi edinin
Diğer seçenekleri araştıranlar için, YOLO11 ve RT-DETR gibi modeller de Ultralytics içindeki belirli kullanım durumları için benzersiz avantajlar sunar.