YOLOv9 YOLOv7: En Son Teknoloji Nesne Algılama Teknolojisinin Evrimini Keşfetmek

Hızla gelişen bilgisayar görme alanında, verimli ve doğru uygulamalar geliştirmek için en son mimarilerle güncel kalmak çok önemlidir. Bu karşılaştırma, YOLO You Only Look Once) serisinin iki önemli dönüm noktasını ele almaktadır: YOLOv9, 2024'ün başlarında yeni gradyan optimizasyon teknikleriyle tanıtılan ve YOLOv7, 2022'nin gerçek zamanlı algılama standardı. Her iki model de nesne algılama alanını şekillendirmiş ve araştırmacılar ve geliştiriciler için benzersiz avantajlar sunmuştur.

Performans Kıyaslaması

Aşağıdaki tablo, COCO YOLOv9 YOLOv7 performans ölçütlerini göstermektedir. YOLOv7 , 2022 yılında hız ve doğruluk açısından yüksek bir çıta YOLOv7 , YOLOv9 , özellikle parametre verimliliği açısından bu sınırları daha da ileriye taşıyan mimari iyileştirmeler YOLOv9 .

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20.0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

YOLOv9: Programlanabilir Gradyan Bilgisi

YOLOv9 , derin öğrenme mimarilerinin bilgi akışını yönetme biçiminde bir değişimi YOLOv9 . Şubat 2024'te Chien-Yao Wang ve Hong-Yuan Mark Liao tarafından piyasaya sürülen bu mimari, verilerin derin katmanlardan geçerken kaybolduğu "bilgi darboğazı" sorununu ele alıyor.

Temel Mimari Yenilikler

YOLOv9 temel yeniliği PGI (Programlanabilir Gradyan Bilgisi) YOLOv9 . PGI, ana dalın eğitim süreci boyunca kritik özellik bilgilerini korumasını sağlayan yardımcı bir denetim çerçevesi sunar. Bu, CSPNet gibi önceki yöntemlerin ötesinde parametre kullanımını optimize eden GELAN (Genelleştirilmiş Verimli Katman Toplama Ağı) mimarisi ile tamamlanır.

Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
Kuruluş:Institute of Information Science, Academia Sinica
Tarih: 21 Şubat 2024
Bağlantılar:Arxiv, GitHub

YOLOv9 hakkında daha fazla bilgi edinin.

YOLOv7: Eğitilebilir "Bag-of-Freebies"

YOLOv7 Temmuz 2022'de piyasaya sürüldüğünde en hızlı ve en doğru gerçek zamanlı nesne algılayıcı olarak YOLOv7 . Tahmin maliyetini artırmadan doğruluğu artıran birkaç "bag-of-freebies" optimizasyon yöntemi getirmiştir.

Temel Mimari Yenilikler

YOLOv7 , ağın en kısa ve en uzun gradyan yollarını kontrol ederek daha çeşitli özellikleri öğrenmesini sağlayan E-ELAN (Genişletilmiş Verimli Katman Toplama Ağı) üzerine YOLOv7 . Ayrıca, derinliği ve genişliği aynı anda ayarlayan model ölçeklendirme tekniklerinde öncü olmuştur, bu da onu farklı donanım kısıtlamalarına son derece uyumlu hale getirmiştir.

Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
Kuruluş:Institute of Information Science, Academia Sinica
Tarih: 6 Temmuz 2022
Bağlantılar:Arxiv, GitHub

YOLOv7 hakkında daha fazla bilgi edinin.

Karşılaştırmalı Analiz: Mimari ve Kullanım Alanları

Hassasiyet ve Özellik Korunması

YOLOv9 YOLOv7 küçük veya örtülü nesnelerin algılanmasını gerektiren YOLOv7 YOLOv9 YOLOv7 daha iyi performans gösterir. PGI çerçevesi, gradyanların seyreltilmemesini sağlar, bu da küçük bir anomaliyi gözden kaçırmanın kritik öneme sahip olabileceği tıbbi görüntü analizinde özellikle faydalıdır. YOLOv7 , genel amaçlı algılama için sağlam bir seçenek YOLOv7 , ancak çok derin ağlarda aşırı bilgi darboğazlarında biraz daha zorlanabilir.

Çıkarım Hızı ve Verimlilik

Her iki model de gerçek zamanlı uygulamalar için tasarlanmış olsa da, YOLOv9 parametreler ve doğruluk arasında daha iyi bir denge YOLOv9 . Örneğin, YOLOv9c, YOLOv7x ile benzer bir doğruluk elde eder, ancak önemli ölçüde daha az parametre (25,3 milyon karşı 71,3 milyon) ve FLOP kullanır. Bu, YOLOv9 , kenar AI kameraları gibi bellek bant genişliğinin kısıtlı olduğu cihazlarda kullanıma YOLOv9 uygun hale getirir.

Dağıtım Esnekliği

Ultralytics taşınabilirlikleriyle ünlüdür. Hem YOLOv9 YOLOv7 , aşağıdaki formatlara kolayca YOLOv7 ONNX ve TensorRTUltralytics kolaycaPython araştırmadan üretime giden yolu kolaylaştırır.

Eğitim Verimliliği

Ultralytics en büyük avantajı, eğitim sırasında bellek kullanımının optimize edilmesidir. Ultralytics yerel olarak entegre edilen YOLOv9, verimli veri yükleyiciler ve bellek yönetiminden yararlanır. Bu, geliştiricilerin, transformatör ağırlıklı mimarilerde veya optimize edilmemiş depolarda sıkça görülen Bellek Dışı (OOM) hatalarıyla karşılaşmadan, tüketici sınıfı GPU'larda (ör. RTX 3060 veya 4070) rekabetçi modeller eğitmelerine olanak tanır.

Gerçek Dünya Uygulamaları

Bu modeller arasındaki seçim genellikle özel dağıtım ortamına bağlıdır.

Otonom Araçlar:YOLOv7otonom sürüş senaryolarında kapsamlı bir şekilde test edilmiş ve yüksek kare hızlarında yayaları ve trafik işaretlerini algılama konusunda güvenilirliğini kanıtlamıştır.
Sağlık Görüntüleme:YOLOv9 , derin katmanlar aracılığıyla ince ayrıntıları korumak çok önemli olan tümör veya kırık tespiti gibi tıbbi görüntülemede üstün performans gösterir.
Perakende Analitiği: Envanter yönetimi için, YOLOv9 , üstün özellik entegrasyon yeteneklerinden yararlanarak raflarda yoğun bir şekilde yerleştirilmiş ürünleri saymak için yüksek doğruluk sağlar.
Akıllı Şehirler: Trafik izleme sistemleri YOLOv7'nin kanıtlanmış kararlılığı ve hızından yararlanır. Bu özellikler, gerçek zamanlı trafik yönetimi için çok önemlidir.

Ultralytics'in Avantajı

Ultralytics ekosisteminde her iki modeli de kullanmak, bağımsız uygulamalara göre belirgin avantajlar sağlar:

Kullanım Kolaylığı: Birleşik API, tek bir kod satırı ile YOLOv7, YOLOv9 ve daha yeni modeller arasında geçiş yapmanızı sağlar.
İyi Bakımlı Ekosistem: Aktif topluluk desteği ve sık güncellemeler, en son sürümlerle uyumluluğu garanti eder. PyTorch sürümleri ve CUDA ile uyumluluğu sağlar.
Çok yönlülük: Algılama ötesinde, Ultralytics örnek segmentasyonu, poz tahmini ve yönlendirilmiş sınırlayıcı kutu (OBB) görevlerini destekleyerek, yeni araçlar öğrenmeden projenizin kapsamını genişletmenize olanak tanır.

Kod Örneği: Ultralytics ile Eğitim

Her iki modelin eğitimi de sorunsuzdur. Özel bir veri kümesinde YOLOv9 nasıl eğitebileceğiniz aşağıda açıklanmıştır:

from ultralytics import YOLO

# Load a model (YOLOv9c or YOLOv7)
model = YOLO("yolov9c.pt")  # or "yolov7.pt"

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model
model.val()

YOLO26 ile Geleceğe Hazırlık

YOLOv9 YOLOv7 güçlü araçlar YOLOv7 de, bu alan hızla gelişmektedir. Ocak 2026'da piyasaya sürülen en son YOLO26, bilgisayar görüşünün en son teknolojisini temsil etmektedir.

YOLO26, daha basit dağıtım için sonradan işleme gecikmesini ortadan kaldıran, yerel uçtan uca NMS bir tasarıma sahiptir. Daha iyi kenar uyumluluğu için Dağıtım Odak Kaybını (DFL) ortadan kaldırır ve benzeri görülmemiş bir istikrar için LLM eğitiminden esinlenen SGD Muon'un bir karışımı olan MuSGD optimizasyon aracınısunar. ProgLoss + STAL gibi özel kayıp fonksiyonları ile YOLO26, küçük nesnelerin tanınmasını önemli ölçüde iyileştirir ve yeni yüksek performanslı uygulamalar için önerilen seçim haline gelir.

YOLO26 hakkında daha fazla bilgi edinin

Diğer seçenekleri araştıranlar için, YOLO11 ve RT-DETR gibi modeller de Ultralytics içindeki belirli kullanım durumları için benzersiz avantajlar sunar.

YOLOv9 YOLOv7: En Son Teknoloji Nesne Algılama Teknolojisinin Evrimini Keşfetmek

Performans Kıyaslaması

YOLOv9: Programlanabilir Gradyan Bilgisi

Temel Mimari Yenilikler

YOLOv7: Eğitilebilir "Bag-of-Freebies"

Temel Mimari Yenilikler

Karşılaştırmalı Analiz: Mimari ve Kullanım Alanları

Hassasiyet ve Özellik Korunması

Çıkarım Hızı ve Verimlilik

Eğitim Verimliliği

Gerçek Dünya Uygulamaları

Ultralytics'in Avantajı

Kod Örneği: Ultralytics ile Eğitim

YOLO26 ile Geleceğe Hazırlık

Yorumlar