YOLOv9 YOLOv5: Nesne Algılamada Mimari Evrim ve Miras

YOLO You Only Look Once) ailesinin evrimi, bilgisayar görüşünün ilerlemesinin büyüleyici bir zaman çizelgesini temsil ediyor. YOLOv5, 2020 Ultralytics tarafından piyasaya sürüldü ve kullanım kolaylığı ve üretim hazırlığı açısından yeni bir standart oluşturarak, dünya çapındaki geliştiriciler için vazgeçilmez bir çerçeve haline geldi. YOLOv9, Academia Sinica'daki araştırmacılar tarafından 2024 yılında piyasaya sürüldü ve Programlanabilir Gradyan Bilgisi (PGI) gibi kavramlarla teorik mimarinin sınırlarını zorluyor.

Bu karşılaştırma, YOLOv5 savaşta kanıtlanmış güvenilirliğinin YOLOv9 mimari yenilikleriyle nasıl YOLOv5 inceleyerek, hangi modelin bilgisayar görme ihtiyaçlarınıza uygun olduğuna karar vermenize yardımcı olur.

Performans Metrikleri Karşılaştırması

Aşağıdaki tablo, iki modeli çeşitli boyutlarda karşılaştırmaktadır. YOLOv9 teorik doğruluk (mAP) açısından daha yüksek YOLOv9 halde, YOLOv5 hız ve kaynak verimliliği açısından, özellikle eski sürümlerde, rekabet gücünü YOLOv5 unutulmamalıdır.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20.0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

YOLOv5n	640	28.0	73.6	1.12	2.6	7.7
YOLOv5s	640	37.4	120.7	1.92	9.1	24.0
YOLOv5m	640	45.4	233.9	4.03	25.1	64.2
YOLOv5l	640	49.0	408.4	6.61	53.2	135.0
YOLOv5x	640	50.7	763.2	11.89	97.2	246.4

YOLOv5: Üretim Yapay Zekası için Standart

Ultralytics tarafından 2020 yılında piyasaya sürüldüğünden beri, YOLOv5 pratik AI dağıtımının eş anlamlısı haline geldi. Bu sadece bir model mimarisi değil, tam bir ekosistem dönüşümüydü. YOLOv5 önce, nesne algılama modellerinin eğitimi genellikle karmaşık yapılandırma dosyaları ve kırılgan C tabanlı çerçeveler gerektiriyordu. YOLOv5 , eğitimi tek bir komut kadar basit hale getiren yerel bir PyTorch YOLOv5 .

Yazar:Glenn Jocher
Kuruluş:Ultralytics
Tarih: Haziran 2020
GitHub:ultralytics/yolov5

YOLOv5 hakkında daha fazla bilgi edinin.

YOLOv5'in Temel Güçlü Yönleri

Eşsiz Kullanım Kolaylığı: Ultralytics en önemli özelliği kullanıcı deneyimidir. YOLOv5 , veri setinin hazırlanmasından dağıtımına kadar kesintisiz bir iş akışı YOLOv5 .
Geniş Platform Desteği: Aşağıdakiler için yerel dışa aktarım desteği sunar CoreML, TFLiteve ONNX için yerel dışa aktarım desteği sunarak mobil ve uç uygulamalar için inanılmaz derecede çok yönlü hale getirir.
Düşük Kaynak Yükü: Büyük GPU gerektiren transformatör ağırlıklı mimarilerin aksine, YOLOv5 son derece YOLOv5 ve tüketici donanımlarında veya hatta Google gibi ücretsiz bulut dizüstü bilgisayarlarında eğitim yapılmasına olanak tanır.
Kararlılık: Yıllar süren aktif bakım çalışmaları sonucunda, sınır durumlar çözülmüş ve akıllı üretim ve güvenlik alanlarında görev açısından kritik uygulamalar için kararlı bir platform sağlanmıştır.

Kullanım Kolaylığı Örneği

YOLOv5 veya herhangi bir Ultralytics ) ile çıkarım yapma işlemi standartlaştırılmış ve basittir:

from ultralytics import YOLO

# Load a pretrained YOLOv5s model
model = YOLO("yolov5s.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Show results
results[0].show()

YOLOv9: PGI ile Mimari Yenilik

2024 yılının başında piyasaya sürülen YOLOv9 derin sinir ağlarındaki bilgi darboğazı sorununu çözmeye odaklanıyor. Ağlar derinleştikçe, ileri besleme sürecinde kritik özellik bilgileri kaybolabilir. YOLOv9 , Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) ile bu sorunu YOLOv9 .

Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
Kuruluş:Institute of Information Science, Academia Sinica
Tarih: Şubat 2024
Arxiv:YOLOv9: Programlanabilir Gradyan Bilgisi Kullanarak Ne Öğrenmek İstediğinizi Öğrenme
GitHub:WongKinYiu/yolov9

YOLOv9 hakkında daha fazla bilgi edinin.

Mimari Atılımlar

GELAN Mimarisi: Bu yeni mimari, parametre verimliliğini en üst düzeye çıkarmak için CSPNet ( YOLOv5 kullanılır) ve ELAN ( YOLOv7 kullanılır) mimarilerinin en iyi özelliklerini bir araya getirir. Modelin, eski mimarilere kıyasla daha az parametre ile daha yüksek doğruluk elde etmesini sağlar.
Programlanabilir Gradyan Bilgisi (PGI): PGI, yalnızca eğitim sırasında kullanılan bir yardımcı dal aracılığıyla güvenilir gradyanlar oluşturur. Bu, derin katmanların çıkarım maliyetini artırmadan anlamsal bilgileri korumalarını sağlar ve küçük nesneleri algılama gibi zor görevlerde performansı artırır.

Karşılaştırma Analizi: Hangisini Ne Zaman Kullanmalı?

Bu iki model arasında seçim yapmak, önceliğinize bağlıdır: dağıtım hızı mı yoksa maksimum doğruluk mu?

1. Eğitim Verimliliği ve Ekosistem

YOLOv5 ekosistem olgunluğu açısından üstündür. Binlerce üçüncü taraf araca entegre edilmiştir ve büyük bir topluluk desteğine sahiptir. Bugün minimum sürtünmeyle bir model dağıtmanız gerekiyorsa, YOLOv5 veya daha yeni olan YOLO11) genellikle daha güvenli bir seçimdir.

YOLOv9Ultralytics tam olarak desteklenmektedir, yani kullanıcılar aynı basitleştirilmiş eğitim süreçlerinden yararlanabilirler. Ancak, karmaşık mimarisi (yardımcı dallar) bazen eğitimi yavaşlatabilir ve akıcı YOLOv5 göre biraz daha fazla bellek kullanımı gerektirebilir.

2. Kenar Dağıtımı ve Sunucu Doğruluğu

Çevrimdışı tıbbi görüntü analizi veya yüksek hassasiyetli endüstriyel denetim gibi tamamen doğruluk odaklı görevlerde YOLOv9e, YOLOv5x'i önemli ölçüde geride bırakarak %5'lik bir mAP sağlar.

Ancak, Raspberry Pi veya NVIDIA gibi uç cihazlar için YOLOv5 hala en çok tercih edilen seçenek olmaya devam ediyor. Daha basit mimarisi, int8 nicelemeye iyi uyum sağlar ve kısıtlı donanımlarda genellikle daha hızlı çıkarım hızları sağlar, ancak YOLO26 gibi daha yeni modeller bu niş pazarda hızla onun yerini almaktadır.

3. Görev Çok Yönlülüğü

Her iki model de çok yönlüdür, ancak Ultralytics , basit algılamanın ötesinde çok çeşitli görevleri desteklemelerini sağlar:

Örnek Segmentasyonu: Hassas piksel düzeyinde maskeler.
Sınıflandırma: Tüm görüntünün etiketlenmesi.
Poz Tahmini: İnsan aktivitesi tanıma için kilit noktaların izlenmesi.
OBB: Hava görüntülerine yönelik yönlendirilmiş sınırlayıcı kutular.

Gelecek: YOLO26

YOLOv5 YOLOv9 mükemmel modeller YOLOv9 da, bu alan hızla gelişmektedir. En son teknolojiyi arayan geliştiriciler YOLO26'yı tercih etmelidir.

2026 yılının Ocak ayında piyasaya NMS ülen YOLO26, bu mimari gelişmelerin doruk noktasını temsil ediyor. İlk olarak YOLOv10tarafından popüler hale getirilen uçtan uca NMS-Free tasarımını benimser ve gecikme süresi uzun olan Non-Maximum Suppression adımını tamamen ortadan kaldırır. Ayrıca, SGD Muon'un bir karışımı olan MuSGD Optimizer özelliği ile daha hızlı yakınsama ve kararlılık sağlar.

Küçük nesne algılama için ProgLoss + STAL gibi iyileştirmeler ve daha basit dışa aktarım için Dağıtım Odak Kaybı (DFL) özelliğinin kaldırılmasıyla YOLO26, önceki nesillere göre %43'e kadar daha hızlı CPU sunarak hem araştırma hem de üretim için üstün bir seçim haline geliyor.

YOLO26 hakkında daha fazla bilgi edinin

Sonuç

Eski sistemler veya yeni operatör desteğinin ( YOLOv9 gibi) eksik olabileceği aşırı kaynak kısıtlamaları için hafif, savaşta test edilmiş bir modele ihtiyacınız varsa YOLOv5 seçin.
Zorlu veri kümelerinde yüksek doğruluk gerektiren ve biraz daha yüksek eğitim kaynağı maliyetlerini karşılayabilen durumlarda YOLOv9 seçin.
En iyisini seçmek için YOLO26'yı tercih edin: NMS hız, üst düzey doğruluk ve MuSGD optimizer gibi yeni nesil özellikler.

Bu modellerden herhangi birini kullanmaya başlamak için Ultralytics kullanarak veri kümelerinizi yönetebilir, bulutta eğitim verebilir ve zahmetsizce dağıtım yapabilirsiniz.

Başlarken

Ultralytics Python kullanarak bu modellerden herhangi birini eğitebilirsiniz. Komut dosyanızdaki model adını değiştirmeniz yeterlidir:

from ultralytics import YOLO

# Switch between models easily
model = YOLO("yolov5su.pt")  # YOLOv5
# model = YOLO("yolov9c.pt") # YOLOv9
# model = YOLO("yolo26n.pt") # YOLO26

# Train on your data
model.train(data="coco8.yaml", epochs=100)