YOLOv9 ile YOLOv5: Modern Nesne Algılamaya Teknik Bir Bakış

Bilgisayarlı görü alanı, nesne algılamanın sayısız endüstriyel ve araştırma uygulamasında temel oluşturmasıyla muazzam bir büyüme kaydetti. Doğru mimariyi seçmek; genellikle mAP (ortalama Hassasiyet), çıkarım hızı ve bellek yükünün dikkatli bir şekilde değerlendirilmesini gerektirir. Bu karşılaştırmada, iki oldukça etkili modeli inceliyoruz: gradyan bilgisi tutmadaki mimari atılımlarıyla kutlanan YOLOv9 ve inanılmaz kullanım kolaylığı ve benzersiz dağıtım çok yönlülüğü ile bilinen, sahada test edilmiş endüstri standardı Ultralytics YOLOv5.

Mimari Yenilikler ve Teknik Kökenler

Bu iki modelin altında yatan mekanikleri anlamak, performans profilleri için kritik bir bağlam sağlar.

YOLOv9: Programlanabilir Gradyan Bilgisi

Tayvan'daki Academia Sinica Bilgi Bilimleri Enstitüsü'nden araştırmacılar Chien-Yao Wang ve Hong-Yuan Mark Liao tarafından geliştirilen YOLOv9, 21 Şubat 2024'te piyasaya sürüldü. Model, derin sinir ağlarında yaygın olan bilgi darboğazını ele almak için iki çığır açan kavram sunar: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN).

PGI kullanarak, YOLOv9 hayati bilgilerin ileri besleme süreci boyunca korunmasını sağlar ve bu da oldukça doğru gradyan güncellemelerine yol açar. Bu arada, GELAN mimarisi parametre verimliliğini en üst düzeye çıkararak modelin şaşırtıcı derecede düşük hesaplama yüküyle en son teknoloji doğruluğuna ulaşmasını sağlar. Teknik detayları resmi YOLOv9 Arxiv makalesinde inceleyebilir veya YOLOv9 GitHub deposuna göz atabilirsin.

YOLOv9 hakkında daha fazla bilgi edin

Ultralytics YOLOv5: Üretim Standardı

Glenn Jocher tarafından yazılan ve 26 Haziran 2020'de Ultralytics tarafından yayınlanan YOLOv5, bilgisayarlı görü erişilebilirliğinde devrim yarattı. PyTorch çerçevesi üzerinde yerel olarak oluşturulan ilk nesne algılama modellerinden biri olarak, eski Darknet C-çerçevesinin karmaşıklıklarını aştı. YOLOv5, hız ve doğruluk arasında sorunsuz bir dengeye öncelik vererek oldukça optimize edilmiş bir CSPNet omurgası ve bir PANet boyun yapısından yararlanır.

Ancak en büyük başarısı, daha geniş Ultralytics ekosistemine entegrasyonudur. YOLOv5, hızlı eğitim verimliliği ve düşük bellekli ortamlar için yoğun bir şekilde optimize edilmiştir, bu da onu uç dağıtımlar için son derece kararlı hale getirir.

YOLOv5 hakkında daha fazla bilgi edin

Bellek Verimliliği

Uç cihazlar için modelleri değerlendirirken, Ultralytics YOLO modellerinin genellikle ağır Transformer tabanlı mimarilere kıyasla hem eğitim hem de çıkarım sırasında önemli ölçüde daha az GPU belleği talep ettiğini unutma.

Performans Analizi: Hız vs. Doğruluk

Bir bilgisayarlı görü hattı tasarlarken, geliştiriciler hassasiyet ve gecikme arasındaki ödünleşimleri tartmalıdır. Aşağıdaki tablo, standart COCO veri kümesi üzerindeki performans farklılıklarını göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Ödünleşimleri Analiz Etme

YOLOv9, ham hassasiyette mutlak hakimiyet kurar. YOLOv9e, ince taneli ayrıntıları korumak için GELAN katmanlarını kullanarak mAP'yi %55,6'ya çıkarır. Bu, onu tıbbi görüntüleme veya küçük nesnelerde titiz doğruluk gerektiren senaryolar için olağanüstü bir seçim haline getirir.

Buna karşılık, YOLOv5 ham dağıtım hızı ve donanım esnekliği ile öne çıkar. YOLOv5n (Nano) oldukça hafiftir ve TensorRT aracılığıyla T4 GPU üzerinde sadece 1,12 ms'de çıkarım yapar. Eğer kısıtlı IoT cihazlarına, cep telefonlarına veya Raspberry Pi cihazlarına dağıtım yapıyorsan, YOLOv5'in bellek ayak izi onu son derece güvenilir kılar.

Ultralytics Ekosistem Avantajı

Bir model seçerken önemli bir husus, çevreleyen yazılım ekosistemidir. YOLOv9 en üst düzey araştırma kıyaslamaları sağlarken, her iki modeli de modern Ultralytics Python API aracılığıyla kullanmak aradaki boşluğu kapatarak geliştiricilere birleşik ve modern bir deneyim sunar.

Kullanım Kolaylığı ve Dışa Aktarma

Ultralytics, karmaşık mühendislik engellerini soyutlar. Otomatik veri artırma ve hiperparametre ayarlama gibi özellikler kutudan çıktığı gibi halledilir. Modelleri üretime taşımak, modelleri ONNX, OpenVINO veya TFLite formatlarına dönüştürmek için yerleşik dışa aktarma komutlarıyla eşit derecede kolaydır.

Görev Çok Yönlülüğü

Her iki model de nesne algılamada mükemmel olsa da, modern Ultralytics modelleri çeşitli bilgisayarlı görü zorluklarını aşmak için tasarlanmıştır. Daha geniş çerçeve; görüntü sınıflandırma, örnek bölümleme, poz tahmini ve yönlendirilmiş sınırlayıcı kutular (OBB) için yerel destek sağlayarak geliştiricilerin kod tabanlarını değiştirmeden birden fazla görü problemini çözmelerine olanak tanır.

Kullanım Durumları ve Öneriler

YOLOv9 ve YOLOv5 arasında seçim yapmak; özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

Ne Zaman YOLOv9 Seçilmeli

YOLOv9 şunlar için güçlü bir tercihtir:

  • Bilgi Darboğazı Araştırması: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN) mimarilerini inceleyen akademik projeler.
  • Gradyan Akışı Optimizasyon Çalışmaları: Eğitim sırasında derin ağ katmanlarındaki bilgi kaybını anlama ve azaltmaya odaklanan araştırmalar.
  • Yüksek Doğruluklu Algılama Kıyaslaması: YOLOv9'un güçlü COCO kıyaslama performansının mimari karşılaştırmalar için referans noktası olarak gerektiği senaryolar.

Ne Zaman YOLOv5 Seçilmeli

YOLOv5 şunlar için önerilir:

  • Kanıtlanmış Üretim Sistemleri: YOLOv5'in uzun istikrar geçmişine, kapsamlı dokümantasyonuna ve devasa topluluk desteğine değer verilen mevcut dağıtımlar.
  • Kaynak Kısıtlı Eğitim: YOLOv5'in verimli eğitim hattının ve daha düşük bellek gereksinimlerinin avantajlı olduğu, sınırlı GPU kaynağına sahip ortamlar.
  • Kapsamlı Dışa Aktarma Formatı Desteği: ONNX, TensorRT, CoreML ve TFLite dahil olmak üzere birçok formatta dağıtım gerektiren projeler.

Ne Zaman Ultralytics (YOLO26) Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Uygulama Örneği

Ultralytics ekosisteminin güzelliği, ağırlık dizesini değiştirerek bir YOLOv5 modeli ile bir YOLOv9 modeli arasında kolayca geçiş yapabilmendir.

from ultralytics import YOLO

# Load a pretrained YOLOv9 model (swap to "yolov5s.pt" to use YOLOv5)
model = YOLO("yolov9c.pt")

# Train the model efficiently on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on new images
predictions = model.predict("https://ultralytics.com/images/zidane.jpg")

# Export to ONNX for seamless deployment
model.export(format="onnx")

Daha Yeni Mimarileri Keşfetme

YOLOv5 ve YOLOv9 belirgin avantajlara sahip mükemmel modeller olsa da, alan ilerlemeye devam ediyor. Yeni projeler keşfeden kullanıcılar, Ultralytics'in en son sürümlerini de değerlendirmek isteyebilir.

  • YOLO11: Tüm görü görevlerinde mükemmel hız-doğruluk dengesi sunan, YOLOv8 soyunun güçlü, rafine bir evrimi.
  • YOLO26: 2026'da piyasaya sürülen YOLO26, modern hatlar için nihai öneridir. İşlem sonrası darboğazlarını tamamen ortadan kaldıran Uçtan Uca NMS'siz Tasarımı tanıtır. DFL Kaldırma (basitleştirilmiş dışa aktarma ve daha iyi uç/düşük güç cihaz uyumluluğu için Dağılımsal Odak Kaybı kaldırılmıştır) ile %43'e kadar daha hızlı CPU çıkarımı sağlar. Yeni MuSGD Optimizer sayesinde eğitim kararlılığı süperşarjlıdır ve ProgLoss + STAL, küçük nesne tanımasında önemli iyileştirmelerle daha iyi kayıp işlevleri sunar; bu da onu hem uç hem de bulut dağıtımları için en sağlam mimari haline getirir ve IoT, robotik ve hava görüntülemesi için kritiktir.

Büyük veri kümelerini ve karmaşık dağıtım hatlarını yöneten ekipler için Ultralytics Platform kullanımı, bu en gelişmiş modelleri zahmetsizce eğitmek, izlemek ve dağıtmak için kod gerektirmeyen bir çözüm sunar.

Yorumlar