İçeriğe geç

YOLOv9'a Karşı YOLOv5: Modern Nesne Tespitine Teknik Bir Derin Bakış

Bilgisayar görüşü alanı muazzam bir büyüme kaydetti; nesne tespiti sayısız endüstriyel ve araştırma uygulaması için omurga görevi görüyor. Doğru mimariyi seçmek genellikle ortalama kesinlik (mAP), çıkarım hızı ve bellek yükünün dikkatli bir şekilde değerlendirilmesini gerektirir. Bu karşılaştırmada, son derece etkili iki modeli inceliyoruz: gradyan bilgi tutmada mimari atılımlarıyla kutlanan YOLOv9 ve inanılmaz kullanım kolaylığı ve eşsiz dağıtım çok yönlülüğü ile bilinen, sahada kanıtlanmış endüstri standardı Ultralytics YOLOv5.

Mimari Yenilikler ve Teknik Kökenler

Bu iki modelin temel mekaniklerini anlamak, ilgili performans profilleri için kritik bir bağlam sağlar.

YOLOv9: Programlanabilir Gradyan Bilgisi

Tayvan'daki Academia Sinica Bilgi Bilimi Enstitüsü'nden araştırmacılar Chien-Yao Wang ve Hong-Yuan Mark Liao tarafından geliştirilen YOLOv9, 21 Şubat 2024'te piyasaya sürüldü. Model, derin sinir ağlarında yaygın olan bilgi darboğazını ele almak için iki çığır açan konsept sunuyor: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN).

PGI'yı kullanarak, YOLOv9 ileri besleme süreci boyunca hayati bilgilerin korunmasını sağlar, bu da son derece doğru gradyan güncellemelerine yol açar. Bu arada, GELAN mimarisi parametre verimliliğini en üst düzeye çıkararak modelin şaşırtıcı derecede düşük hesaplama yüküyle en son teknoloji doğruluğuna ulaşmasını sağlar. Teknik detayları resmi YOLOv9 Arxiv makalesinde inceleyebilir veya YOLOv9 GitHub deposunu görüntüleyebilirsiniz.

YOLOv9 hakkında daha fazla bilgi edinin.

Ultralytics YOLOv5: Üretim Standardı

Glenn Jocher tarafından yazılan ve Ultralytics tarafından 26 Haziran 2020'de piyasaya sürülen YOLOv5, bilgisayar görüşünün erişilebilirliğini devrim niteliğinde değiştirdi. PyTorch çerçevesi üzerine doğal olarak inşa edilen ilk nesne tespit modellerinden biri olarak, eski Darknet C-çerçevesinin karmaşıklıklarını aştı. YOLOv5, yüksek düzeyde optimize edilmiş bir CSPNet omurgası ve bir PANet boyun kısmını kullanarak hız ve doğruluk arasında sorunsuz bir dengeye öncelik verir.

Ancak, en büyük başarısı, daha geniş Ultralytics ekosistemine entegrasyonudur. YOLOv5, hızlı eğitim verimliliği ve düşük bellek ortamları için yoğun bir şekilde optimize edilmiştir, bu da onu uç dağıtımlar için inanılmaz derecede kararlı kılar.

YOLOv5 hakkında daha fazla bilgi edinin.

Bellek Verimliliği

Uç cihazlar için modelleri değerlendirirken, Ultralytics YOLO modellerinin hem eğitim hem de çıkarım sırasında ağır transformatör tabanlı mimarilere kıyasla genellikle önemli ölçüde daha düşük GPU belleği gerektirdiğini unutmayın.

Performans Analizi: Hız - Doğruluk Karşılaştırması

Bir bilgisayar görüşü işlem hattı tasarlarken, geliştiriciler hassasiyet ve gecikme arasındaki dengeyi göz önünde bulundurmalıdır. Aşağıdaki tablo, standart COCO veri kümesindeki performans farklılıklarını göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Ödünleşimleri Analiz Etme

YOLOv9, ham hassasiyette mutlak bir üstünlük kurar. YOLOv9e, ince taneli detayları korumak için GELAN katmanlarını kullanarak mAP sınırlarını %55,6'ya çıkarır. Bu da onu tıbbi görüntüleme veya küçük nesnelerde titiz doğruluk gerektiren senaryolar için olağanüstü bir seçim haline getirir.

Tersine, YOLOv5 ham dağıtım hızı ve donanım esnekliği ile öne çıkar. YOLOv5n (Nano) bilindiği üzere hafiftir ve TensorRT aracılığıyla bir T4 GPU'da çıkarımları yalnızca 1.12 ms'de gerçekleştirir. Kısıtlı IoT cihazlarına, cep telefonlarına veya Raspberry Pi'ye dağıtım yapıyorsanız, YOLOv5'in bellek ayak izi onu olağanüstü güvenilir kılar.

Ultralytics Ekosisteminin Avantajı

Bir model seçerken önemli bir husus, çevreleyen yazılım ekosistemidir. YOLOv9 üst düzey araştırma kıyaslamaları sunarken, her iki modeli de modern Ultralytics Python API'si aracılığıyla kullanmak bu boşluğu kapatır ve geliştiricilere birleşik ve akıcı bir deneyim sunar.

Kullanım Kolaylığı ve Dışa Aktarma

Ultralytics, karmaşık mühendislik engellerini soyutlar. Otomatik veri artırma ve hiperparametre ayarlama gibi özellikler kutudan çıktığı gibi desteklenir. Modelleri üretime taşımak da aynı derecede kolaydır; modelleri ONNX, OpenVINO veya TFLite formatlarına dönüştürmek için yerleşik dışa aktarma komutları mevcuttur.

Görev Çok Yönlülüğü

Her iki model de nesne algılama konusunda üstün olsa da, modern Ultralytics modelleri çeşitli bilgisayar görüşü zorluklarının üstesinden gelmek için tasarlanmıştır. Daha geniş çerçeve, görüntü sınıflandırma, örnek segmentasyon, poz tahmini ve yönlendirilmiş sınırlayıcı kutular (OBB) için yerel destek sağlayarak geliştiricilerin kod tabanlarını değiştirmeden birden fazla görüş problemini çözmelerine olanak tanır.

Kullanım Durumları ve Öneriler

YOLOv9 ile YOLOv5 arasında seçim yapmak, projenizin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerinize bağlıdır.

YOLOv9 Ne Zaman Tercih Edilmeli?

YOLOv9, aşağıdaki durumlar için güçlü bir tercihtir:

  • Bilgi Darboğazı Araştırması: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) mimarilerini inceleyen akademik projeler.
  • Gradyan Akışı Optimizasyon Çalışmaları: Eğitim sırasında derin ağ katmanlarındaki bilgi kaybını anlama ve azaltmaya odaklanan araştırmalar.
  • Yüksek Doğruluklu Algılama Kıyaslaması: YOLOv9'un güçlü COCO kıyaslama performansının mimari karşılaştırmalar için bir referans noktası olarak gerektiği senaryolar.

YOLOv5 Ne Zaman Tercih Edilmeli?

YOLOv5, aşağıdaki durumlar için önerilir:

  • Kanıtlanmış Üretim Sistemleri: YOLOv5'in uzun süreli istikrar geçmişinin, kapsamlı dokümantasyonunun ve büyük topluluk desteğinin değerli olduğu mevcut dağıtımlar.
  • Kaynak Kısıtlı Eğitim: Sınırlı GPU kaynaklarına sahip ortamlarda, YOLOv5'in verimli eğitim hattının ve daha düşük bellek gereksinimlerinin avantaj sağladığı durumlar.
  • Kapsamlı Dışa Aktarma Formatı Desteği: ONNX, TensorRT, CoreML ve TFLite dahil olmak üzere birçok formatta dağıtım gerektiren projeler.

Ultralytics (YOLO26) Ne Zaman Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Uygulama Örneği

Ultralytics ekosisteminin güzelliği, ağırlık dizesini değiştirerek bir YOLOv5 modeli ile bir YOLOv9 modeli arasında kolayca geçiş yapabilmenizdir.

from ultralytics import YOLO

# Load a pretrained YOLOv9 model (swap to "yolov5s.pt" to use YOLOv5)
model = YOLO("yolov9c.pt")

# Train the model efficiently on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on new images
predictions = model.predict("https://ultralytics.com/images/zidane.jpg")

# Export to ONNX for seamless deployment
model.export(format="onnx")

Daha Yeni Mimarileri Keşfetmek

YOLOv5 ve YOLOv9, belirgin avantajlara sahip mükemmel modeller olsa da, alan ilerlemeye devam ediyor. Yeni projeler keşfeden kullanıcılar, Ultralytics'in en son iterasyonlarını da değerlendirmek isteyebilirler.

  • YOLO11: Tüm görüş görevlerinde mükemmel hız-doğruluk dengesi sunan, YOLOv8 soyunun güçlü, rafine bir evrimi.
  • YOLO26: 2026'da piyasaya sürülen YOLO26, modern işlem hatları için nihai öneridir. Uçtan Uca NMS-Free Tasarım sunarak son işlem darboğazlarını tamamen ortadan kaldırır. DFL Kaldırma (basitleştirilmiş dışa aktarım ve daha iyi uç/düşük güçlü cihaz uyumluluğu için Distribution Focal Loss kaldırıldı) ile %43'e kadar daha hızlı CPU çıkarımı elde eder. Yeni MuSGD Optimize Edici sayesinde eğitim kararlılığı süper şarj edilir ve ProgLoss + STAL, IoT, robotik ve hava görüntüleme için kritik olan küçük nesne tanımada önemli iyileştirmelerle geliştirilmiş kayıp fonksiyonları sunarak hem uç hem de bulut dağıtımları için en sağlam mimari haline gelir.

Büyük veri kümelerini ve karmaşık dağıtım işlem hatlarını yöneten ekipler için Ultralytics Platformu, bu son teknoloji modelleri zahmetsizce eğitmek, track etmek ve dağıtmak için kodsuz bir çözüm sunar.


Yorumlar