İçeriğe geç

YOLOv9 - YOLO11: Mimari Evrim ve Performans Analizi

Bilgisayar görüşü alanı, modellerin sürekli olarak doğruluk, hız ve verimlilik sınırlarını zorladığı hızlı yeniliklerle tanımlanır. Bu karşılaştırma, nesne tespitinde iki önemli kilometre taşını incelemektedir: yeni mimari kavramlar sunan araştırmaya odaklı bir model olan YOLOv9 ve gerçek dünya çok yönlülüğü için tasarlanmış en son üretime hazır evrim olan Ultralytics YOLO11.

YOLOv9 derin öğrenme bilgi darboğazlarını teorik atılımlar yoluyla ele almaya odaklanırken, Ultralytics YOLO11 kullanılabilirlik, verimlilik ve Ultralytics ekosistemine sorunsuz entegrasyona odaklanarak son teknoloji (SOTA) performansını iyileştirir.

Performans Metrikleri: Hız ve Doğruluk

Aşağıdaki tablo, COCO veri kümesi üzerinde değerlendirilen temel performans metriklerinin doğrudan bir karşılaştırmasını sunmaktadır. Bir model seçerken, Ortalama Hassasiyet (mAP) ile çıkarım hızı ve hesaplama maliyeti (FLOP'lar) arasında bir denge kurmak çok önemlidir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Verilerin gösterdiği gibi, YOLO11 üstün verimlilik gösteriyor. Örneğin, YOLO11n modeli, daha az FLOP kullanırken ve GPU'da önemli ölçüde daha hızlı çalışırken YOLOv9t'den (%38.3) daha yüksek bir mAP (%39.5) elde ediyor. En büyük YOLOv9e modeli ham doğrulukta hafif bir avantaja sahip olsa da, YOLO11l'nin çıkarım süresinin neredeyse iki katını gerektiriyor ve bu da YOLO11'i gerçek zamanlı çıkarım senaryoları için daha pragmatik bir seçim haline getiriyor.

YOLOv9: Bilgi Darboğazını Ele Alma

YOLOv9, belirli bir akademik hedefle piyasaya sürüldü: veri derin sinir ağlarından geçerken oluşan bilgi kaybı sorununu çözmek. Mimarisi, eğitim sırasında gradyan bilgisini koruma ihtiyacından büyük ölçüde etkilenir.

Teknik Detaylar:
Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
Kuruluş:Institute of Information Science, Academia Sinica, Taiwan
Tarih: 2024-02-21
Arxiv:https://arxiv.org/abs/2402.13616
GitHub:https://github.com/WongKinYiu/yolov9
Belgeler:https://docs.ultralytics.com/models/yolov9/

Temel Mimari Özellikler

YOLOv9'un temel yenilikleri Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN)'dır.

  • PGI: Bu yardımcı denetim çerçevesi, derin katmanların güvenilir gradyan bilgisi almasını sağlayarak, derin ağların yakınsamasını genellikle engelleyen "bilgi darboğazını" azaltır.
  • GELAN: Bu mimari, CSPNet ve ELAN'ın güçlü yönlerini birleştirerek parametre verimliliğini optimize eder ve esnek hesaplama ölçeklendirmesine olanak tanır.

Akademik Odak

YOLOv9, özellikle gradyan akışı ve evrişimsel sinir ağlarındaki bilgi korunumu ile ilgili olarak derin öğrenme teorisiyle ilgilenen araştırmacılar için mükemmel bir örnek olaydır.

YOLOv9 hakkında daha fazla bilgi edinin

Ultralytics YOLO11: Çok Yönlülük Verimlilikle Buluşuyor

YOLOv8'in mirası üzerine inşa edilen YOLO11, üretime yönelik bilgisayar görüşünün zirvesini temsil ediyor. Sadece kıyaslama puanları için değil, aynı zamanda pratik dağıtılabilirlik, kullanım kolaylığı ve çoklu görev yeteneği için tasarlanmıştır.

Teknik Detaylar:
Yazarlar: Glenn Jocher, Jing Qiu
Kuruluş:Ultralytics
Tarih: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
Belgeler:https://docs.ultralytics.com/models/yolo11/

Temel Mimari Özellikler

YOLO11, hesaplama yükünü en aza indirirken özellik çıkarımını en üst düzeye çıkarmak için tasarlanmış geliştirilmiş bir mimari sunar. Küçük nesneleri algılamak için kritik olan farklı ölçeklerde özellik entegrasyonunu geliştiren geliştirilmiş bir backbone ve neck yapısı kullanır.

Model ayrıca, eğitim sırasında daha hızlı yakınsama için geliştirilmiş başlık tasarımlarına sahiptir. Araştırma odaklı modellerin aksine, YOLO11, yerel olarak Algılama, Segmentasyon, Sınıflandırma, Poz Tahmini ve Yönlendirilmiş Sınırlayıcı Kutuları (OBB) destekleyen birleşik bir çerçeve içinde oluşturulmuştur.

YOLO11 hakkında daha fazla bilgi edinin

Detaylı Karşılaştırma Noktaları

Kullanım Kolaylığı ve Ekosistem

En önemli farklardan biri, kullanıcı deneyiminde yatmaktadır. Ultralytics YOLO11, "önce geliştirici" zihniyetiyle tasarlanmıştır. Veri açıklaması, veri kümesi yönetimi ve model dışa aktarma araçlarını içeren daha geniş Ultralytics ekosistemiyle sorunsuz bir şekilde entegre olur.

  • YOLO11: Kullanılarak birkaç satır kodla eğitilebilir, doğrulanabilir ve dağıtılabilir. ultralytics Python paketi veya CLI. Sık güncellemelerden, kapsamlı dokümantasyondan ve büyük bir topluluktan yararlanır.
  • YOLOv9: Ultralytics kütüphanesinde desteklenmesine rağmen, orijinal uygulama ve bazı gelişmiş konfigürasyonlar, temel araştırma makalesinin daha derinlemesine anlaşılmasını gerektirebilir.

Bellek Gereksinimleri ve Eğitim Verimliliği

Verimli kaynak kullanımı, Ultralytics modellerinin bir özelliğidir. YOLO11, birçok transformatör tabanlı alternatife veya eski YOLO yinelemelerine kıyasla eğitim sırasında daha düşük CUDA belleği gerektirecek şekilde optimize edilmiştir. Bu, geliştiricilerin tüketici sınıfı donanımda daha büyük toplu boyutları eğitmesine ve geliştirme döngüsünü hızlandırmasına olanak tanır.

Ayrıca, YOLO11 tüm görevler için kolayca kullanılabilen, yüksek kaliteli önceden eğitilmiş ağırlıklar sağlar ve transfer öğreniminin hem hızlı hem de etkili olmasını sağlar. Bu, öncelikle COCO detect'e odaklanan sınırlı önceden eğitilmiş kontrol noktaları sunabilen araştırma modelleriyle çelişir.

Görev Çok Yönlülüğü

YOLOv9 öncelikle nesne algılama alanındaki başarılarıyla tanınırken, YOLO11 tek bir çerçeve içinde çok çeşitli bilgisayarla görme görevleri için yerel destek sunar:

  • Örnek Bölütleme: Nesnelerin hassas maskelenmesi.
  • Poz Tahmini: İskeletsel kilit noktalarını detect etme (örneğin, insan pozu için).
  • Sınıflandırma: Tüm görüntüleri kategorize etme.
  • Yönlendirilmiş Sınırlayıcı Kutular (OBB): Döndürülmüş nesneleri detect etmek, hava görüntüleri için hayati önem taşır.

Birleşik API

YOLO11 'de görevler arasında geçiş yapmak, model ağırlık dosyasını değiştirmek kadar basittir (örn. yolo11n.pt algılamadan yolo11n-seg.pt segmentasyon için).

Kod Örneği: Uygulamalı Karşılaştırma

Aşağıdaki Python kodu, farklı mimarileri test etmeyi basitleştiren birleşik API'yi vurgulayarak, her iki modelin de Ultralytics çerçevesinde ne kadar kolay yüklenebileceğini ve kullanılabileceğini göstermektedir.

from ultralytics import YOLO

# Load the research-focused YOLOv9 model (compact version)
model_v9 = YOLO("yolov9c.pt")

# Load the production-optimized YOLO11 model (medium version)
model_11 = YOLO("yolo11m.pt")

# Run inference on a local image
# YOLO11 provides a balance of speed and accuracy ideal for real-time apps
results_11 = model_11("path/to/image.jpg")

# Display results
results_11[0].show()

İdeal Kullanım Senaryoları

Ne Zaman YOLOv9 Seçmeli

YOLOv9, hesaplama maliyetinden bağımsız olarak, statik görüntülerde maksimum doğruluk tek öncelik olduğunda akademik araştırma ve senaryolar için mükemmel bir seçimdir.

  • Araştırma Projeleri: Gradyan akışını ve sinir ağı mimarisini araştırmak.
  • Benchmarking: mAP'nin her bir kesrinin önemli olduğu yarışmalar.
  • Üst Düzey Sunucu Dağıtımları: 'E' varyantının daha yüksek FLOP'larını işlemek için güçlü GPU'ların (A100'ler gibi) mevcut olduğu yerler.

Ultralytics YOLO11 Ne Zaman Seçilir

YOLO11, ticari uygulamalar, uç bilişim ve çoklu görev sistemleri için önerilen seçimdir.

  • Uç Yapay Zeka: Üstün hız-ağırlık oranları nedeniyle NVIDIA Jetson veya Raspberry Pi gibi cihazlarda dağıtım.
  • Gerçek Zamanlı Analizler: Gecikmenin kritik olduğu trafik izleme, spor analizleri ve üretim kalite kontrolü.
  • Karmaşık İşlem Hatları: Aynı anda algılama, segmentasyon ve poz tahmini gerektiren uygulamalar.
  • Hızlı Prototipleme: Ultralytics API'sini kullanarak kavramdan dağıtıma hızla geçmesi gereken startup'lar ve işletmeler.

Keşfedilecek Diğer Modeller

YOLOv9 ve YOLO11 güçlü rakipler olsa da, Ultralytics kitaplığı belirli ihtiyaçlar için uyarlanmış çeşitli başka modelleri destekler:

  • YOLOv8: YOLO11'in güvenilir selefi, hala yaygın olarak kullanılmakta ve desteklenmektedir.
  • RT-DETR: Doğrulukta öne çıkan, ancak daha fazla bellek gerektirebilen, dönüştürücü tabanlı bir dedektör.
  • YOLOv10: Belirli konfigürasyonlarda daha düşük gecikme için NMS'siz eğitime odaklanan farklı bir mimari.

Model Karşılaştırması bölümündeki tüm seçenekleri keşfedin.

Sonuç

Her iki mimari de bilgisayar görüşünde önemli başarıları temsil etmektedir. YOLOv9, derin ağları eğitme konusunda değerli teorik bilgiler sunarken, Ultralytics YOLO11 bu gelişmeleri dünyanın dört bir yanındaki sağlam, çok yönlü ve son derece verimli bir araçta sentezlemektedir. Ölçeklenebilir, gerçek zamanlı uygulamalar oluşturmak isteyen çoğu geliştirici ve araştırmacı için YOLO11'in performans, kullanım kolaylığı ve kapsamlı ekosistem desteği dengesi onu üstün bir seçim yapmaktadır.


Yorumlar