İçeriğe geç

YOLOv9 vs YOLO11: Mimari Evrim ve Performans Analizi

Bilgisayarlı görü alanı, doğruluk, hız ve verimlilik sınırlarını sürekli olarak zorlayan modellerle hızlı yeniliklerle tanımlanmaktadır. Bu karşılaştırma, nesne tespitinde iki önemli kilometre taşını incelemektedir: YOLOv9yeni mimari kavramları tanıtan araştırma odaklı bir model ve Ultralytics YOLO11gerçek dünyada çok yönlülük için tasarlanmış üretime hazır en son evrim.

Bir yandan YOLOv9 teorik atılımlar yoluyla derin öğrenme bilgi darboğazlarını ele almaya odaklanmaktadır, Ultralytics YOLO11Ultralytics ekosistemine kullanılabilirlik, verimlilik ve sorunsuz entegrasyona odaklanarak en son teknoloji (SOTA) performansını iyileştirir.

Performans Ölçütleri: Hız ve Doğruluk

Aşağıdaki tabloda COCO veri kümesi üzerinde değerlendirilen temel performans ölçümlerinin doğrudan bir karşılaştırması sunulmaktadır. Bir model seçerken, Ortalama Ortalama KesinlikmAP) ile çıkarım hızı ve hesaplama maliyetini (FLOP'lar) dengelemek çok önemlidir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Verilerin de gösterdiği gibi, YOLO11 üstün verimlilik göstermektedir. Örneğin, YOLO11n modeli daha az FLOP kullanırken ve GPU'da önemli ölçüde daha hızlı çalışırken YOLOv9t'den (%38,3) daha yüksek bir mAP (%39,5) elde ediyor. En büyük YOLOv9e modeli ham doğrulukta küçük bir avantaja sahip olsa da, YOLO11l'nin neredeyse iki katı çıkarım süresi gerektiriyor ve bu da YOLO11 'i gerçek zamanlı çıkarım senaryoları için daha pragmatik bir seçim haline getiriyor.

YOLOv9: Bilgi Darboğazının Ele Alınması

YOLOv9 belirli bir akademik hedefle piyasaya sürüldü: veriler derin sinir ağlarından geçerken bilgi kaybı sorununu çözmek. Mimarisi, eğitim sırasında gradyan bilgisini tutma ihtiyacından büyük ölçüde etkilenmiştir.

Teknik Ayrıntılar:
Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
Organizasyon:Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
Tarih: 2024-02-21
Arxiv:https://arxiv.org/abs/2402.13616
GitHub:https://github.com/WongKinYiu/yolov9
Docs:ultralytics

Temel Mimari Özellikler

YOLOv9 'un temel yenilikleri Programlanabilir Gradyan Bilgisi (PGI ) ve Genelleştirilmiş Verimli Katman Toplama Ağı'dır (GELAN).

  • PGI: Bu yardımcı denetim çerçevesi, derin katmanların güvenilir gradyan bilgisi almasını sağlayarak, genellikle derin ağların yakınsamasını engelleyen "bilgi darboğazını" hafifletir.
  • GELAN: Bu mimari, CSPNet ve ELAN'ın güçlü yönlerini birleştirerek parametre verimliliğini optimize eder ve esnek hesaplama ölçeklendirmesine izin verir.

Akademik Odak

YOLOv9 , derin öğrenme teorisiyle, özellikle de evrişimli sinir ağlarında gradyan akışı ve bilgi korumasıyla ilgilenen araştırmacılar için mükemmel bir vaka çalışmasıdır.

YOLOv9 hakkında daha fazla bilgi edinin

Ultralytics YOLO11: Çok Yönlülük Verimlilikle Buluşuyor

mirası üzerine inşa edilmiştir. YOLOv8YOLO11 , üretim odaklı bilgisayarla görmenin zirvesini temsil etmektedir. Sadece kıyaslama skorları için değil, pratik konuşlandırılabilirlik, kullanım kolaylığı ve çoklu görev kabiliyeti için tasarlanmıştır.

Teknik Ayrıntılar:
Yazarlar: Glenn Jocher, Jing Qiu
Organizasyon:Ultralytics
Tarih: 2024-09-27
GitHubultralytics
Docsultralyticsyolo11

Temel Mimari Özellikler

YOLO11 , hesaplama yükünü en aza indirirken özellik çıkarımını en üst düzeye çıkarmak için tasarlanmış rafine bir mimari sunar. Küçük nesneleri tespit etmek için kritik olan farklı ölçekler arasında özellik entegrasyonunu geliştiren gelişmiş bir backbone ve boyun yapısı kullanır.

Model ayrıca eğitim sırasında daha hızlı yakınsama için geliştirilmiş kafa tasarımlarına sahiptir. Araştırma merkezli modellerin aksine YOLO11 , Algılama, Segmentasyon, Sınıflandırma, Poz Tahmini ve Yönlendirilmiş Sınırlayıcı Kutuları (OBB) yerel olarak destekleyen birleşik bir çerçeve içinde oluşturulmuştur.

YOLO11 hakkında daha fazla bilgi edinin

Detaylı Karşılaştırma Noktaları

Kullanım Kolaylığı ve Ekosistem

En önemli farklardan biri kullanıcı deneyiminde yatmaktadır. Ultralytics YOLO11 "geliştirici öncelikli" bir zihniyetle tasarlanmıştır. Veri açıklama, veri kümesi yönetimi ve model dışa aktarma araçlarını içeren daha geniş Ultralytics ekosistemi ile sorunsuz bir şekilde entegre olur.

  • YOLO11: kullanarak birkaç satır kodla eğitilebilir, doğrulanabilir ve dağıtılabilir. ultralytics Python paketi veya CLI. Sık güncellemelerden, kapsamlı dokümantasyondan ve büyük bir topluluktan yararlanır.
  • YOLOv9: Ultralytics kütüphanesinde desteklense de, orijinal uygulama ve bazı gelişmiş yapılandırmalar, altta yatan araştırma makalesinin daha iyi anlaşılmasını gerektirebilir.

Bellek Gereksinimleri ve Eğitim Verimliliği

Verimli kaynak kullanımı Ultralytics modellerinin ayırt edici özelliğidir. YOLO11 , birçok transformatör tabanlı alternatife veya eski YOLO inelemelerine kıyasla eğitim sırasında daha düşük CUDA belleği gerektirecek şekilde optimize edilmiştir. Bu, geliştiricilerin tüketici sınıfı donanımlarda daha büyük parti boyutlarını eğitmelerine olanak tanıyarak geliştirme döngüsünü hızlandırır.

Ayrıca, YOLO11 tüm görevler için hazır, yüksek kaliteli önceden eğitilmiş ağırlıklar sağlayarak transfer öğrenmenin hem hızlı hem de etkili olmasını sağlar. Bu, öncelikle COCO tespitine odaklanan sınırlı önceden eğitilmiş kontrol noktaları sunabilen araştırma modelleriyle tezat oluşturmaktadır.

Görev Çok Yönlülüğü

YOLOv9 öncelikle nesne algılamadaki başarılarıyla tanınırken, YOLO11 tek bir çerçeve içinde çok çeşitli bilgisayarla görme görevleri için yerel destek sunmaktadır:

  • Örnek Segmentasyonu: Nesnelerin hassas bir şekilde maskelenmesi.
  • Poz Tahmini: İskelet anahtar noktalarının tespit edilmesi (örneğin, insan pozu için).
  • Sınıflandırma: Tüm görüntüleri kategorize etme.
  • Yönlendirilmiş Sınırlayıcı Kutular (OBB): Döndürülmüş nesneleri algılama, hava görüntüleri için hayati önem taşır.

Birleşik API

YOLO11 'de görevler arasında geçiş yapmak, model ağırlık dosyasını değiştirmek kadar basittir (örn. yolo11n.pt tespit için yolo11n-seg.pt segmentasyon için).

Kod Örneği: Eylem Halinde Karşılaştırma

Aşağıdaki Python kodu, her iki modelin de Ultralytics çerçevesi içinde ne kadar kolay yüklenip kullanılabileceğini göstermekte ve farklı mimarileri test etmeyi kolaylaştıran birleşik API'yi vurgulamaktadır.

from ultralytics import YOLO

# Load the research-focused YOLOv9 model (compact version)
model_v9 = YOLO("yolov9c.pt")

# Load the production-optimized YOLO11 model (medium version)
model_11 = YOLO("yolo11m.pt")

# Run inference on a local image
# YOLO11 provides a balance of speed and accuracy ideal for real-time apps
results_11 = model_11("path/to/image.jpg")

# Display results
results_11[0].show()

İdeal Kullanım Senaryoları

YOLOv9 Ne Zaman Seçilmeli

YOLOv9 , hesaplama maliyetinden bağımsız olarak statik görüntülerde maksimum doğruluğun tek öncelik olduğu akademik araştırmalar ve senaryolar için mükemmel bir seçimdir.

  • Araştırma Projeleri: Gradyan akışı ve sinir ağı mimarisinin araştırılması.
  • Kıyaslama: mAP 'nin her bir fraksiyonunun önemli olduğu yarışmalar.
  • Üst Düzey Sunucu Dağıtımları: 'E' varyantının daha yüksek FLOP'larını işlemek için güçlü GPU'ların (A100'ler gibi) mevcut olduğu yerler.

Ultralytics YOLO11 Ne Zaman Seçilir

YOLO11 ticari uygulamalar, uç bilişim ve çoklu görev sistemleri için önerilen seçimdir.

  • Edge AI: Üstün hız-ağırlık oranları nedeniyle NVIDIA Jetson veya Raspberry Pi gibi cihazlara dağıtılması.
  • Gerçek Zamanlı Analitik: Gecikmenin kritik olduğu trafik izleme, spor analizi ve üretim kalite kontrolü.
  • Karmaşık Boru Hatları: Aynı anda algılama, segmentasyon ve poz tahmini gerektiren uygulamalar.
  • Hızlı Prototipleme: Ultralytics API'sini kullanarak konseptten dağıtıma hızlı bir şekilde geçmesi gereken yeni başlayanlar ve işletmeler.

Keşfedilecek Diğer Modeller

YOLOv9 ve YOLO11 güçlü rakipler olsa da, Ultralytics kütüphanesi özel ihtiyaçlar için uyarlanmış çeşitli diğer modelleri destekler:

  • YOLOv8: YOLO11'in güvenilir selefi, hala yaygın olarak kullanılmakta ve desteklenmektedir.
  • RT-DETR: Doğrulukta üstün olan ancak daha fazla bellek gerektirebilen transformatör tabanlı bir dedektör.
  • YOLOv10: Belirli yapılandırmalarda daha düşük gecikme süresi için NMS'siz eğitime odaklanan farklı bir mimari.

Model Karşılaştırma bölümündeki tüm seçenekleri keşfedin.

Sonuç

Her iki mimari de bilgisayarla görme alanında önemli başarıları temsil etmektedir. YOLOv9 , derin ağların eğitimi konusunda değerli teorik bilgiler sunarken Ultralytics YOLO11 bu gelişmeleri dünya için sağlam, çok yönlü ve son derece verimli bir araç olarak sentezliyor. Ölçeklenebilir, gerçek zamanlı uygulamalar oluşturmak isteyen çoğu geliştirici ve araştırmacı için YOLO11'in performans dengesi, kullanım kolaylığı ve kapsamlı ekosistem desteği onu üstün bir seçim haline getiriyor.


Yorumlar