İçeriğe geç

YOLOv10 YOLOv9: Gerçek Zamanlı Nesne Algılamada İlerleme

2024 yılı, iki önemli mimarinin piyasaya sürülmesiyle nesne algılama alanında hızlı bir yenilik dönemine damga vurdu: YOLOv10 ve YOLOv9. Her iki model de hız ve doğruluk sınırlarını zorlamayı amaçlasa da, bunu temelde farklı mimari felsefelerle başarırlar.

YOLOv10 , NMS bir tasarımla son işlemden kaynaklanan çıkarım gecikmesini ortadan kaldırmaya YOLOv10 , YOLOv9 Programlanabilir Gradyan Bilgisi (PGI) kullanarak derin ağlarda bilgi tutmayı YOLOv9 .

Performans Karşılaştırması

Aşağıdaki tablo, bu modellerin standart karşılaştırma ölçütlerine göre nasıl karşılaştırıldığını ayrıntılı olarak göstermektedir. Veriler, parametre verimliliği, çıkarım hızı ve algılama doğruluğu (mAP) arasındaki dengeleri vurgulamaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

YOLOv10: Uçtan Uca Öncü

YOLOv10, Tsinghua Üniversitesi araştırmacıları tarafından geliştirilen, uçtan uca işlemeye doğru bir geçişi temsil ediyor. 23 Mayıs 2024 tarihinde Ao Wang, Hui Chen ve meslektaşları tarafından yayınlanan bu çalışma, Non-Maximum Suppression (NMS) adlı darboğaz sorununu ele alıyor.

YOLOv10 hakkında daha fazla bilgi edinin.

Temel Mimari Özellikler

  • NMS Eğitim: YOLOv10 , tutarlı çift atamalar kullanarak, çıkarım NMS ihtiyacını YOLOv10 . Bu, özellikle uç bilgi işlem uygulamaları için gecikmeyi azaltır ve dağıtım süreçlerini basitleştirir.
  • Bütünsel Verimlilik Tasarımı: Mimari, yüksek kapasiteyi korurken hesaplama yükünü (FLOP) azaltmak için çeşitli bileşenleri optimize eder.
  • Geliştirilmiş Gecikme Süresi: Tabloda gösterildiği gibi, YOLOv10 , benzer doğruluk seviyeleri için YOLOv9 kıyasla genellikle daha düşük çıkarım süreleri sunar.

Teknik ayrıntılar için YOLOv10 makalesine başvurabilirsiniz.

YOLOv9: Bilgi Akışını Ustaca Yönetmek

YOLOv9, 21 Şubat 2024 tarihinde Academia Sinica'dan Chien-Yao Wang ve Hong-Yuan Mark Liao tarafından yayınlanan bu çalışma , derin sinir ağlarında bilgi kaybı konusundaki teorik soruna odaklanmaktadır.

YOLOv9 hakkında daha fazla bilgi edinin.

Temel Mimari Özellikler

  • GELAN Mimarisi: Genelleştirilmiş Verimli Katman Birleştirme Ağı, CSPNet ve ELAN'ın güçlü yönlerini birleştirerek parametre kullanımını en üst düzeye çıkarır.
  • Programlanabilir Gradyan Bilgisi (PGI): Bu yardımcı denetim mekanizması, derin katmanların doğru algılama için kritik bilgileri muhafaza etmesini sağlayarak, modeli yüksek hassasiyet gerektiren görevler için son derece etkili hale getirir.
  • Yüksek Doğruluk: YOLOv9e modeli, %55,6 gibi etkileyici birmAPval değeri elde ederek, saf algılama doğruluğu açısından birçok çağdaş modelden daha üstün performans sergiliyor.

Daha ayrıntılı bilgi için YOLOv9 makalesini okuyun.

Eğitim ve Kullanım Kolaylığı

Her iki model de Ultralytics tamamen entegre edilmiştir ve geliştiricilere birleşik ve sorunsuz bir deneyim sunar. YOLOv10 YOLOv9 kullanıyor olsanız da, Ultralytics Python , eğitim boru hatlarının, veri artırmanın ve günlük kaydının karmaşıklığını ortadan kaldırır.

Kod Örneği

Özel bir veri seti veya COCO8 gibi standart bir benchmark üzerinde model eğitimi yapmak oldukça COCO8 . Çerçeve, mimari farklılıklarını otomatik olarak ele alır.

from ultralytics import YOLO

# Load a model (Choose YOLOv10 or YOLOv9)
model = YOLO("yolov10n.pt")  # or "yolov9c.pt"

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model
model.val()

Bellek Verimliliği

Ultralytics YOLO , optimum GPU kullanımı için tasarlanmıştır. Transformatör tabanlı mimariler veya eski algılama modellerine kıyasla, tüketici sınıfı donanımlarda daha büyük parti boyutlarına izin vererek, en son teknolojiye sahip yapay zekayı daha geniş bir kitleye erişilebilir hale getirir.

İdeal Kullanım Senaryoları

YOLOv10 YOLOv9 arasında seçim yapmak YOLOv9 dağıtım ortamınızın belirli kısıtlamalarına bağlıdır.

YOLOv10 Ne Zaman Tercih Edilmeli?

  • Düşük Gecikme Kısıtlamaları: Uygulamanız her milisaniyenin önemli olduğu mobil cihazlarda veya gömülü sistemlerde çalışıyorsa, YOLOv10 NMS tasarımı önemli bir avantaj YOLOv10 .
  • Basit Dağıtım: Son işlem adımlarının kaldırılması, aşağıdaki formatlara dışa aktarımı basitleştirir ONNX veya TensorRTgibi formatlara dışa aktarımı basitleştirerek operatör uyumsuzluğu riskini azaltır.
  • Gerçek Zamanlı Video: Trafik yönetimi veya verimliliğin kritik olduğu yüksek hızlı üretim hatları için idealdir.

YOLOv9 Ne Zaman Tercih Edilmeli?

  • Maksimum Doğruluk: Araştırma uygulamaları veya hassasiyetin çok önemli olduğu senaryolar (örneğin, tıbbi görüntü analizi) için, YOLOv9e'nin PGI ile geliştirilmiş mimarisi üstün sonuçlar sunar.
  • Küçük Nesne Algılama: GELAN'ın zengin özellik koruma özelliği, YOLOv9 hava görüntülerinde küçük veya örtülü nesneleri algılamada YOLOv9 sağlam hale getirir.
  • Karmaşık Sahneler: Görsel karmaşanın yüksek olduğu ortamlarda, programlanabilir gradyan bilgisi modelin ilgili özellikleri daha etkili bir şekilde ayırt etmesine yardımcı olur.

Gelecek Burada: YOLO26

YOLOv9 YOLOv10 güçlü araçlar YOLOv10 , bilgisayar görme alanı hızla gelişmektedir. Ultralytics , önceki nesillerin en iyi özelliklerini bir araya getirirken çığır açan optimizasyonlar da sunan YOLO26 modelini piyasaya sürdü.

YOLO26 hakkında daha fazla bilgi edinin

YOLO26, hız, doğruluk ve çok yönlülük arasında üstün bir denge sunan, yeni projeler için önerilen seçimdir.

Neden YOLO26'ya yükseltmelisiniz?

  • Uçtan Uca NMS: YOLOv10 gibi, YOLO26 de doğal olarak uçtan uca çalışır. NMS ortadan kaldırarak daha hızlı çıkarım ve basitleştirilmiş dağıtım süreçleri sağlar.
  • MuSGD Optimizer: Büyük Dil Modeli (LLM) eğitimindeki yeniliklerden (özellikle Moonshot AI'nın Kimi K2'sinden) esinlenen YOLO26, SGD Muon optimizer'ın bir karışımını kullanır. Bu, çok daha istikrarlı bir eğitim ve daha hızlı yakınsama sağlar.
  • DFL Kaldırma: Dağıtım Odak Kaybını kaldırarak, YOLO26 model mimarisini basitleştirir, dışa aktarım için daha kolay hale getirir ve daha geniş bir yelpazedeki kenar/düşük güç tüketimli cihazlarla uyumlu hale getirir.
  • Performans Artışı: CPU özel olarak hedefleyen optimizasyonlar, önceki nesillere göre %43'e varan hız artışı sağlayarak, onu uç yapay zeka için bir güç merkezi haline getiriyor.
  • Görev Çok Yönlülüğü: V9 ve V10 sürümlerinin algılama odaklı sürümlerinden farklı olarak, YOLO26 tüm görevler için özel iyileştirmeler içerir:
    • Segmentasyon: Yeni semantik segmentasyon kaybı ve çok ölçekli proto.
    • Poz: Yüksek doğruluklu anahtar noktalar için Artık Log-Olasılık Tahmini (RLE).
    • OBB: Yönlendirilmiş Sınır Kutusu görevlerinde sınır sorunlarını ele almak için özel açı kaybı.

Ultralytics ile Kolaylaştırılmış İş Akışı

Geliştiriciler, Ultralytics (eski adıyla HUB) kullanarak YOLO26 modellerinin tüm yaşam döngüsünü yönetebilirler. Veri kümelerinin açıklama eklemesinden bulutta eğitime ve uç cihazlara dağıtımına kadar, Platform pazara sunma süresini hızlandıran birleşik bir arayüz sunar.

Sonuç

Her ikisi de YOLOv10 ve YOLOv9 nesne algılama tarihinde önemli kilometre taşlarıdır. YOLOv10 , NMS mimarilerin en gelişmiş performansı elde edebileceğini YOLOv10 , YOLOv9 derin ağlarda gradyan bilgi akışının önemini YOLOv9 .

Ancak, en sağlam, çok yönlü ve geleceğe dönük çözümü arayan geliştiriciler için YOLO26 en iyi seçenek olarak öne çıkıyor. NMS tasarımı, devrim niteliğindeki MuSGD optimizörü ve kapsamlı görev desteği ile birleştiren YOLO26, modern bilgisayar görme uygulamaları için en iyi performans dengesini sunuyor.

  • YOLO11 - YOLO26'nın sağlam öncülü, istikrarıyla tanınır.
  • YOLOv8 - Endüstride yaygın olarak kullanılan çok yönlü bir klasik.
  • RT-DETR - Transformatör tabanlı gerçek zamanlı dedektör.

Yorumlar