İçeriğe geç

YOLOv10 YOLO: Gerçek Zamanlı Nesne Algılama Mimarilerinin Evrimi

Hızla gelişen bilgisayar görme alanında, gecikme süresi ve doğruluk arasında optimum dengeyi bulma çabası sürekli yenilikleri beraberinde getiriyor. Bu yolculuktaki iki önemli dönüm noktası şunlardır YOLOv10ve NMSimlilik sınırlarını zorlamak için Sinir Mimarisi Arama (NAS) teknolojisini kullanan YOLO. Bu karşılaştırma, mimari farklılıklarını, performans ölçütlerini ve modern yapay zeka uygulamaları için uygunluklarını incelemektedir.

Performans Metrikleri Analizi

Aşağıdaki tablo, temel performans göstergelerinin ayrıntılı bir karşılaştırmasını sunmaktadır. YOLOv10 , modern GPU'larda, özellikle daha büyük model varyantlarında, parametre kullanımı ve çıkarım hızı açısından üstün verimlilik sergilemektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

YOLOv10: Uçtan Uca Öncü

Tsinghua Üniversitesi araştırmacıları tarafından Mayıs 2024'te yayınlanan YOLOv10 , Non-Maximum Suppression (NMS) ihtiyacını ortadan kaldırarak bir paradigma değişikliği getirdi. Bu mimari, geleneksel dedektörlerde genellikle son işlem adımlarının neden olduğu gecikme varyansını ele alıyor.

Temel Mimari Özellikler

  • NMS Training: NMS training için tutarlı çift atamalar kullanır ve modelin nesne başına tek bir sınırlayıcı kutu tahmin etmesini sağlar. Bu, otonom araçlar veya endüstriyel robotik gibi öngörülebilir gecikme süresi gerektiren uygulamalar için çok önemlidir.
  • Bütünsel Verimlilik-Doğruluk Tasarımı: Yazarlar Ao Wang ve diğerleri, hesaplama fazlalığını azaltmak için backbone kafa dahil olmak üzere çeşitli bileşenleri optimize ettiler.
  • Hafif Sınıflandırma Başlığı: Ankarsız dedektörlerde genellikle bir darboğaz olan sınıflandırma dalının ek yükünü azaltır.

YOLOv10 Ultralytics Python üzerinden YOLOv10 çalıştırabilir ve standartlaştırılmış arayüzün avantajlarından yararlanabilirsiniz.

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")
results[0].show()

YOLOv10 hakkında daha fazla bilgi edinin.

YOLO: Büyük Ölçekli Sinir Mimarisi Arama

Alibaba Group tarafından geliştirilen ve Kasım 2022'de piyasaya sürülen YOLO, verimli mimarilerin otomatik olarak keşfedilmesine odaklanmaktadır. Nöral Mimari Arama (NAS) teknolojisini kullanarak, ekip sıkı hesaplama bütçeleri altında algılama omurgaları için en uygun derinlik ve genişliği bulmayı amaçlamıştır.

Temel Mimari Özellikler

  • MAE-NAS Backbone: Algılama doğruluğu ve çıkarım hızı arasında denge sağlayan omurgaları bulmak için Çok Amaçlı Evrimsel arama kullanır.
  • Verimli RepGFPN: Hava görüntüleri analizinde olduğu gibi çeşitli ölçeklerde nesneleri algılamak için kritik öneme sahip özellik birleştirmeyi iyileştiren ağır boyunlu tasarım.
  • ZeroHead: Son tahmin katmanlarının karmaşıklığını azaltan basitleştirilmiş bir detect başlığı.

YOLO güçlü bir performansYOLO , karmaşık NAS süreçlerine bağımlılığı, ortalama düzeydeki geliştiricilerin, Ultralytics kullanıcı dostu yapılandırmasına kıyasla, özel veri kümeleri için mimariyi yeniden eğitmesini veya değiştirmesini zorlaştırabilir.

Ultralytics Avantajı: YOLO26 Sahneye Çıkıyor

YOLOv10 YOLO önemli adımlarYOLO da, bu alanda gelişmeler devam etti. Ultralytics , YOLOv10 NMS mirasını temel alır, YOLOv10 bunu daha sağlam, üretime hazır bir ekosisteme entegre eder.

Neden Ultralytics'i Seçmelisiniz?

Ultralytics , modellerinizin sadece bugün çalışmasını değil, donanım ve yazılım kütüphaneleri geliştikçe de çalışmaya devam etmesini sağlayan, iyi bakımlı bir ekosistem Ultralytics . Birçok akademik veri deposunun aksine, Ultralytics tutarlı güncellemeler, kapsamlı belgeler ve TensorRT ve OpenVINO gibi dağıtım araçlarıyla sorunsuz entegrasyon sağlar.

YOLO26 Yenilikleri

Hız ve doğruluk açısından en iyisini arayan geliştiriciler için YOLO26, önceki sürümlerine göre birkaç önemli iyileştirme sunuyor:

  1. Uçtan Uca NMS: YOLOv10 gibi, YOLO26 de doğal olarak uçtan uca çalışır. Ancak, Dağıtım Odak Kaybını (DFL) kaldırarak bunu daha da iyileştirir, bu da model grafiğini basitleştirerek kenar cihazları ve düşük güçlü çiplerle daha iyi uyumluluk sağlar.
  2. MuSGD Optimizer: LLM eğitimindeki yeniliklerden (özellikle Moonshot AI'nın Kimi K2'sinden) esinlenen YOLO26, MuSGD optimizer'ı kullanır. SGD Muon'un bu hibrit versiyonu, eğitime benzeri görülmemiş bir istikrar getirerek daha hızlı yakınsama ve daha az GPU sağlar.
  3. CPU : YOLO26, uç bilgi işlem için özel olarak optimize edilmiştir ve CPU'larda %43'e kadar daha hızlı çıkarım sağlar. Bu, GPU'ların kullanılamadığı IoT uygulamaları için ideal seçimdir.
  4. Geliştirilmiş Kayıp Fonksiyonları: ProgLoss ve STAL (Kendi Kendine Öğrenen Bağlantı Öğrenimi) özelliklerinin eklenmesi, küçük nesneler ve zorlu arka planlarda performansı önemli ölçüde artırır.

YOLO26 hakkında daha fazla bilgi edinin

Karşılaştırmalı Kullanım Örnekleri

Doğru modeli seçmek, büyük ölçüde özel dağıtım kısıtlamalarınıza ve iş akışı gereksinimlerinize bağlıdır.

DAMO-YOLO Ne Zaman Kullanılmalı

YOLO Sinir Mimarisi Arama (NAS) içeren araştırma senaryoları için güçlü birYOLO . Projeniz, otomatik arama stratejilerinin özellik çıkarmayı nasıl etkilediğini araştırmayı gerektiriyorsa veya Alibaba ekosistemine derinlemesine entegreyseniz, bu model değerli içgörüler sağlar. RepGFPN modülü de özellik birleştirme çalışmaları için mükemmel bir referanstır.

YOLOv10 ne zaman kullanılır?

YOLOv10 , düşük gecikme süresi varyansının kritik olduğu uygulamalar için YOLOv10 . NMS tasarımı, algılanan nesne sayısından bağımsız olarak çıkarım süresinin sabit kalmasını sağlar, bu da gerçek zamanlı güvenlik sistemleri için hayati önem taşır.

  • Gerçek Zamanlı Gözetim: Kalabalık sahneler için tutarlı kare hızları.
  • Robotik: Kontrol döngüleri için öngörülebilir zamanlama.

YOLO26 neden üstün bir seçimdir?

Çoğu geliştirici ve ticari uygulama için Ultralytics en cazip paketi sunar. YOLOv10 NMS avantajlarını üstün eğitim verimliliği ve yaygın donanım desteği YOLOv10 birleştirir.

  • Kullanım Kolaylığı: Tek bir Python ile eğitme, doğrulama ve dağıtım yapın.
  • Çok yönlülük:YOLO farklı olarak, YOLO26, Örnek Segmentasyonu, Poz Tahmini, Sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutular (OBB) dahil olmak üzere eksiksiz bir görev setini destekler.
  • Bellek Verimliliği: YOLO26, transformatör hibrit modellere kıyasla eğitim sırasında önemli ölçüde daha az CUDA gerektirir, bu da tüketici sınıfı GPU'larda eğitim yapılmasına olanak tanır.
  • Platform Entegrasyonu: Sorunsuz bir şekilde ONNX, CoreML ve TFLite Ultralytics TFLite ve prototipten üretime giden yolu kolaylaştırın.

Kod Örneği: YOLO26 İş Akışı

Ultralytics ile en son teknolojiye geçiş yapmak çok kolaydır. Aşağıdaki kod parçacığı, en son teknoloji YOLO26 modelini yüklemeyi, çıkarım yapmayı ve dağıtım için dışa aktarmayı gösterir.

from ultralytics import YOLO

# Load the YOLO26s model (Small version)
model = YOLO("yolo26s.pt")

# Train on COCO8 dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for simplified deployment
model.export(format="onnx", opset=13)

Sonuç

Hem YOLOv10 YOLO , bilgisayar görme alanına değerli yeniliklerYOLO . YOLOv10NMS algılamanın uygulanabilirliğini kanıtlarken, YOLO NAS'ın gücünü sergilemiştir. Ancak Ultralytics , bu gelişmeleri kapsamlı, kullanıcı dostu ve yüksek performanslı bir araçta bir araya getirmektedir. Üstün hızı, görev çok yönlülüğü ve sağlam bir ekosistemin desteği ile YOLO26, yeni nesil AI uygulamaları geliştiren geliştiriciler için önerilen çözüm olarak öne çıkmaktadır.

Daha fazla bilgi için YOLO11 veya transformatör tabanlı RT-DETR 'yi inceleyebilirsiniz.


Yorumlar