YOLOv10 YOLOX: Gerçek Zamanlı Nesne Algılama Mimarilerine Derinlemesine Bir Bakış

Hızla gelişen bilgisayar görme alanında, çapa içermeyen mimarilere geçiş önemli bir dönüm noktası oldu. YOLOv10 ve YOLOX, bu evrimde iki önemli dönüm noktasını temsil ediyor. 2021'de piyasaya sürülen YOLOX, algılama başlıklarını ayırarak ve gelişmiş etiket atama stratejileri getirerek çapa içermeyen paradigmayı popüler hale getirdi. Üç yıl sonra, YOLOv10 , doğal olarak NMS bir tasarım getirerek sınırları daha da YOLOv10 ve maksimum olmayan bastırma son işlemine olan ihtiyacı tamamen ortadan kaldırdı.

Bu karşılaştırma, her iki modelin mimari farklılıklarını, performans ölçütlerini ve ideal dağıtım senaryolarını incelerken, YOLO26 gibi modern çözümlerin bu gelişmeleri kapsamlı bir yapay zeka ekosistemine nasıl entegre ettiğini de vurgulamaktadır.

Performans Metrikleri Karşılaştırması

Üretim için bir model seçerken, çıkarım hızı ve algılama doğruluğu arasındaki dengeleri anlamak çok önemlidir. Aşağıdaki tablo, bu iki grubun çeşitli model ölçeklerinde nasıl karşılaştırıldığını ayrıntılı olarak göstermektedir.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

YOLOXnano	416	25.8	-	-	0.91	1.08
YOLOXtiny	416	32.8	-	-	5.06	6.45
YOLOXs	640	40.5	-	2.56	9.0	26.8
YOLOXm	640	46.9	-	5.43	25.3	73.8
YOLOXl	640	49.7	-	9.04	54.2	155.6
YOLOXx	640	51.1	-	16.1	99.1	281.9

Gösterildiği gibi, YOLOv10 genel olarak GPU benzer çıkarım gecikmeleri için daha yüksek Ortalama Hassasiyet (mAP) değerleri elde etmektedir. Örneğin, YOLOv10m modeli, benzer bir gecikme profilini korurken, YOLOX-m'nin %46,9'una kıyasla %51,3 mAP ulaşmaktadır. Bu verimlilik artışı, büyük ölçüde NMS kaldırılmasına atfedilebilir, bu da son işlem aşamasındaki hesaplama yükünü azaltmaktadır.

YOLOv10: Uçtan Uca Yenilikçi

YOLOv10 , gerçek zamanlı algılamada en uzun süredir devam eden darboğazlardan biri olan Maksimum Baskılamama (NMS) sorununu ele alarak önemli bir mimari değişimi YOLOv10 . Geleneksel algılayıcılar, aynı nesne için birden fazla sınırlayıcı kutu tahmin eder ve yinelenenleri filtrelemek NMS güvenir. YOLOv10 , eğitim sırasında tutarlı bir çift atama stratejisiyle bu adımı YOLOv10 .

Yazarlar: Ao Wang, Hui Chen, Lihao Liu, ve diğerleri.
Kuruluş:Tsinghua Üniversitesi
Tarih: 23 Mayıs 2024
Makale:arXiv:2405.14458
Kaynak:GitHub Deposu

Temel Mimari Özellikler

YOLOv10 , "Bütünsel Verimlilik-Doğruluk Odaklı Model Tasarımı"YOLOv10 . Bu, hesaplama fazlalığını en aza indirmek için aşağı örnekleme katmanları ve tahmin başlığı gibi bireysel bileşenlerin optimize edilmesini içerir. Model, çift etiket atamaları kullanır: eğitim sırasında zengin denetim için bir-çok atama ve çıkarım için bir-bir atama, bu da modelin nesne başına tek bir en iyi kutu tahmin etmesini sağlar ve NMS etkili bir şekilde NMS getirir.

Bu mimari, NMS neden olduğu gecikme değişkenliğinin NMS algılanan nesnelerin sayısına bağlı olarak) sorun yaratabileceği uç dağıtımları için özellikle faydalıdır.

YOLOv10 hakkında daha fazla bilgi edinin.

YOLOX: Bağlantısız Öncü

YOLOX, YOLOv3 ve YOLOv4'ün çapa tabanlı yaklaşımından farklı olarak, YOLO çapa içermeyen algılamayı başarıyla getiren ilk yüksek performanslı modellerden biriydi. Önceden tanımlanmış çapa kutularını kaldırarak, YOLOX eğitim sürecini basitleştirdi ve çeşitli nesne şekilleri arasında genellemeyi iyileştirdi.

Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
Kuruluş:Megvii
Tarih: 18 Temmuz 2021
Makale:arXiv:2107.08430
Kaynak:GitHub Deposu

Temel Mimari Özellikler

YOLOX, sınıflandırma ve regresyon görevlerini farklı dallara ayıran ayrıştırılmış bir başlığa sahiptir. Bu tasarımın daha hızlı yakınsama sağladığı ve daha iyi doğruluk elde ettiği gösterilmiştir. Ayrıca, sınıflandırma ve regresyon kalitesi arasında denge sağlayan, maliyet fonksiyonuna dayalı olarak pozitif örnekleri dinamik olarak atayan gelişmiş bir etiket atama stratejisi olan SimOTA'yı da tanıtmıştır.

YOLOX oldukça etkili olmasına rağmen, hala NMS dayanmaktadır, bu da YOLOv10 tutarlı gecikme süresinden farklı olarak, nesne yoğunluğunun yüksek olduğu sahnelerde çıkarım süresinin dalgalanabileceği anlamına gelir.

YOLOX hakkında daha fazla bilgi edinin

Ultralytics'in Avantajı

Her iki modelin de kendine göre avantajları olsa da, Ultralytics , bağımsız depolara kıyasla geliştirme yaşam döngüsünü önemli ölçüde basitleştiren birleşik bir arayüz sunar. YOLOv10 en yeni YOLO26'yı kullanıyor olsanız da, deneyiminiz daha akıcı hale gelir.

Kullanım Kolaylığı ve Çok Yönlülük

Geliştiriciler tek bir kod satırı ile modeller arasında geçiş yapabilirler. Özel yapılandırma dosyaları ve kurulum adımları gerektiren YOLOX kod tabanından farklı olarak, Ultralytics "tak ve çalıştır" özelliğine sahiptir. Ayrıca Ultralytics , örnek segmentasyonu, poz tahmini ve yönlendirilmiş nesne algılama (OBB) dahil olmak üzere daha geniş bir bilgisayar görme görevleri yelpazesini Ultralytics YOLOX'un sahip olmadığı çok yönlülük sunar.

from ultralytics import YOLO

# Load a pretrained YOLOv10 model
model = YOLO("yolov10n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Eğitim Verimliliği ve Bellek

Ultralytics , kaynakların optimum kullanımı için tasarlanmıştır. Genellikle, RT-DETR gibi transformatör ağırlıklı mimarilere kıyasla eğitim sırasında daha az CUDA gerektirirler. RT-DETR veya eski kod tabanları gibi transformatör ağırlıklı mimarilere kıyasla daha az CUDA belleği gerektirir. Bu, araştırmacıların tüketici sınıfı GPU'larda eğitim yapabilmelerini sağlayarak, üst düzey AI geliştirmeye erişimi demokratikleştirir. Ultralytics , bulut tabanlı eğitim, veri kümesi yönetimi ve tek tıklamayla model dışa aktarma özellikleri sunarak bunu daha da geliştirir.

Sorunsuz Yükseltmeler

Eski bir mimariden YOLO26 gibi modern bir mimariye geçmek, genellikle kod yeniden düzenlemeye gerek kalmadan anında performans artışı sağlar. Ultralytics , nesiller boyunca tutarlı bir API Ultralytics kod entegrasyonuna yaptığınız yatırımın korunmasını sağlar.

Neden YOLO26'yı Seçmelisiniz?

Hız, doğruluk ve modern özelliklerin en iyi dengesini arayan geliştiriciler için YOLO26 önerilen seçimdir. 2026 yılının başında piyasaya sürülen bu model, YOLOv10 NMS yeniliklerini temel alır, YOLOv10 üstün kararlılık ve hız için bunları daha da geliştirir.

Yerel olarak uçtan uca: YOLOv10 gibi, YOLO26 da NMS içermez ve deterministik gecikme süresi sağlar.
MuSGD Optimizer: LLM eğitimi (özellikle Moonshot AI'nın Kimi K2'si) esinlenerek geliştirilen bu hibrit optimizer, daha hızlı yakınsama ve eğitim istikrarı sağlar.
Kenar Optimizasyonu: Dağıtım Odak Kaybı (DFL) ve optimize edilmiş kayıp fonksiyonlarının (ProgLoss + STAL) kaldırılmasıyla YOLO26, %43'e kadar daha hızlı CPU sunarak, özel GPU'su olmayan cihazlar için ideal hale getirilmiştir.

YOLO26 hakkında daha fazla bilgi edinin

Gerçek Dünya Uygulamaları

Bu modeller arasındaki seçim genellikle projenizin özel kısıtlamalarına bağlıdır.

Yüksek Yoğunluklu Kalabalık Sayımı

Akıllı şehir gözetimi gibi senaryolarda, bir karede yüzlerce kişiyi tespit etmek yaygın bir durumdur.

YOLOX: NMS süresi algılanan kutuların sayısı ile doğrusal olarak arttığı için gecikme artışlarından etkilenebilir.
YOLOv10 YOLO26: NMS tasarımları, kalabalık yoğunluğundan bağımsız olarak çıkarım süresinin sabit kalmasını sağlar; bu, gerçek zamanlı video akışları için çok önemlidir.

Mobil ve Gömülü Robotik

Dinamik ortamlarda hareket eden robotlar için her milisaniye önemlidir.

YOLOX-Nano: Güçlü ve hafif bir rakip, ancak mimarisi eskimektedir.
YOLO26n: Benzer veya daha düşük parametre sayılarında üstün doğruluk sunar ve DFL kaldırma özelliğinden yararlanarak Raspberry Pi veya Jetson Nano gibi cihazlarda bulunan CPU'larda önemli ölçüde daha hızlı çalışır.

Endüstriyel Denetim

Montaj hatlarında kusurları tespit etmek yüksek hassasiyet gerektirir.

YOLOX: Ayrılmış kafası mükemmel konumlandırma doğruluğu sağlar ve araştırmalar için güvenilir bir temel oluşturur.
Ultralytics : Segmentasyon görevlerine kolayca geçiş yapabilme özelliği, aynı sistemin sadece detect kusuru detect kalmayıp, kusurun tam alanını da ölçmesini sağlayarak kalite kontrol için daha zengin veriler sunar.

Sonuç

YOLOX, akademik camiada saygın bir temel referans olmaya devam etmekte ve çapa içermeyen algılamayı yaygınlaştırmasıyla övgü toplamaktadır. YOLOv10 , NMS kaldırarak bu mirası başarıyla ilerletmiş ve uçtan uca gerçek zamanlı sistemlerin geleceğine bir bakış sunmuştur.

Ancak, günümüzün üretim uygulamaları için Ultralytics eşsiz bir avantaj sunmaktadır. Eğitim, doğrulama ve uygulama iş akışlarını standartlaştırarak, geliştiricilerin YOLO26YOLOv10 en NMS CPU yararlanmalarını sağlar YOLOv10

Daha fazla bilgi için, aşağıdaki belgeleri inceleyebilirsiniz YOLO11 belgelerini gözden geçirmeyi veya Performans Metrikleri 'ne dalarak bu modelleri kendi donanımınızda nasıl karşılaştıracağınızı daha iyi anlamayı düşünün.

YOLOv10 YOLOX: Gerçek Zamanlı Nesne Algılama Mimarilerine Derinlemesine Bir Bakış

Performans Metrikleri Karşılaştırması

YOLOv10: Uçtan Uca Yenilikçi

Temel Mimari Özellikler

YOLOX: Bağlantısız Öncü

Temel Mimari Özellikler

Ultralytics'in Avantajı

Kullanım Kolaylığı ve Çok Yönlülük

Eğitim Verimliliği ve Bellek

Neden YOLO26'yı Seçmelisiniz?

Gerçek Dünya Uygulamaları

Yüksek Yoğunluklu Kalabalık Sayımı

Mobil ve Gömülü Robotik

Endüstriyel Denetim

Sonuç

Yorumlar