YOLOX veYOLO: Yeni Nesil Nesne Algılama Mimarilerinin Analizi

Hızla gelişen bilgisayar görme alanında, çapa tabanlı dedektörlerden çapa tabanlı olmayan dedektörlere geçiş önemli bir dönüm noktası olmuştur. Bu geçişi şekillendiren iki önemli model YOLOX ve YOLO'dur. Bu karşılaştırma, araştırmacıların ve mühendislerin belirli nesne algılama ihtiyaçları için doğru aracı seçmelerine yardımcı olmak amacıyla, bu modellerin mimari yeniliklerini, performans ölçütlerini ve eğitim metodolojilerini incelemektedir.

Performans Kıyaslamaları

Aşağıdaki tablo, YOLOX veYOLO arasındaki temel performans ölçütlerinin doğrudan karşılaştırmasını sunmaktadır.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
YOLOXnano	416	25.8	-	-	0.91	1.08
YOLOXtiny	416	32.8	-	-	5.06	6.45
YOLOXs	640	40.5	-	2.56	9.0	26.8
YOLOXm	640	46.9	-	5.43	25.3	73.8
YOLOXl	640	49.7	-	9.04	54.2	155.6
YOLOXx	640	51.1	-	16.1	99.1	281.9

DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

YOLOX: Araştırma ve Endüstriyi Birleştirme

YOLOX, YOLO önemli bir güncellemesi olarak ortaya çıktı, çapa içermeyen bir mekanizmaya geçti ve akademik araştırma ile endüstriyel uygulama arasındaki süreci kolaylaştıran gelişmiş algılama tekniklerini tanıttı.

Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
Kuruluş:Megvii
Tarih: 2021-07-18
Arxiv:YOLOX: 2021'de YOLO Aşan
GitHub:Megvii-BaseDetection/YOLOX

Mimari ve İnovasyon

YOLOX, YOLOv4 ve YOLOv5gibi önceki sürümlerde bulunan bağlantı kutularını kaldırarak kendini diğerlerinden ayırır. "Decoupled Head" mimarisi, sınıflandırma ve yerelleştirme görevlerini birbirinden ayırarak yakınsama hızını ve doğruluğu önemli ölçüde artırır.

Ayrıca, YOLOX, eğitim sürecini Optimal Transport problemi olarak gören dinamik bir etiket atama stratejisi olan SimOTA'yı kullanır. Bu, modelin küresel optimizasyon stratejisine dayalı olarak pozitif örnekleri otomatik olarak temel gerçeklere atamasını sağlar ve sezgisel hiperparametre ayarlaması ihtiyacını azaltır.

YOLOX hakkında daha fazla bilgi edinin

DAMO-YOLO: Sinirsel Mimari Arama Verimliliği

YOLO , Sinir Mimarisi Arama (NAS) ve yoğun yeniden parametreleştirme teknolojisini kullanarak gecikme ve doğruluk arasındaki dengeyiYOLO

Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş:Alibaba Group
Tarih: 2022-11-23
Arxiv:YOLO: Gerçek Zamanlı Nesne Algılama Tasarımı Hakkında Bir Rapor
GitHub:YOLO

Anahtar Teknolojiler

YOLO , belirli gecikme kısıtlamaları altında en uygun ağ yapısını bulmak için çok amaçlı evrimsel arama kullanılarak oluşturulan MAE-NAS backboneYOLO . Ayrıca, ölçekler arasında etkili özellik birleştirme için RepGFPN (Verimli Yeniden Parametreleştirilmiş Genelleştirilmiş Özellik Piramit Ağı) kullanmaktadır.

Önemli bir özellik, algılama kafasını minimum karmaşıklığa indirgeyen ZeroHead'dir. Bu özellik, ağır yükleri kaldırmak için ağır backbone boyuna dayanır. Eğitim, etiket ataması için AlignedOTA ve daha büyük bir öğretmen modelinin öğrenciyi yönlendirdiği damıtma aşaması ile desteklenir. Bu sayede, daha küçük model varyantları için bile yüksek performans sağlanır.

DAMO-YOLO hakkında daha fazla bilgi edinin

Ultralytics'in Avantajı

YOLOX veYOLO belirli senaryolar için sağlam çözümlerYOLO , Ultralytics modern AI geliştirmenin karmaşıklıklarını ele alan kapsamlı, kullanıcı dostu ve yüksek performanslı bir alternatif sunar.

Kusursuz Kullanım Kolaylığı ve Ekosistem

YOLO gibi modellerin en önemli sorunlarından biri, genellikle çok aşamalı damıtma veya özel NAS arama alanları içeren karmaşık eğitimYOLO . Buna karşın, Ultralytics anında erişilebilirlik için tasarlanmıştır. İster YOLO11YOLO26 kullanıyor olun, veri seti yüklemeden model dışa aktarmaya kadar tüm iş akışı, birleşik bir API aracılığıyla gerçekleştirilir.

Geliştiriciler, Ultralytics kullanarak veri kümelerini yönetebilir, deneyleri görselleştirebilir ve modelleri sorunsuz bir şekilde dağıtabilir. Bu entegre yaklaşım, giriş engelini ortadan kaldırarak ekiplerin eğitim komut dosyalarını hata ayıklamaya değil, iş sorunlarını çözmeye odaklanmalarını sağlar.

YOLO26 ile Performans Dengesi

Hız ve doğrulukta zirveyi arayanlar için YOLO26, en son teknolojiyi temsil ediyor. YOLO26, YOLOX (ankrajsız tasarım) ve YOLOv10 (NMS çıkarım) gibi modellerden alınan dersleri temel alarak olağanüstü bir performans sunar.

YOLO26 İnovasyonu: Uçtan Uca NMS

YOLO26, doğal olarak uçtan uca çalışır ve Non-Maximum Suppression (NMS) son işlemine gerek kalmaz. Bu, özellikle NMS gecikme darboğazı oluşturabileceği uç cihazlarda, dağıtım süreçlerini önemli ölçüde basitleştirir.

YOLO26'nın temel özellikleri şunlardır:

DFL Kaldırma: Dağıtım Odak Kaybının kaldırılması, modeli daha kolay dışa aktarabilmek için model grafiğini basitleştirir. ONNX ve TensorRTgibi formatlara aktarımı kolaylaştırır.
MuSGD Optimizer: SGD Muon'un bir karışımı (LLM eğitiminden esinlenerek) istikrarlı bir yakınsama sağlar.
CPU : Kenar bilişim için mimari olarak optimize edilmiş olup, CPU'larda %43'e kadar daha hızlı çıkarım sağlar.
ProgLoss + STAL: Drone görüntüleme ve robotik için kritik bir gereklilik olan küçük nesne algılamayı önemli ölçüde iyileştiren gelişmiş kayıp fonksiyonları.

Görevler Arası Çok Yönlülük

YOLOX veYOLO nesne algılamaya odaklanmasından farklı olarak, Ultralytics doğası gereği çok modludur. Tek bir kütüphane şunları destekler:

Bu çok yönlülük, geliştiricilerin çerçeveleri değiştirmeden, poz tahminini kullanarak sporlarda oyuncu mekaniğini analiz etmek gibi karmaşık projeleri ele almalarını sağlar.

Eğitim Verimliliği ve Bellek

Ultralytics GPU Ultralytics , kaynak verimliliği sağlayacak şekilde tasarlanmıştır. Bu modeller, genellikle RT-DETR. Bu verimlilik, yapay zekayı demokratikleştirerek, güçlü modellerin standart tüketici donanımlarında eğitilmesine olanak tanır.

Ultralytics Python kullanarak son teknoloji YOLO26 modelini eğitmenin ne kadar kolay olduğunu aşağıda görebilirsiniz:

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on the standard COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

YOLO26 hakkında daha fazla bilgi edinin

Gerçek Dünya Uygulamaları

Doğru modeli seçmek genellikle dağıtım ortamının belirli kısıtlamalarına bağlıdır.

Endüstriyel Kalite Kontrolü

Yüksek hızlı üretim hatları için YOLO, GPU düşük gecikme süresi sayesinde güçlü bir rakip olup, hızlı hareket eden konveyörlerdeki kusurları tespit etmek için uygundur. Ancak, NMS tasarımı deterministik çıkarım süreleri sağlayarak robotik aktüatörlerin senkronizasyonunu bozabilecek titreşimi önlediği için YOLO26 bu alanda giderek daha fazla tercih edilmektedir.

Kenar AI ve Mobil

YOLOX-Nano, küçük parametre sayısı nedeniyle mobil uygulamalar için tarihsel olarak en çok tercih edilen seçenek olmuştur. Günümüzde YOLO26n (Nano), benzer model boyutlarında daha yüksek doğruluk sunarken %43 daha hızlı CPU yararlanarak üstün bir alternatif sunmaktadır. Bu da onu akıllı kameralar veya tarım sensörleri gibi pille çalışan cihazlar için ideal hale getirmektedir.

Otonom Sistemler

Robotik ve otonom sürüşte, değişen nesne ölçeklerini işleme yeteneği çok önemlidir. YOLOX'un ayrıştırılmış kafası yardımcı olsa da, YOLO26'nın ProgLoss + STAL uygulaması, trafik işaretleri veya yayalar gibi uzak veya küçük nesneleri tanımada somut bir artış sağlar ve sistemin genel güvenliğini artırır.

Özet

Hem YOLOX hem deYOLO , nesne algılamanın gelişmesine önemli katkılarYOLO . YOLOX, çapa içermeyen paradigmayı popüler hale getirirken,YOLO ise Sinir Mimarisi Arama'nın gücünüYOLO .

Ancak, performans, kullanım kolaylığı ve dağıtım esnekliği arasında denge kuran modern ve geleceğe dönük bir çözüm için Ultralytics öne çıkmaktadır. Daha geniş Ultralytics entegrasyonu, çoklu görev desteği ve basitleştirilmiş dışa aktarım süreçleri, onu hem akademik araştırmalar hem de kurumsal düzeydeki uygulamalar için önerilen seçim haline getirmektedir.

Ultralytics ziyaret ederek ve bugün eğitim yolculuğunuza başlayarak bu modellerin tüm potansiyelini keşfedin.