İçeriğe geç

YOLOv5 ve YOLOX: Kapsamlı Bir Teknik Karşılaştırma

Gerçek zamanlı bilgisayar görüşünün evrimi, farklı mimarilerin hız ve doğruluk sınırlarını zorlamasıyla sayısız dönüm noktasına tanık olmuştur. Bu alandaki iki oldukça etkili model YOLOv5 ve YOLOX'tur. Her ikisi de nesne tespitindeki yüksek performanslarıyla tanınırken, temel olarak farklı mimari yaklaşımlar benimserler.

Bu kılavuz, geliştiricilerin ve araştırmacıların vizyon yapay zeka projeleri için doğru aracı seçmelerine yardımcı olmak amacıyla bu iki modelin mimarilerini, performans metriklerini, eğitim metodolojilerini ve ideal dağıtım senaryolarını karşılaştıran derinlemesine bir teknik analiz sunar.

Model Genel Bakışları ve Mimari Farklılıklar

Ultralytics YOLOv5

Ultralytics tarafından tanıtılan YOLOv5, performans, kullanım kolaylığı ve bellek verimliliğindeki olağanüstü dengesi sayesinde hızla bir endüstri standardı haline geldi. PyTorch çerçevesi üzerine yerel olarak inşa edilen YOLOv5, çapa tabanlı bir mimari kullanır. Nesne konumlarını tahmin etmek için önceden tanımlanmış sınırlayıcı kutu şekillerine dayanır, bu da onu standart nesne algılama görevleri için oldukça etkili kılar.

YOLOv5'in en büyük güçlerinden biri, iyi yönetilen ekosistemidir. Kapsamlı belgelere, inanılmaz derecede basit bir Python API'ye ve Ultralytics Platformu ile yerel entegrasyona sahiptir. Bu, geliştiricilerin veri kümesi etiketlemeden eğitime ve ONNX ve TensorRT gibi formatlara dışa aktarmaya sorunsuz bir şekilde geçiş yapmalarını sağlar.

YOLOv5 hakkında daha fazla bilgi edinin.

Ekosistem Avantajı

Ultralytics YOLO modelleri, karmaşık transformatör tabanlı alternatiflere kıyasla eğitim sırasında genellikle önemli ölçüde daha az GPU belleği gerektirir. Bu düşük bellek ayak izi, YOLOv5'i tüketici sınıfı donanımlarla çalışan araştırmacılar için oldukça erişilebilir kılar.

Megvii YOLOX

Megvii'deki araştırmacılar tarafından geliştirilen YOLOX, YOLO ailesine çapa içermeyen bir tasarım getirerek farklı bir yol izledi. Çapa kutularını ortadan kaldırarak, YOLOX algılama başlığını basitleştirir ve eğitim sırasında manuel ayarlama gerektiren sezgisel parametre sayısını önemli ölçüde azaltır.

YOLOX ayrıca, sınıflandırma ve regresyon görevlerini farklı ağ dallarına ayıran ayrık bir başlık içerir ve SimOTA etiket atama stratejisini kullanır. Bu yenilikler, akademik araştırma ile endüstriyel uygulamalar arasındaki boşluğu kapatarak YOLOX'u, nesne ölçeklerinin oldukça değişken olduğu ortamlarda özellikle etkili kılar.

YOLOX hakkında daha fazla bilgi edinin

Performans ve Metrikler

Bilgisayar görüşü modellerini değerlendirirken, ortalama Hassasiyet (mAP) ile çıkarım hızı arasındaki denge kritiktir. Her iki model de farklı donanım kısıtlamalarına uyacak çeşitli boyutlar (Nano'dan Ekstra Büyük'e kadar) sunar.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

YOLOXx biraz daha yüksek bir tepe doğruluğu (51.1 mAP) elde ederken, YOLOv5 CPU ve GPU donanımlarında çok daha sağlam ve kapsamlı bir şekilde test edilmiş bir dağıtım hattı sunar. YOLOv5 için TensorRT hızları, kenar bilişim cihazları için derin optimizasyonunu vurgulayarak, onu gerçek zamanlı video analizi için oldukça güvenilir bir seçim haline getirir.

Eğitim Metodolojileri ve Kullanılabilirlik

Geliştirici deneyimi, bu iki mimari arasında önemli ölçüde farklılık gösterir.

YOLOX Yaklaşımı

YOLOX'u eğitmek genellikle orijinal depoyu klonlamayı, belirli bağımlılıkları yönetmeyi ve karmaşık komut satırı betiklerini yürütmeyi gerektirir. Karışık hassasiyetli eğitim ve MegEngine aracılığıyla çok düğümlü kurulumlar gibi gelişmiş özellikleri desteklese de, hızlı prototiplemeye ihtiyaç duyan geliştiriciler için öğrenme eğrisi dik olabilir.

Ultralytics'in Avantajı

Buna karşılık, Ultralytics olağanüstü derecede akıcı bir kullanıcı deneyimine öncelik verir. ultralytics Python paketi ile geliştiriciler, minimum şablon kodla bir modeli yükleyebilir, eğitebilir ve doğrulayabilir. Ultralytics, karmaşık veri artırmalarını, hiperparametre evrimini ve öğrenme oranı zamanlamasını otomatik olarak yönetir.

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

Ayrıca, YOLOv5'in çok yönlülüğü standart nesne tespitinin ötesine geçerek, aynı tutarlı API içinde görüntü sınıflandırma ve örnek segmentasyon için sağlam destek sunar.

Kolaylaştırılmış Dağıtım

Eğitiminiz tamamlandığında, bir YOLOv5 modelini CoreML, TFLite veya OpenVINO'ya dışa aktarmak, çalıştırmak kadar basittir model.export(format="onnx"). Bu, araştırma odaklı depolarda yaygın olarak ihtiyaç duyulan üçüncü taraf dönüştürme betiklerine olan ihtiyacı ortadan kaldırır.

Gerçek Dünya Uygulamaları

Bu modeller arasında seçim yapmak, dağıtım ortamınıza ve teknik gereksinimlerinize bağlıdır:

  • Perakende ve Envanter Yönetimi: NVIDIA Jetson gibi kenar cihazlarda gerçek zamanlı ürün tanıma gerektiren uygulamalar için YOLOv5 son derece uygundur. Minimal bellek ayak izi ve hızlı TensorRT çıkarım hızları, kare düşürmeden çoklu kamera track (takibini) mümkün kılar.
  • Akademik Araştırma ve Özel Mimariler:YOLOX araştırma camiasında oldukça saygı görmektedir. Ayrık başlığı ve anchor-free (çapa-sız) yapısı, yeni etiket atama stratejileri denemek isteyen mühendisler veya geleneksel çapa kutularının genelleme yapamadığı veri kümeleri üzerinde çalışanlar için mükemmel bir temel oluşturur.
  • Tarımsal Yapay Zeka: Drone'lar aracılığıyla meyve detect (tespiti) veya yabani ot tanımlama gibi hassas tarım görevleri için, Ultralytics Platformu kullanılarak YOLOv5 modellerini eğitme ve dağıtma kolaylığı, alan uzmanlarının derin makine öğrenimi mühendisliği geçmişine ihtiyaç duymadan yapay zeka çözümleri uygulamasını sağlar.

Kullanım Durumları ve Öneriler

YOLOv5 ve YOLOX arasında seçim yapmak, projenizin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerinize bağlıdır.

YOLOv5 Ne Zaman Tercih Edilmeli?

YOLOv5, aşağıdaki durumlar için güçlü bir seçenektir:

  • Kanıtlanmış Üretim Sistemleri: YOLOv5'in uzun süreli istikrar geçmişinin, kapsamlı dokümantasyonunun ve büyük topluluk desteğinin değerli olduğu mevcut dağıtımlar.
  • Kaynak Kısıtlı Eğitim: Sınırlı GPU kaynaklarına sahip ortamlarda, YOLOv5'in verimli eğitim hattının ve daha düşük bellek gereksinimlerinin avantaj sağladığı durumlar.
  • Kapsamlı Dışa Aktarma Formatı Desteği: ONNX, TensorRT, CoreML ve TFLite dahil olmak üzere birçok formatta dağıtım gerektiren projeler.

Ne Zaman YOLOX Seçmeli

YOLOX şunlar için önerilir:

  • Anchor-Free Algılama Araştırması: YOLOX'un temiz, anchor-free mimarisini yeni algılama başlıkları veya kayıp fonksiyonları denemek için bir temel olarak kullanan akademik araştırmalar.
  • Ultra Hafif Kenar Cihazları: YOLOX-Nano varyantının son derece küçük ayak izinin (0.91M parametre) kritik olduğu mikrodenetleyicilerde veya eski mobil donanımlarda dağıtım.
  • SimOTA Etiket Atama Çalışmaları: Optimal taşıma tabanlı etiket atama stratejilerini ve bunların eğitim yakınsaması üzerindeki etkilerini araştıran projeler.

Ultralytics (YOLO26) Ne Zaman Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Görsel Yapay Zekanın Geleceği: YOLO26 Sahneye Çıkıyor

Hem YOLOv5 hem de YOLOX bilgisayar görüşü tarihinde yerlerini sağlamlaştırmış olsa da, bu alan hızla ilerlemektedir. Bugün yeni projelere başlayan geliştiriciler için Ultralytics, en yeni amiral gemisi modeli YOLO26'yı keşfetmelerini şiddetle tavsiye eder.

Ocak 2026'da piyasaya sürülen YOLO26, hem performans hem de kullanılabilirlik açısından büyük bir ilerlemeyi temsil etmektedir. Çığır açan uçtan uca NMS-free (NMS'siz) bir tasarım sunarak Non-Maximum Suppression (Maksimum Olmayan Bastırma) son işlemeyi tamamen ortadan kaldırır. Bu, gecikme değişkenliğini önemli ölçüde azaltır ve düşük güçlü cihazlarda dağıtım mantığını basitleştirir.

Ayrıca, YOLO26 yeni MuSGD Optimize Ediciyi—LLM eğitim yeniliklerinden esinlenilen SGD ve Muon'un bir hibriti—inanılmaz derecede kararlı ve hızlı yakınsama için kullanır. DFL Kaldırma (basitleştirilmiş dışa aktarım ve daha iyi kenar/düşük güçlü cihaz uyumluluğu için Distribution Focal Loss kaldırıldı) ile YOLO26, %43'e kadar daha hızlı CPU çıkarımı elde ederek modern kenar bilişim, robotik ve IoT uygulamaları için nihai model konumunu sağlamlaştırır. Ek olarak, ProgLoss + STAL, küçük nesne tanımada önemli iyileştirmelerle geliştirilmiş kayıp fonksiyonları sunar; bu da IoT, robotik ve hava görüntüleme için kritik öneme sahiptir. Önceki nesillerle ilgilenen kullanıcılar YOLO11'i de inceleyebilir, ancak YOLO26 tartışmasız son teknoloji tercihtir.

Sonuç

Hem YOLOv5 hem de YOLOX inanılmaz nesne detect (tespit) yetenekleri sunar. YOLOX, anchor-free (çapa-sız) tasarımların 2021'de geleneksel yöntemlerle rekabet edebileceğini ve onları aşabileceğini kanıtlayarak mimari sınırları zorladı. Ancak, YOLOv5, benzersiz kullanım kolaylığı, geniş ekosistemi ve eğitim sırasında daha düşük bellek gereksinimleri nedeniyle baskın bir güç olmaya devam etmektedir.

Ticari uygulamaların büyük çoğunluğu için Ultralytics ekosistemi, ham bir veri kümesinden dağıtılmış bir üretim modeline en hızlı yolu sunar. İster denenmiş ve kanıtlanmış YOLOv5'i kullanın ister en son teknoloji YOLO26'ya yükseltin, geliştiriciler vizyon yapay zekasını erişilebilir, verimli ve yüksek performanslı hale getirmek için tasarlanmış bir çerçeveden faydalanır.


Yorumlar