YOLOv5 ve YOLOX: Kapsamlı Bir Teknik Karşılaştırma

Gerçek zamanlı bilgisayarlı görü dünyasının evrimi, farklı mimarilerin hız ve doğruluk sınırlarını zorladığı sayısız dönüm noktasına tanıklık etmiştir. Bu alandaki iki son derece etkili model YOLOv5 ve YOLOX'tur. Her ikisi de nesne tespiti konusundaki yüksek performanslarıyla tanınsa da, mimari açıdan temelde farklı yaklaşımlar benimserler.

Bu kılavuz, geliştiricilerin ve araştırmacıların vizyon yapay zeka projeleri için doğru aracı seçmelerine yardımcı olmak amacıyla bu iki modelin mimarilerini, performans metriklerini, eğitim metodolojilerini ve ideal dağıtım senaryolarını karşılaştırarak derinlemesine bir teknik analiz sunmaktadır.

Model Genel Bakışları ve Mimari Farklılıklar

Ultralytics YOLOv5

Ultralytics tarafından tanıtılan YOLOv5, performans, kullanım kolaylığı ve bellek verimliliği arasındaki olağanüstü dengesi sayesinde hızla bir endüstri standardı haline geldi. PyTorch çerçevesi üzerine yerel olarak inşa edilen YOLOv5, çapa tabanlı (anchor-based) bir mimari kullanır. Nesne konumlarını tahmin etmek için önceden tanımlanmış sınırlayıcı kutu (bounding box) şekillerine dayanır, bu da onu standart nesne tespiti görevleri için son derece etkili kılar.

YOLOv5'in en büyük güçlerinden biri, iyi korunmuş ekosistemidir. Kapsamlı dokümantasyona, inanılmaz derecede basit bir Python API'sine ve Ultralytics Platform ile yerel entegrasyona sahiptir. Bu, geliştiricilerin veri seti etiketlemeden eğitime ve ONNX ve TensorRT gibi formatlara dışa aktarmaya sorunsuz bir şekilde geçiş yapmalarını sağlar.

YOLOv5 hakkında daha fazla bilgi edin

Ekosistem Avantajı

Ultralytics YOLO modelleri, genellikle karmaşık Transformer tabanlı alternatiflere kıyasla eğitim sırasında önemli ölçüde daha az GPU belleği gerektirir. Bu düşük bellek ayak izi, YOLOv5'i tüketici sınıfı donanımlarla çalışan araştırmacılar için oldukça erişilebilir kılar.

Megvii YOLOX

Megvii araştırmacıları tarafından geliştirilen YOLOX, YOLO ailesine çapa içermeyen (anchor-free) bir tasarım getirerek farklı bir yol izledi. YOLOX, çapa kutularını ortadan kaldırarak tespit başlığını basitleştirir ve eğitim sırasında manuel ayarlama gerektiren sezgisel parametrelerin sayısını önemli ölçüde azaltır.

YOLOX ayrıca sınıflandırma ve regresyon görevlerini farklı ağ dallarına ayıran ayrıştırılmış (decoupled) bir başlık içerir ve SimOTA etiket atama stratejisini kullanır. Bu yenilikler, akademik araştırma ile endüstriyel uygulamalar arasındaki boşluğu doldurarak YOLOX'u, nesne ölçeklerinin büyük ölçüde değiştiği ortamlarda özellikle etkili hale getirir.

YOLOX hakkında daha fazla bilgi edin

Performans ve Metrikler

Bilgisayarlı görü modellerini değerlendirirken, ortalama Hassasiyet (mAP) ile çıkarım hızı arasındaki ödünleşim kritiktir. Her iki model de farklı donanım kısıtlamalarına uyacak şekilde çeşitli boyutlar (Nano'dan Extra-Large'a kadar) sunar.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

YOLOXx biraz daha yüksek bir tepe doğruluğuna (51.1 mAP) ulaşsa da, YOLOv5 CPU ve GPU donanımlarında çok daha sağlam ve kapsamlı bir şekilde test edilmiş bir dağıtım hattı sunar. YOLOv5 için TensorRT hızları, uç bilişim cihazları için derin optimizasyonunu vurgulayarak onu gerçek zamanlı video analitiği için son derece güvenilir bir seçenek haline getirir.

Eğitim Metodolojileri ve Kullanılabilirlik

Geliştirici deneyimi, bu iki mimari arasında önemli ölçüde farklılık gösterir.

YOLOX Yaklaşımı

YOLOX eğitimi genellikle orijinal deponun klonlanmasını, belirli bağımlılıkların yönetilmesini ve karmaşık komut satırı betiklerinin yürütülmesini gerektirir. MegEngine aracılığıyla karma hassasiyetli eğitim ve çok düğümlü kurulumlar gibi gelişmiş özellikleri desteklese de, hızlı prototiplemeye ihtiyaç duyan geliştiriciler için öğrenme eğrisi dik olabilir.

Ultralytics Avantajı

Buna karşılık Ultralytics, olağanüstü düzeyde akıcı bir kullanıcı deneyimine öncelik verir. ultralytics Python paketi ile geliştiriciler, minimum ortak kodla bir modeli yükleyebilir, eğitebilir ve doğrulayabilir. Ultralytics, karmaşık veri artırmaları (augmentations), hiperparametre evrimi ve öğrenme oranı planlamasını otomatik olarak yönetir.

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

Ayrıca YOLOv5'in çok yönlülüğü, standart nesne tespitinin ötesine geçerek tamamen aynı tutarlı API içinde görüntü sınıflandırma ve örnek segmentasyonu için de güçlü destek sunar.

Kolaylaştırılmış Dağıtım

Eğitimin tamamlandığında, bir YOLOv5 modelini CoreML, TFLite veya OpenVINO'ya aktarmak model.export(format="onnx") komutunu çalıştırmak kadar basittir. Bu, araştırmaya odaklı depoların genellikle gerektirdiği üçüncü taraf dönüştürme betiklerine olan ihtiyacı ortadan kaldırır.

Gerçek Dünya Uygulamaları

Bu modeller arasında seçim yapmak, dağıtım ortamına ve teknik gereksinimlerine bağlıdır:

  • Perakende ve Envanter Yönetimi: NVIDIA Jetson gibi uç cihazlarda gerçek zamanlı ürün tanıma gerektiren uygulamalar için YOLOv5 son derece uygundur. Minimum bellek ayak izi ve hızlı TensorRT çıkarım hızları, kare atlamadan çoklu kamera takibini mümkün kılar.
  • Akademik Araştırma ve Özel Mimariler: YOLOX, araştırma topluluğunda oldukça saygı görür. Ayrıştırılmış başlığı ve çapa içermeyen yapısı, yeni etiket atama stratejileriyle denemeler yapmak isteyen mühendisler veya geleneksel çapa kutularının genelleştirilemediği veri setlerinde çalışanlar için mükemmel bir temel oluşturur.
  • Tarımsal Yapay Zeka: Dronlar aracılığıyla meyve tespiti veya yabancı ot tanımlama gibi hassas tarım görevleri için, Ultralytics Platform kullanarak YOLOv5 modellerini eğitme ve dağıtma kolaylığı, alan uzmanlarının derin makine öğrenmesi mühendisliği geçmişine ihtiyaç duymadan yapay zeka çözümlerini uygulamalarına olanak tanır.

Kullanım Durumları ve Öneriler

YOLOv5 ve YOLOX arasında seçim yapmak, projenin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

Ne Zaman YOLOv5 Seçilmeli

YOLOv5 şunlar için güçlü bir seçimdir:

  • Kanıtlanmış Üretim Sistemleri: YOLOv5'in uzun istikrar geçmişine, kapsamlı dokümantasyonuna ve devasa topluluk desteğine değer verilen mevcut dağıtımlar.
  • Kaynak Kısıtlı Eğitim: YOLOv5'in verimli eğitim hattının ve daha düşük bellek gereksinimlerinin avantajlı olduğu, sınırlı GPU kaynağına sahip ortamlar.
  • Kapsamlı Dışa Aktarma Formatı Desteği: ONNX, TensorRT, CoreML ve TFLite dahil olmak üzere birçok formatta dağıtım gerektiren projeler.

YOLOX ne zaman seçilmeli?

YOLOX şunlar için önerilir:

  • Çapasız Algılama Araştırması: Yeni algılama başlıkları veya kayıp işlevleri denemek için YOLOX'un temiz, çapasız mimarisini temel olarak kullanan akademik araştırma.
  • Ultra Hafif Uç Cihazlar: YOLOX-Nano varyantının son derece küçük ayak izinin (0.91M parametre) kritik olduğu mikrodenetleyicilerde veya eski mobil donanımlarda dağıtım yapılması.
  • SimOTA Etiket Atama Çalışmaları: Optimum taşıma tabanlı etiket atama stratejilerini ve bunların eğitim yakınsaması üzerindeki etkisini araştıran araştırma projeleri.

Ne Zaman Ultralytics (YOLO26) Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Görü Yapay Zekasının Geleceği: YOLO26 ile Tanış

Hem YOLOv5 hem de YOLOX, bilgisayarlı görü tarihindeki yerlerini sağlamlaştırmış olsa da, alan hızla ilerliyor. Bugün yeni projelere başlayan geliştiriciler için Ultralytics, en yeni amiral gemisi modeli olan YOLO26'yı keşfetmeyi şiddetle önerir.

Ocak 2026'da piyasaya sürülen YOLO26, hem performans hem de kullanılabilirlik açısından büyük bir ileri atılımı temsil eder. Çığır açan bir uçtan uca NMS içermeyen (NMS-free) tasarım sunarak Non-Maximum Suppression (NMS) son işleme aşamasını tamamen ortadan kaldırır. Bu, gecikme değişkenliğini önemli ölçüde azaltır ve düşük güç tüketen cihazlarda dağıtım mantığını basitleştirir.

Ayrıca YOLO26, son derece kararlı ve hızlı yakınsama için LLM eğitim yeniliklerinden esinlenen SGD ve Muon'un bir melezi olan yeni MuSGD Optimizer'ı kullanır. DFL Removal (basitleştirilmiş dışa aktarma ve daha iyi uç/düşük güç tüketen cihaz uyumluluğu için Dağılımsal Odak Kaybı kaldırılmıştır) sayesinde YOLO26, %43'e kadar daha hızlı CPU çıkarımı elde ederek modern uç bilişim, robotik ve IoT uygulamaları için en üstün model olma konumunu sağlamlaştırır. Buna ek olarak, ProgLoss + STAL, IoT, robotik ve hava görüntüleri için kritik öneme sahip küçük nesne tanımada kayda değer iyileştirmelerle daha gelişmiş kayıp fonksiyonları sunar. Önceki nesillerle ilgilenen kullanıcılar YOLO11 modeline de göz atabilir, ancak YOLO26 tartışmasız son teknoloji seçenektir.

Sonuç

YOLOv5 ve YOLOX, inanılmaz nesne tespiti yetenekleri sunar. YOLOX, 2021'de çapa içermeyen tasarımların geleneksel yöntemlerle rekabet edebileceğini ve onları geride bırakabileceğini kanıtlayarak mimari sınırları zorladı. Ancak YOLOv5, benzersiz kullanım kolaylığı, kapsamlı ekosistemi ve eğitim sırasındaki daha düşük bellek gereksinimleri nedeniyle baskın bir güç olmaya devam ediyor.

Çoğu ticari uygulama için Ultralytics ekosistemi, ham veri setinden dağıtılmış bir üretim modeline giden en hızlı yolu sağlar. İster denenmiş ve doğrulanmış YOLOv5 kullanılsın ister en son teknoloji YOLO26'ya geçilsin, geliştiriciler vizyon yapay zekasını erişilebilir, verimli ve yüksek performanslı kılmak için tasarlanmış bir çerçeveden faydalanırlar.

Yorumlar