Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX ve YOLOv5#

Doğru nesne algılama modelini seçmek, herhangi bir bilgisayarlı görü projesinin başarısını belirleyen kritik bir karardır. Bu rehber, yapay zeka dünyasının iki önemli modeli olan Megvii'nin YOLOX modeli ile Ultralytics YOLOv5 arasında kapsamlı bir teknik karşılaştırma sunmaktadır. Mimarilerini, performans metriklerini ve eğitim ekosistemlerini analiz ederek, geliştiricilerin ve araştırmacıların kendi dağıtım ortamları için bilinçli bir seçim yapmalarına yardımcı olmayı hedefliyoruz.

Link to this sectionModellere Giriş#

Her iki model de gerçek zamanlı nesne algılamada hızlı ilerlemenin olduğu bir dönemde ortaya çıkmış olsa da, performanslarına ulaşmak için farklı mimari felsefeler benimsemişlerdir.

Link to this sectionYOLOX: Çapasız (Anchor-Free) Bir Yaklaşım#

Megvii bünyesinde Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun tarafından 18 Temmuz 2021'de yayınlanan YOLOX, geleneksel çapa kutularından (anchor boxes) uzaklaşarak önemli bir değişim başlattı. Arxiv teknik raporlarında belgelendiği üzere YOLOX, ayrıştırılmış bir başlık (decoupled head) ve SimOTA etiket atama stratejisi ile çapasız bir tasarımı bütünleştirdi. Bu tasarım, akademik araştırma ile endüstriyel uygulama arasındaki boşluğu doldurmayı ve standart veri setlerinde güçlü bir performans sunmayı amaçlıyordu.

YOLOX hakkında daha fazla bilgi edin

Link to this sectionYOLOv5: Üretim Odaklı Vision AI için Standart#

Glenn Jocher tarafından yazılan ve Ultralytics tarafından 26 Haziran 2020'de yayınlanan YOLOv5, konuşlandırılmış bilgisayarlı görü için hızla endüstri standardı haline geldi. PyTorch framework üzerinde doğal olarak inşa edildiği için; sunduğu benzersiz kullanım kolaylığı, son derece hızlı eğitim süreci ve oldukça geliştirilmiş deposuyla en gelişmiş yapay zekayı herkes için ulaşılabilir kıldı. YOLOv5'in mimarisi hız, doğruluk ve dağıtım kolaylığı arasındaki mükemmel dengeye odaklanarak, onu uç cihazlardan devasa bulut dağıtımlarına kadar her şey için favori haline getirdi.

YOLOv5 hakkında daha fazla bilgi edin

Link to this sectionMimari Farklılıklar#

Bu ağlar arasındaki temel mekanik farkları anlamak, neden farklı görevlerde farklı performans gösterdiklerini açıklar.

Link to this sectionÇapasız (Anchor-Free) vs. Çapa Tabanlı (Anchor-Based)#

En belirgin karşıtlık, YOLOX'un çapasız mekanizmasıdır. YOLOv5 gibi geleneksel modeller, sınırlayıcı kutuları tahmin etmek için önceden tanımlanmış çapa kutularına dayanır; bu da ideal çapa boyutlarını belirlemek için eğitim veri setinde kümeleme analizi yapılmasını gerektirir. YOLOX bunu ortadan kaldırarak sınırlayıcı kutu koordinatlarını doğrudan her uzamsal konumda tahmin eder. Çapasız yaklaşım tasarım parametrelerinin ve buluşsal ayarların sayısını azaltırken, YOLOv5'in otomatik çapa işlevi (auto-anchor) ile desteklenen rafine çapa tabanlı yaklaşımı, kurulumdan itibaren son derece kararlı ve öngörülebilir bir eğitim yakınsaması sağlar.

Link to this sectionAyrıştırılmış Başlık (Decoupled Head) vs. Bütünleşik Başlık (Coupled Head)#

YOLOX, sınıflandırma ve regresyon görevlerinin ayrı sinir ağı dallarına ayrıldığı ayrıştırılmış bir başlık kullanır. Yazarlar, bunun uzamsal ve anlamsal özellik öğrenimi arasındaki çatışmaları çözdüğünü savunmuşlardır. Buna karşılık YOLOv5, hesaplama verimliliğini en üst düzeye çıkaran ve gerçek zamanlı uç bilişim için kritik olan çıkarım gecikmesini azaltan, oldukça optimize edilmiş bütünleşik bir başlık (ilk sürümlerinde) kullanmıştır.

Mimari Evrim

YOLOX 2021'de ayrıştırılmış başlığın öncülüğünü yapmış olsa da, Ultralytics daha sonra YOLOv8 ve son teknoloji ürünü YOLO26 gibi sonraki modellerde ayrıştırılmış mimarileri benimseyip mükemmelleştirerek her iki dünyanın en iyi özelliklerini birleştirdi.

Link to this sectionEtiket Atama Stratejisi#

YOLOX, etiket ataması için gerçek dünyadaki nesnelerin tahminlerle eşleştirilmesini bir Optimal Taşıma (Optimal Transport) problemi olarak formüle eden SimOTA'yı kullanır. Bu dinamik atama, kalabalık sahnelerin işlenmesini iyileştirir. YOLOv5 ise, yüksek kaliteli pozitif örneklerin kayıp fonksiyonuna tutarlı bir şekilde beslenmesini sağlayan sağlam bir şekil kuralı tabanlı atama kullanır; bu da efsanevi eğitim kararlılığına katkıda bulunur.

Link to this sectionPerformans ve Kıyaslamalar#

Hız ve doğruluk arasındaki ödünleşim, bu mimariler için en büyük sınavdır. Aşağıdaki tablo, çeşitli model boyutlarının standart kriterlerdeki performansını göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOX özellikle daha büyük varyantlarında rekabetçi mAP skorları elde etse de, YOLOv5 genelinde TensorRT çıkarım hızında kayda değer bir avantajı korumaktadır. Örneğin YOLOv5s modeli, her milisaniyenin önemli olduğu gerçek zamanlı uygulamalar için onu oldukça cazip kılan olağanüstü hız-doğruluk oranları sağlar.

Link to this sectionUltralytics Avantajı: Eğitim ve Kullanılabilirlik#

Araştırmadan üretime geçerken, bir modeli çevreleyen ekosistem genellikle modelin kendisi kadar önemlidir. İşte burada, Ultralytics ekosisteminin avantajları bariz bir şekilde ortaya çıkmaktadır.

Link to this sectionKolaylaştırılmış Kullanıcı Deneyimi#

YOLOv5, geliştiricilere sunduğu "sıfırdan kahramana" deneyimiyle evrensel olarak övülür. Ultralytics Python API ve CLI, modelleri tek satırlık kodlarla yüklemenize, eğitmenize ve dağıtmanıza olanak tanır. Buna karşılık, YOLOX'u Megvii GitHub deposundan çalıştırmak, daha fazla manuel ortam değişkeni yapılandırması, karmaşık Python yolu kurulumları ve akademik araştırma kod tabanlarına özgü daha dik bir öğrenme eğrisi gerektirir.

Link to this sectionEğitim Verimliliği ve Bellek Gereksinimleri#

Ultralytics modelleri, eğitim sırasında bellek kullanımını en aza indirmek için titizlikle tasarlanmıştır. YOLOv5, RT-DETR gibi yoğun parametreli transformer modellerine veya optimize edilmemiş araştırma modellerine kıyasla önemli ölçüde daha az CUDA belleği gerektirir. Bu durum, geliştiricilerin tüketici sınıfı donanımlarda daha büyük yığın boyutlarıyla (batch sizes) eğitim yapmasına olanak tanıyarak yinelemeli geliştirme döngüsünü hızlandırır.

Link to this sectionGörevler Arasında Çok Yönlülük#

YOLOX sadece bir nesne algılama çerçevesi olsa da, Ultralytics ekosistemi YOLOv5'i birden fazla görü görevini destekleyecek şekilde geliştirmiştir. Kutudan çıktığı haliyle, aynı API sözdizimini kullanarak Görüntü Sınıflandırma, Örnek Segmentasyonu ve nesne algılama yapabilirsin.

Sürekli İnovasyon

Poz Tahmini veya Yönelimli Sınırlayıcı Kutu (OBB) algılama gibi daha gelişmiş görevlere ihtiyacın varsa, tüm bunları en üst düzey doğrulukla doğal olarak destekleyen en yeni Ultralytics YOLO26 mimarisine yükseltmeni şiddetle öneririz.

Link to this sectionKod Karşılaştırması#

Kullanılabilirlik farkı en iyi kod ile gösterilir.

YOLOv5 ile Eğitim:

from ultralytics import YOLO

# Load a pretrained YOLOv5s model
model = YOLO("yolov5su.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")

# Display results
results[0].show()

YOLOX ile Eğitim: (Manuel depo kopyalama, setup.py kurulumu ve karmaşık CLI argümanları gerektirir)

# Example YOLOX training command
python tools/train.py -f exps/default/yolox_s.py -d 1 -b 64 --fp16 -o

Ultralytics yaklaşımı sürtünmeyi ortadan kaldırarak, yapılandırma dosyalarında hata ayıklamak yerine veri setine ve uygulama mantığına odaklanmanı sağlar. Ayrıca, Weights & Biases ve Comet ML için dahili entegrasyonlarla deneyimlerini takip etmek sorunsuzdur.

Link to this sectionİdeal Kullanım Durumları ve Gerçek Dünya Uygulamaları#

Bu modeller arasında seçim yapmak, projenin operasyonel ortamına bağlıdır.

Link to this sectionYOLOX'un Öne Çıktığı Yerler#

YOLOX, araştırmacıların çapasız paradigmaları veya etiket atama stratejilerini açıkça incelediği akademik ortamlarda güçlü bir aday olmaya devam etmektedir. Ayrıca, kalabalık sahne algılamanın mutlak birincil metrik olduğu ve uç dağıtım hızlarının ikincil olduğu senaryolarda da kullanışlıdır.

Link to this sectionYOLOv5'in Öne Çıktığı Alanlar#

YOLOv5, pratik dağıtımın tartışmasız şampiyonudur.

  • Yüksek Hızlı Üretim: Montaj hattı kusur algılama uygulamalarında, YOLOv5'in uç GPU'lardaki minimum çıkarım gecikmesi, ürünlerin bant yavaşlatılmadan denetlenmesini sağlar.
  • İHA ve Hava Görüntüleri: Verimli bellek ayak izi, tarım izleme ve yaban hayatı takibi gibi görevler için dronlardaki hafif eşlikçi bilgisayarlarda çalışmasına olanak tanır.
  • Akıllı Perakende: Otomatik ödemeden envanter yönetimine kadar, YOLOv5 binlerce mağaza kamerasında toplu dağıtım için kolayca TensorRT ve ONNX formatlarına dışa aktarılabilir.

Link to this sectionİleriye Bakış: YOLO26 Avantajı#

YOLOv5 efsanevi bir model olsa da yapay zeka alanı hızla ilerlemektedir. Bugün yeni bir projeye başlıyorsan, en yeni nesil Ultralytics modellerine bakmanı şiddetle tavsiye ederiz.

2026'da piyasaya sürülen Ultralytics YOLO26, devasa bir sıçramayı temsil eder. Dağıtım mantığını önemli ölçüde basitleştiren ve Non-Maximum Suppression (NMS) sonrası işleme ihtiyacını tamamen ortadan kaldıran Uçtan Uca NMS-Free Tasarım özelliğine sahiptir. Dağılım Odaklı Kayıp (DFL) işlevini kaldıran ve son teknoloji MuSGD Optimizer kullanan YOLO26, yeni ProgLoss + STAL kayıp işlevleri sayesinde özellikle küçük nesnelerde daha yüksek doğruluğu korurken, önceki nesillere göre %43'e kadar daha hızlı CPU çıkarımı sağlar.

İster YOLOv5'in savaşta test edilmiş güvenilirliğini, ister YOLO26'nın en ileri performansını seç, Ultralytics Platform, bilgisayarlı görü çözümlerini konseptten üretime sorunsuz bir şekilde taşımak için gereken en iyi araçlara sahip olmanı sağlar. Yapay zeka hattının tüm potansiyelini ortaya çıkarmak için kapsamlı Ultralytics dokümantasyonunu keşfettiğinden emin ol.

Katkıda Bulunanlar

Yorumlar