İçeriğe geç

YOLOX ve YOLOv6-3.0 Karşılaştırması: Çapa (Anchor) İçermeyen ve Endüstriyel Nesne Algılamaya Kapsamlı Bir Rehber

Bilgisayar görüşünün evrimi, büyük ölçüde YOLO serisindeki hızlı gelişmelerle şekillenmiştir. Dağıtımınız için doğru mimariyi seçmek genellikle ham verim, mimari basitlik ve eğitim verimliliği arasında bir denge kurmaya dayanır. Bu yolculuktaki iki önemli kilometre taşı, YOLOX'un çapa içermeyen araştırma odağı ve YOLOv6-3.0'ın yüksek optimize edilmiş endüstriyel verimidir.

Bu teknik karşılaştırma, mimari farklılıklarını, performans metriklerini ve ideal kullanım senaryolarını detaylandırırken, aynı zamanda nihai uç ve bulut dağıtım çözümü arayan geliştiriciler için Ultralytics YOLO26'nın yeni nesil yeteneklerini de tanıtır.

YOLOX: Araştırma ve Endüstriyi Birleştirme

Megvii araştırmacıları tarafından geliştirilen YOLOX, YOLO mimarisini tamamen çapa içermez hale getirerek basitleştirmeye yönelik büyük bir değişim olarak tanıtıldı.

Mimari Öne Çıkanlar

YOLOX, çapa içermeyen bir tasarımı YOLO ailesine başarıyla entegre etti. Önceden tanımlanmış çapa kutularını ortadan kaldırarak, model eğitim sırasında gereken tasarım parametrelerinin ve sezgisel ayarlamaların sayısını önemli ölçüde azaltır. Bu, YOLOX'u manuel çapa yeniden hesaplamasına gerek kalmadan çeşitli özel veri kümelerine yüksek oranda uyarlanabilir hale getirir.

Ayrıca, YOLOX ayrık bir başlık mimarisi tanıttı. Sınıflandırma ve regresyon görevlerini farklı dallara ayırarak, model bir nesnenin ne olduğu ile nerede bulunduğu arasındaki doğal çelişkiyi çözer. SimOTA etiket atama stratejisiyle birleştiğinde, YOLOX daha hızlı yakınsama ve geliştirilmiş ortalama hassasiyet (mAP) elde eder.

YOLOX hakkında daha fazla bilgi edinin

Çıpasız Avantajı

YOLOX gibi çapa içermeyen dedektörler, yeni verilerle eşleşmeyebilecek sabit sınırlayıcı kutu öncüllerine dayanmadıkları için, alışılmadık nesne en boy oranlarına sahip özel veri kümelerinde genellikle daha iyi performans gösterir.

YOLOv6-3.0: Endüstriyel Ağır Sıklet

Meituan bünyesindeki Vision AI Departmanı tarafından geliştirilen YOLOv6-3.0, özellikle TensorRT gibi donanım hızlandırıcılarını kullanan NVIDIA GPU'larında maksimum endüstriyel verim için tasarlanmıştır.

  • Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, ve diğerleri.
  • Kuruluş: Meituan
  • Tarih: 2023-01-13
  • Arxiv:2301.05586
  • GitHub:meituan/YOLOv6

Dağıtım İçin Optimizasyon

YOLOv6-3.0, GPU kullanımını maksimize etmeye odaklanır. Yüksek çıkarım hızlarını korurken özellik füzyonunu artırmak için boyun kısmında Çift Yönlü Birleştirme (BiC) modülü sunar. Çıkarım aşaması tamamen çapa içermezken, YOLOv6-3.0, eğitim aşamasında çapa tabanlı kararlılıktan faydalanmak için yenilikçi bir Çapa Destekli Eğitim (AAT) stratejisi kullanır.

Backbone, donanım dostu EfficientRep mimarisi kullanılarak inşa edilmiştir ve modern hızlandırıcılarda bellek erişim maliyetlerini en aza indirmek ve hesaplama yoğunluğunu maksimize etmek için özel olarak tasarlanmıştır. Bu, YOLOv6'yı sunucu tarafı video analizi için olağanüstü güçlü bir aday yapar.

YOLOv6 hakkında daha fazla bilgi edinin.

Performans Karşılaştırması

Bu modelleri karşılaştırırken, geliştiricilerin ham doğruluğu çıkarım hızı ve parametre sayısı ile dengelemesi gerekir. Aşağıdaki tablo, her iki model ailesinin çeşitli boyutlardaki performansını vurgulamaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

YOLOv6-3.0, daha büyük varyantlar için üstün mAP ve mükemmel TensorRT hızları gösterirken, YOLOX basitliği ve eski donanımlardaki sağlam performansı nedeniyle oldukça rekabetçi kalmaktadır.

Kullanım Durumları ve Öneriler

YOLOX ve YOLOv6 arasında seçim yapmak, projenizin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerinize bağlıdır.

Ne Zaman YOLOX Seçmeli

YOLOX, aşağıdakiler için güçlü bir seçenektir:

  • Anchor-Free Algılama Araştırması: YOLOX'un temiz, anchor-free mimarisini yeni algılama başlıkları veya kayıp fonksiyonları denemek için bir temel olarak kullanan akademik araştırmalar.
  • Ultra Hafif Kenar Cihazları: YOLOX-Nano varyantının son derece küçük ayak izinin (0.91M parametre) kritik olduğu mikrodenetleyicilerde veya eski mobil donanımlarda dağıtım.
  • SimOTA Etiket Atama Çalışmaları: Optimal taşıma tabanlı etiket atama stratejilerini ve bunların eğitim yakınsaması üzerindeki etkilerini araştıran projeler.

YOLOv6 Ne Zaman Tercih Edilmeli?

YOLOv6 şunlar için önerilir:

  • Endüstriyel Donanım Farkındalıklı Dağıtım: Modelin donanım farkındalıklı tasarımının ve verimli yeniden parametrelendirmesinin belirli hedef donanımlarda optimize edilmiş performans sağladığı senaryolar.
  • Hızlı Tek Aşamalı Algılama: Kontrollü ortamlarda gerçek zamanlı video işleme için GPU üzerinde ham çıkarım hızına öncelik veren uygulamalar.
  • Meituan Ekosistem Entegrasyonu: Halihazırda Meituan'ın teknoloji yığını ve dağıtım altyapısı içinde çalışan ekipler.

Ultralytics (YOLO26) Ne Zaman Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Ultralytics'in Avantajı

Hem Megvii hem de Meituan güçlü araştırma depoları sunsa da, bu modelleri üretimde dağıtmak genellikle önemli mühendislik yükü gerektirir. Entegre Ultralytics ekosistemi, birleşik ve kapsamlı bir şekilde belgelenmiş bir API sunarak bu engelleri ortadan kaldırır.

Ultralytics paketinden yararlanarak geliştiriciler, eşsiz bir kullanıcı deneyimine erişim sağlar. Bu, yerleşik otomatik artırma, eğitim sırasında yüksek verimli bellek yönetimi (RTDETR gibi transformer modellerine kıyasla VRAM gereksinimlerini önemli ölçüde düşürür) ve ONNX ve OpenVINO gibi formatlara sorunsuz dışa aktarma hatlarını içerir.

Uzmanlaşmış modellerin aksine, Ultralytics mimarileri doğası gereği çok yönlüdür; kutudan çıktığı gibi Nesne Algılama, Örnek Segmentasyonu, Poz Tahmini, Görüntü Sınıflandırma ve Yönlü Sınırlayıcı Kutular (OBB) destekler.

YOLO26 Sahneye Çıkıyor: Nihai Uç Çözüm

Yeni bilgisayar görüşü projelerine başlayan ekipler için, yeni piyasaya sürülen Ultralytics YOLO26'ya yükseltmeyi şiddetle tavsiye ederiz. YOLO11 ve YOLOv8'in başarıları üzerine inşa edilen YOLO26, paradigma değiştiren yenilikler sunar:

  • Uçtan Uca NMS İçermeyen Tasarım: İlk olarak YOLOv10'da keşfedilen YOLO26, Non-Maximum Suppression (NMS) sonrası işlem ihtiyacını doğal olarak ortadan kaldırır. Bu, gerçek zamanlı robotik için kritik olan deterministik, ultra düşük gecikmeli çıkarımı garanti eder.
  • MuSGD Optimizer: Moonshot AI'nin Kimi K2'si gibi LLM eğitim tekniklerinden esinlenen YOLO26, inanılmaz derecede kararlı eğitim dinamikleri ve daha hızlı yakınsama elde etmek için MuSGD optimize edicisini (SGD ve Muon'un bir hibriti) kullanır.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Distribution Focal Loss (DFL) kaldırarak ve ağ başlığını basitleştirerek, YOLO26, CPU yürütmesine dayanan uç cihazlar için yoğun bir şekilde optimize edilmiştir ve uç senaryolarda YOLOv6'yı önemli ölçüde geride bırakır.
  • ProgLoss + STAL: Bu gelişmiş kayıp formülasyonları, küçük nesne tespitinde kayda değer iyileştirmeler sunarak YOLO26'yı hava görüntüleri ve mikroskobik kusur denetimi için ideal kılar.

YOLO26 hakkında daha fazla bilgi edinin

Birleşik Eğitim Örneği

Ultralytics Python API'sini kullanarak, son teknoloji modelleri eğitmek yalnızca birkaç satır kod gerektirir. Bu aynı temiz arayüz, eski bir YOLO modelini test ediyor olsanız da en yeni YOLO26 çerçevesini dağıtıyor olsanız da geçerlidir.

from ultralytics import YOLO

# Load the next-generation YOLO26 model (NMS-free, optimized for edge)
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# The ecosystem handles downloading, caching, and auto-batching natively
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model and print mAP metrics
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")

# Export the model for edge deployment
model.export(format="onnx")

Ultralytics Platform

Daha sorunsuz bir deneyim için, veri kümelerinizi yönetin, deneyleri takip edin ve modelleri bulutta sıfır kodlu Ultralytics Platformu'nu kullanarak eğitin.

Kullanım Durumu Önerileri

Bu mimariler arasında karar verirken, özel donanım kısıtlamalarınızı ve proje gereksinimlerinizi göz önünde bulundurun:

  • YOLOX'u seçin eğer etiket atama stratejileri üzerine akademik araştırma yapıyorsanız veya özel mimari değişiklikler için saf, anlaşılması kolay, anchor-free bir temel gerekiyorsa.
  • YOLOv6-3.0'ı seçin eğer üst düzey NVIDIA GPU'larla (A100 veya T4 gibi) dolu bir endüstriyel sunucu rafına dağıtım yapıyorsanız ve yüzlerce video akışını eş zamanlı olarak işlemek için büyük batch boyutlarını ve TensorRT optimizasyonlarını kullanabiliyorsanız.
  • YOLO26'yı seçin modern uygulamaların büyük çoğunluğu için. Eğer IoT cihazları, dronlar veya cep telefonları için Edge AI uygulamaları geliştiriyorsanız, YOLO26'nın yerel NMS-free tasarımı, CPU optimizasyonları ve kapsamlı ekosistem desteği, eğitim ve üretim arasındaki boşluğu kapatmak için tartışmasız en iyi seçenek olmasını sağlar.

Yorumlar