YOLOX ve YOLOv6-3.0: Çapadan Arındırılmış ve Endüstriyel Nesne Tespiti İçin Kapsamlı Bir Rehber
Bilgisayarlı görü dünyasının evrimi, büyük ölçüde YOLO serisindeki hızlı gelişmelerle tanımlanmıştır. Dağıtımın için doğru mimariyi seçmek, genellikle ham işleme kapasitesi, mimari basitlik ve eğitim verimliliği arasında bir denge kurmaya dayanır. Bu yolculuktaki iki önemli dönüm noktası, YOLOX'un çapadan arındırılmış (anchor-free) araştırma odağı ve YOLOv6-3.0'ın yüksek düzeyde optimize edilmiş endüstriyel işleme kapasitesidir.
Bu teknik karşılaştırma, mimari farklılıklarını, performans metriklerini ve ideal kullanım alanlarını incelerken, aynı zamanda nihai uç ve bulut dağıtım çözümü arayan geliştiriciler için Ultralytics YOLO26 modelinin yeni nesil yeteneklerini tanıtır.
YOLOX: Araştırma ve Endüstri Arasında Bir Köprü
Megvii araştırmacıları tarafından geliştirilen YOLOX, YOLO mimarisini tamamen çapadan arındırılmış (anchor-free) hale getirerek basitleştirmeye yönelik büyük bir değişim olarak tanıtıldı.
- Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, Jian Sun
- Kuruluş: Megvii
- Tarih: 18-07-2021
- Arxiv: 2107.08430
- GitHub: Megvii-BaseDetection/YOLOX
Mimari Öne Çıkanlar
YOLOX, çapadan arındırılmış bir tasarımı YOLO ailesine başarıyla entegre etti. Önceden tanımlanmış çapa kutularını ortadan kaldırarak, model eğitim sırasında gereken tasarım parametrelerinin ve sezgisel ayarların sayısını önemli ölçüde azaltır. Bu durum, YOLOX'un manuel çapa yeniden hesaplamasına gerek kalmadan çeşitli özel veri setlerine yüksek derecede uyum sağlamasını kolaylaştırır.
Ayrıca YOLOX, ayrık bir başlık (decoupled head) mimarisi sundu. Sınıflandırma ve regresyon görevlerini farklı dallara ayırarak model, bir nesnenin ne olduğu ve nerede bulunduğu arasındaki doğal çatışmayı çözer. SimOTA etiket atama stratejisi ile birleşen YOLOX, daha hızlı yakınsama ve gelişmiş ortalama hassasiyet (mAP) elde eder.
YOLOX hakkında daha fazla bilgi edin
YOLOX gibi çapadan arındırılmış dedektörler, yeni verilerle eşleşmeyebilecek sabit sınırlayıcı kutu ön kabullerine güvenmedikleri için olağandışı nesne en-boy oranlarına sahip özel veri setlerinde genellikle daha iyi performans gösterir.
YOLOv6-3.0: Endüstriyel Güç Merkezi
Meituan'daki Vizyon Yapay Zekası Departmanı tarafından geliştirilen YOLOv6-3.0, özellikle TensorRT gibi donanım hızlandırıcıları kullanan NVIDIA GPU'larında maksimum endüstriyel işleme kapasitesi için tavizsiz bir şekilde tasarlanmıştır.
- Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, ve diğerleri.
- Kuruluş: Meituan
- Tarih: 2023-01-13
- Arxiv: 2301.05586
- GitHub: meituan/YOLOv6
Dağıtım İçin Optimizasyon
YOLOv6-3.0, GPU kullanımını en üst düzeye çıkarmaya odaklanır. Boyun kısmında, yüksek çıkarım hızlarını korurken özellik füzyonunu artırmak için Çift Yönlü Birleştirme (BiC) modülünü tanıtır. Çıkarım aşaması tamamen çapadan arındırılmış olsa da, YOLOv6-3.0 eğitim aşamasında çapa tabanlı kararlılıktan yararlanmak için yenilikçi bir Çapa Destekli Eğitim (AAT) stratejisi kullanır.
Omurga yapısı, bellek erişim maliyetlerini en aza indirmek ve modern hızlandırıcılarda hesaplama yoğunluğunu en üst düzeye çıkarmak için kasıtlı olarak tasarlanmış, donanım dostu EfficientRep mimarisi kullanılarak oluşturulmuştur. Bu, YOLOv6'yı sunucu tarafı video analitiği için son derece güçlü bir aday haline getirir.
YOLOv6 hakkında daha fazla bilgi edinin
Performans Karşılaştırması
Bu modelleri karşılaştırırken geliştiriciler, ham doğruluk ile çıkarım hızı ve parametre sayısını dengelemelidir. Aşağıdaki tablo, her iki model ailesinin çeşitli boyutlardaki performansını vurgulamaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametre (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
YOLOv6-3.0 daha büyük varyantlarda üstün mAP ve mükemmel TensorRT hızları gösterse de YOLOX, basitliği ve eski donanımlardaki sağlam performansı sayesinde oldukça rekabetçi kalmaya devam etmektedir.
Kullanım Durumları ve Öneriler
YOLOX ve YOLOv6 arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
YOLOX ne zaman seçilmeli?
YOLOX şunlar için güçlü bir seçimdir:
- Çapasız Algılama Araştırması: Yeni algılama başlıkları veya kayıp işlevleri denemek için YOLOX'un temiz, çapasız mimarisini temel olarak kullanan akademik araştırma.
- Ultra Hafif Uç Cihazlar: YOLOX-Nano varyantının son derece küçük ayak izinin (0.91M parametre) kritik olduğu mikrodenetleyicilerde veya eski mobil donanımlarda dağıtım yapılması.
- SimOTA Etiket Atama Çalışmaları: Optimum taşıma tabanlı etiket atama stratejilerini ve bunların eğitim yakınsaması üzerindeki etkisini araştıran araştırma projeleri.
YOLOv6 Ne Zaman Seçilmeli?
YOLOv6 şunlar için önerilir:
- Endüstriyel Donanım Odaklı Dağıtım: Modelin donanım odaklı tasarımının ve verimli yeniden parametrelendirmenin belirli hedef donanımlarda optimize edilmiş performans sağladığı senaryolar.
- Hızlı Tek Aşamalı Algılama: Kontrollü ortamlarda gerçek zamanlı video işleme için GPU'da ham çıkarım hızına öncelik veren uygulamalar.
- Meituan Ekosistem Entegrasyonu: Hali hazırda Meituan'ın teknoloji yığını ve dağıtım altyapısı içinde çalışan ekipler.
Ne Zaman Ultralytics (YOLO26) Seçilmeli
Çoğu yeni proje için Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Ultralytics Avantajı
Hem Megvii hem de Meituan güçlü araştırma depoları sağlasa da, bu modelleri üretim ortamına dağıtmak genellikle önemli bir mühendislik yükü gerektirir. Entegre Ultralytics ekosistemi, kapsamlı bir şekilde belgelenmiş birleşik bir API sunarak bu engelleri ortadan kaldırır.
Ultralytics paketinden yararlanarak geliştiriciler benzersiz bir kullanıcı deneyimine erişim sağlar. Buna yerleşik otomatik veri artırma, eğitim sırasında son derece verimli bellek yönetimi ( RTDETR gibi Transformer modellerine kıyasla VRAM gereksinimlerini önemli ölçüde düşürür) ve ONNX ve OpenVINO gibi formatlara sorunsuz dışa aktarma hatları dahildir.
Özel modellerin aksine, Ultralytics mimarileri doğası gereği çok yönlüdür; Nesne Tespiti, Örnek Segmentasyonu, Poz Tahmini, Görüntü Sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutular (OBB) görevlerini kutudan çıktığı gibi destekler.
YOLO26 ile Tanışın: Nihai Uç Çözümü
Yeni bilgisayarlı görü projelerine başlayan ekipler için, yeni piyasaya sürülen Ultralytics YOLO26 sürümüne yükseltmenizi şiddetle tavsiye ederiz. YOLO11 ve YOLOv8 başarılarının üzerine inşa edilen YOLO26, paradigma değiştiren yenilikler sunar:
- End-to-End NMS-Free Design: First explored in YOLOv10, YOLO26 natively eliminates the need for Non-Maximum Suppression (NMS) post-processing. This guarantees deterministic, ultra-low latency inference critical for real-time robotics.
- MuSGD Optimize Edici: Moonshot AI'nın Kimi K2 gibi LLM eğitim tekniklerinden esinlenen YOLO26, inanılmaz derecede kararlı eğitim dinamikleri ve daha hızlı yakınsama elde etmek için MuSGD optimize edicisini (SGD ve Muon'un bir melezi) kullanır.
- Up to 43% Faster CPU Inference: By removing Distribution Focal Loss (DFL) and streamlining the network head, YOLO26 is heavily optimized for edge devices relying on CPU execution, drastically outperforming YOLOv6 in edge scenarios.
- ProgLoss + STAL: These advanced loss formulations deliver remarkable improvements in small object detection, making YOLO26 ideal for aerial imagery and microscopic defect inspection.
YOLO26 hakkında daha fazla bilgi edin
Birleşik Eğitim Örneği
Ultralytics Python API'sini kullanarak son teknoloji modelleri eğitmek sadece birkaç satır kod gerektirir. Bu aynı temiz arayüz, ister eski bir YOLO modelini test ediyor ol, ister en son YOLO26 çerçevesini dağıtıyor ol, aynı şekilde geçerlidir.
from ultralytics import YOLO
# Load the next-generation YOLO26 model (NMS-free, optimized for edge)
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset
# The ecosystem handles downloading, caching, and auto-batching natively
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model and print mAP metrics
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")
# Export the model for edge deployment
model.export(format="onnx")Daha da sorunsuz bir deneyim için, kodsuz Ultralytics Platformunu kullanarak veri setlerini yönet, deneyimleri takip et ve bulutta modelleri eğit.
Kullanım Durumu Önerileri
Bu mimariler arasında karar verirken, özel donanım kısıtlamalarını ve proje gereksinimlerini göz önünde bulundur:
- YOLOX'u Seç: Etiket atama stratejileri üzerine akademik araştırma yapıyorsan veya özel mimari değişiklikler için saf, anlaşılması kolay, çapadan arındırılmış bir temel gerekiyorsa.
- YOLOv6-3.0'ı Seç: Yüzlerce video akışını eşzamanlı işlemek için büyük parti boyutlarını ve TensorRT optimizasyonlarını kullanabileceğin, üst düzey NVIDIA GPU'larla (A100 veya T4 gibi) donatılmış bir endüstriyel sunucu rafına dağıtım yapıyorsan.
- Choose YOLO26 for the vast majority of modern applications. If you are building Edge AI applications for IoT devices, drones, or mobile phones, YOLO26's native NMS-free design, CPU optimizations, and comprehensive ecosystem support make it the undisputed best choice for bridging the gap between training and production.