YOLOv6.0 ve YOLOX: Gerçek Zamanlı Nesne Algılama Evrimine Derinlemesine Bir Bakış
Nesne algılama alanı, hız ve doğruluk sınırlarını sürekli olarak zorlayan yeni mimarilerle hızla gelişmiştir. Bu yolculuktaki iki önemli dönüm noktası YOLOv6.YOLOv6 ve YOLOX'tur. Her ikisi de gerçek zamanlı performans sunmayı amaçlasa da, mimari felsefelerinde ve amaçlanan uygulamalarında önemli farklılıklar bulunmaktadır.
Meituan tarafından geliştirilen YOLOv6.YOLOv6, GPU gibi özel donanımlarda yüksek verimliliği önceliklendirerek endüstriyel uygulamalar için özel olarak tasarlanmıştır. Buna karşılık, Megvii'nin YOLOX ürünü, temiz mimarisi ve sağlam temel performansı ile araştırma camiasında favori haline gelen yüksek performanslı, ankrajsız bir algılayıcı tasarımı sunmuştur.
Model Genel Bakışları
YOLOv6-3.0: Endüstriyel Hız Uzmanı
Orijinal YOLOv6"Tam Ölçekli Yeniden Yükleme" versiyonu olarak piyasaya sürülen 3.0 sürümü, dağıtım için mühendislik optimizasyonlarına büyük önem vermektedir. Çıkarım sırasında verimli ancak eğitim sırasında karmaşık backbone RepVGG tarzı bir backbone kullanır, bu da onu GPU mevcut olduğu fabrika otomasyonu ve statik gözetim için en iyi seçenek haline getirir.
- Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
- Kuruluş:Meituan
- Tarih: 2023-01-13
- Arxiv:YOLOv6 v3.0: Tam Ölçekli Bir Yeniden Yükleme
- GitHub:meituan/YOLOv6
YOLOv6 hakkında daha fazla bilgi edinin.
YOLOX: Bağlantısız Öncü
YOLOX, 2021 yılında çapa içermeyen bir mekanizmaya geçerek ve tahmin kafasını ayırarak YOLO yeniden canlandırdı. Bu, önceki nesillerde sıkça karşılaşılan bir sorun olan manuel çapa kutusu kümeleme ihtiyacını ortadan kaldırarak eğitim sürecini basitleştirdi. "SimOTA" etiket atama stratejisi, örtülme ve çeşitli nesne ölçeklerini etkili bir şekilde ele almasını sağlar.
- Yazarlar: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li ve Jian Sun
- Kuruluş:Megvii
- Tarih: 2021-07-18
- Arxiv:YOLOX: 2021'de YOLO Serisini Aşmak
- GitHub:Megvii-BaseDetection/YOLOX
YOLOX hakkında daha fazla bilgi edinin
Performans Analizi
Bu modelleri karşılaştırırken donanım bağlamı çok önemlidir. YOLOv6. YOLOv6, TensorRT NVIDIA GPU'lar için büyük ölçüde optimize edilmiştir ve genellikle bu özel ortamlarda üstün FPS gösterir. YOLOX, özellikle uç cihazlar için hafif "Nano" ve "Tiny" yapılandırmalarında rekabetçi kalan dengeli bir performans profili sunar.
Aşağıdaki tablo, COCO setindeki performans ölçütlerini göstermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
Performans Yorumlaması
YOLOv6. YOLOv6, RepVGG blok füzyonu sayesinde GPU'larda daha yüksek FPS değerleri gösterirken, YOLOX-Nano, en küçük YOLOv6 daha az parametre ve FLOP'a sahip olmasıyla, kısıtlı CPU'lar için inanılmaz derecede hafif bir seçenek olmaya devam ediyor.
Mimari Temel Farklılıklar
YOLOv6.0 Yenilikleri
YOLOv6, farklı ölçekler arasında özellik birleştirmeyi geliştiren Çift Yönlü Yol Birleştirme Ağı (Bi-PAN) özelliğini sunar. Bu özellik, eğitim sırasında çapa tabanlı atamayı kullanarak çapasız çıkarım başlığını stabilize eden hibrit bir yaklaşım olan Çapa Destekli Eğitim (AAT) yöntemini kullanır. Ayrıca, çıkarım maliyetini artırmadan daha küçük modellerin doğruluğunu artırmak için kendi kendine damıtma yöntemini agresif bir şekilde kullanır.
YOLOX Yenilikleri
YOLOX, sınıflandırma ve regresyon görevlerini farklı dallara ayıran Decoupled Head(Ayrıştırılmış Başlık) özelliği ile kendini tanımlar. Bu ayrım genellikle daha hızlı yakınsama ve daha iyi doğruluk sağlar. Temel yeniliği olan SimOTA (Basitleştirilmiş Optimal Taşıma Ataması), etiket atamayı optimal bir taşıma sorunu olarak ele alır ve küresel maliyet fonksiyonuna dayalı olarak pozitif örnekleri dinamik olarak temel gerçeklere atar. Bu, YOLOX'u perakende analizlerinde sıklıkla görülen kalabalık sahnelerde sağlam hale getirir.
Kullanım Alanları ve Uygulamalar
YOLOv6.0 için ideal
- Endüstriyel Denetim: Modelin T4 GPU'larda yüksek verimliliği, hızlı hareket eden montaj hatlarındaki kusurları tespit etmek için mükemmel bir seçimdir.
- Akıllı Şehir Gözetimi: Araç sayımı veya trafik akışı analizi gibi birden fazla video akışını gerçek zamanlı olarak aynı anda işlemek için.
- Perakende Otomasyonu: Özel uç sunucularda düşük gecikme süresi gerektiren yüksek hızlı ödeme sistemleri.
YOLOX için ideal
- Akademik Araştırma: Temiz kod tabanı ve bağlantısız mantığı, bilgisayar görüşünde yeni teorileri test etmek için mükemmel bir temel oluşturur.
- Eski Kenar Cihazları: Nano ve Tiny varyantları, eski Raspberry Pi kurulumları gibi hesaplama kaynaklarının ciddi şekilde sınırlı olduğu mobil yonga setleri için yüksek düzeyde optimize edilmiştir.
- Genel Amaçlı Algılama: Niceleme farkındalıklı eğitimin karmaşıklığı olmadan doğruluk ve anlaşılabilirlik dengesi gerektiren projeler için.
Ultralytics Ekosisteminin Avantajı
Hem YOLOv6 YOLOX sağlam yetenekler sunarken, bunları Ultralytics ekosistemi aracılığıyla bunlardan yararlanmak, geliştiriciler ve işletmeler için belirgin avantajlar sağlar.
- Birleştirilmiş API ve Kullanım Kolaylığı: Ultralytics , karmaşık eğitim döngülerini basit bir Python Ultralytics . YOLOv6, YOLOX veya en son YOLO26kullanıyor olun, kod tutarlı kalır.
- Çok yönlülük: Öncelikle algılamaya odaklanan orijinal depoların aksine, Ultralytics desteklenen modellerde örnek segmentasyonu, poz tahmini ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) için desteği Ultralytics .
- Eğitim Verimliliği: Ultralytics , eğitim sırasında daha düşük bellek kullanımı için optimize edilmiştir. Bu, birçok transformatör tabanlı modele ( RT-DETRgibi) için çok önemli CUDA .
- Dağıtım: ONNX, TensorRT, CoreMLve OpenVINO arasındaki entegrasyon sorunsuzdur ve modellerinizin her türlü donanımda verimli bir şekilde çalışmasını sağlar.
- Ultralytics : Ultralytics , kapsamlı şablon kodları yazmadan veri kümelerini yönetmenize, bulutta eğitim yapmanıza ve modelleri dağıtmanıza olanak tanır.
Yeni Nesil: YOLO26
En son teknolojiyi arayan geliştiriciler için YOLO26 modeli, kritik YOLOv6 hem YOLOX hem de YOLOv6 geride bırakarak 2026 yılında önemli bir ilerleme kaydetmiştir.
- Uçtan Uca NMS Tasarım: YOLO26, doğal olarak uçtan uca çalışır ve Non-Maximum Suppression (NMS) son işlemlerini ortadan kaldırır. Bu da daha hızlı, daha basit dağıtım ve daha düşük gecikme varyansı sağlar.
- MuSGD Optimizer: LLM eğitim yeniliklerinden esinlenen yeni MuSGD optimizer, görsel modellerde bir ilk olarak daha istikrarlı eğitim dinamikleri ve daha hızlı yakınsama sağlar.
- Hız ve Verimlilik: Dağıtım Odak Kaybını (DFL) ortadan kaldırarak ve uç bilgi işlem için optimize ederek, YOLO26 CPU %43'e kadar hızlandırır ve IoT ve robotik için yeni olanaklar sunar.
- Gelişmiş Doğruluk: ProgLoss ve STAL gibi özellikler, hava görüntüleri ve drone uygulamaları için çok önemli olan küçük nesnelerin tanınmasında önemli iyileştirmeler sağlar.
YOLO26 hakkında daha fazla bilgi edinin
Kod Örneği
Ultralytics ile model eğitimi oldukça Ultralytics . Çerçeve, veri artırma, hiperparametre ayarlama ve günlük kaydı işlemlerini otomatik olarak gerçekleştirir.
from ultralytics import YOLO
# Load a pretrained model (YOLO26 recommended for best performance)
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 example dataset
# The system automatically handles data downloading and preparation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
YOLOv6.0'ın endüstriyel gücünü, araştırma dostu YOLOX'u veya son teknoloji YOLO26'yı tercih edin, Ultralytics iş akışınızın verimli, ölçeklenebilir ve geleceğe dönük olmasını sağlar.