İçeriğe geç

YOLOv7 ve YOLOX: Gerçek Zamanlı Algılayıcıların Teknik Analizi

Bilgisayar görüsünün evrimi, gerçek zamanlı nesne algılamadaki hızlı ilerlemelerle işaretlenmiştir. Bu yolculuktaki iki önemli kilometre taşı YOLOv7 ve YOLOX'tur. Her iki model de hız ve doğruluk sınırlarını zorlarken, sonuçlarını elde etmek için farklı mimari felsefeler benimsemişlerdir. Bu kılavuz, bu iki güçlü model arasında kapsamlı bir teknik karşılaştırma sunarak bilgisayar görüsü projeleriniz için doğru mimariyi seçmenize yardımcı olur.

Modellere Giriş

Bu modellerin kökenlerini ve birincil tasarım seçimlerini anlamak, onları modern makine öğrenimi operasyonlarında etkili bir şekilde dağıtmak için çok önemlidir.

YOLOv7 Detayları

CSPNet ve Scaled-YOLOv4 mimarilerini sürdüren araştırmacılar tarafından geliştirilen YOLOv7, çıkarım maliyetini artırmadan doğruluğu en üst düzeye çıkarmak için "eğitilebilir bedavalar paketi" yaklaşımını tanıttı.

YOLOv7 hakkında daha fazla bilgi edinin.

YOLOX Detayları

YOLOX, paradigmayı tekrar anchor-free algılamaya kaydırarak, kafa mimarisini büyük ölçüde basitleştirirken sağlam performansı koruyarak farklı bir yol izledi.

YOLOX hakkında daha fazla bilgi edinin

Mimari Farklılıklar ve Yenilikler

YOLOv7 ve YOLOX arasındaki temel farklılıklar, özellik çıkarımı, sınırlayıcı kutu tahmini ve etiket atamasına yaklaşımlarında yatmaktadır.

YOLOX: Bağlantısız Öncü

YOLOX, çapasız bir tasarıma geçerek YOLO ailesinde devrim yarattı. Geleneksel çapa tabanlı dedektörler, çapa kutusu kümelemesi için karmaşık sezgisel ayarlamalar gerektirir ve bu da veri setine oldukça bağımlı olabilir. YOLOX, çapa kutularını ortadan kaldırarak tasarım parametrelerinin sayısını önemli ölçüde azalttı. Ayrıca YOLOX, sınıflandırma ve konumlandırma görevlerini farklı ağ dallarına ayıran ayrık bir başlık kullanır. Bu, bir nesneyi sınıflandırma ile uzamsal koordinatlarını regresyonla tahmin etme arasındaki doğal çelişkiyi çözer. YOLOX ayrıca, eğitim sırasında pozitif örnekleri dinamik olarak tahsis eden SimOTA gibi gelişmiş etiket atama stratejilerini de entegre eder.

YOLOv7: Genişletilmiş Verimli Katman Agregasyonu

YOLOv7, çapa tabanlı metodolojilere geri döndü ancak Genişletilmiş Verimli Katman Toplama Ağı (E-ELAN)'nı tanıttı. E-ELAN, gradyan yolu uzunluğunu optimize ederek ağın değişen derinliklerde etkili bir şekilde öğrenmesini sağlar. Mimari, çıkarım sırasında evrişimsel katmanları birleştirerek hassasiyetten ödün vermeden hızı artırmak için yeniden parametrelendirme tekniklerine büyük ölçüde dayanır. YOLOv7'nin "bedava ekstralar" stratejisi, planlı yeniden parametrelendirilmiş evrişimler ve kabadan inceye yönlendirilmiş etiket ataması gibi yenilikleri içerir ve bu da modelin mAP'ini dikkat çekici seviyelere taşır.

Anchor Tabanlı - Anchorsız Karşılaştırması

YOLOX, çapasız kurulumuyla dağıtım hatlarını basitleştirmiş olsa da, modern Ultralytics mimarileri o zamandan beri bu yaklaşımı mükemmelleştirerek yeni nesillerde önceden tanımlanmış kutulara olan ihtiyacı tamamen ortadan kaldırmıştır.

Performans Karşılaştırması

Bu modelleri üretim için değerlendirirken, doğruluk ile hesaplama verimliliğini dengelemek esastır. Aşağıdaki tablo, en iyi performans gösteren metrikleri kalın olarak vurgulayarak ödünleşimleri göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Yukarıda görüldüğü gibi, YOLOv7x en yüksek mAP'i elde ederek karmaşık veri setleri için olağanüstü doğru olmasını sağlar. Tersine, YOLOX-Nano aşırı kaynak kısıtlamaları için oldukça optimize edilmiştir. Ancak, her iki model de modern mimarilere kıyasla eğitim sırasında nispeten yüksek bellek kullanımı sergiler.

Eğitim Metodolojileri ve Ekosistem

Araştırmacılar ve geliştiriciler için kritik bir faktör, uygulama kolaylığıdır. Tarihsel olarak, eski YOLO sürümleri yoğun şekilde özelleştirilmiş C++ betikleri veya karmaşık bağımlılık yönetimi gerektiriyordu.

Ultralytics Ekosisteminin Avantajı

Günümüzde, bu mimarileri kullanmanın en etkili yolu iyi yönetilen Ultralytics ekosistemi aracılığıyladır. Ultralytics, eğitim, doğrulama ve dağıtımı önemli ölçüde basitleştiren birleşik, son derece sezgisel bir Python API'si sunar.

  • Kullanım Kolaylığı: Yalnızca birkaç satır kodla bir eğitim döngüsü başlatabilir, ham PyTorch uygulamalarıyla ilişkili dik öğrenme eğrisini azaltabilirsiniz.
  • Eğitim Verimliliği: Ultralytics YOLO modelleri, RT-DETR gibi ağır transformer modellerine kıyasla eğitim sırasında doğal olarak daha az bellek kullanır. Bu, geliştiricilerin tüketici donanımında toplu iş boyutlarını en üst düzeye çıkarmasına olanak tanır.
  • Çok Yönlülük: Basit sınırlayıcı kutuların ötesinde, ekosistem Örnek Segmentasyonu ve Poz Tahmini gibi görevlere zahmetsizce genişler.

Ultralytics API'sini kullanarak bir modelin nasıl eğitileceğini gösteren %100 çalıştırılabilir bir örnek aşağıdadır:

from ultralytics import YOLO

# Load a pre-trained model
model = YOLO("yolov8n.pt")  # Readily available weights for rapid transfer learning

# Train the model efficiently on your custom data
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=16,
    device="0",  # Utilizes optimal CUDA memory management
)

# Export seamlessly to ONNX or TensorRT
model.export(format="onnx")

Dışa aktarma hattını standartlaştırarak, geliştiriciler ağırlıklarını TensorRT veya ONNX gibi formatlara zahmetsizce dönüştürebilir ve hedef donanımda yüksek hızlı çıkarım sağlayabilir.

İdeal Kullanım Durumları ve Gerçek Dünya Uygulamaları

YOLOX ve YOLOv7 arasında seçim yapmak büyük ölçüde dağıtım hedeflerine bağlıdır:

  • Uç Yapay Zeka için YOLOX: YOLOX-Nano ve YOLOX-Tiny varyantları, düşük güçlü cihazlarda dağıtım için oldukça uygundur. Eğer bir Raspberry Pi üzerinde akıllı bir güvenlik kamerası inşa ediyorsanız, YOLOX'un basit çapasız evrişimleri uç hızlandırıcılara kolayca aktarılabilir.
  • Yüksek Doğruluklu Analizler için YOLOv7: Eğer yüksek çözünürlüklü uydu görüntülerini işliyorsanız veya karmaşık üretim kalite kontrolü yapıyorsanız, üst düzey NVIDIA GPU'ları tarafından desteklenen YOLOv7x'in yüksek mAP'i, en küçük anormalliklerin bile detect edilmesini sağlar.

Gelecek: Ultralytics YOLO26'ya Yükseltme

YOLOv7 ve YOLOX başlangıçlarında çığır açıcı olsa da, bilgisayar görüşü alanı önemli ölçüde ilerledi. Yeni dağıtımlar için geliştiriciler, Ocak 2026'da piyasaya sürülen Ultralytics YOLO26'ya yönelmelidir. Bu son teknoloji model, en iyi mimari teorileri nihai üretime hazır sisteme dönüştürür.

Yükseltme neden şiddetle tavsiye edilir:

  • Uçtan Uca NMS-Serbest Tasarım: YOLO26, işlem sonrası sırasında Non-Maximum Suppression (NMS)'i doğal olarak ortadan kaldırır. Başlangıçta YOLOv10'da öncülük edilen bu özellik, sürekli düşük gecikme süresi sağlayarak NMS donanım desteği olmayan cihazlarda dağıtımı basitleştirir.
  • DFL Kaldırma: Distribution Focal Loss'u kaldırarak, YOLO26 düşük güçlü uç cihazlarla ve basit ONNX dışa aktarımlarıyla çok daha iyi uyumluluk elde eder.
  • MuSGD Optimizatörü: LLM eğitim yeniliklerinden esinlenerek, YOLO26 hibrit bir MuSGD optimizatöründen yararlanır, daha hızlı yakınsama ve inanılmaz derecede kararlı eğitim dinamikleri sağlar.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Gerçek dünya donanımı için yoğun bir şekilde optimize edilmiş YOLO26, pahalı GPU altyapısı gerektirmeden standart CPU'larda iyi performans gösterir.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, hava dronu denetimleri ve gelişmiş IoT ağları için kritik bir özellik olan küçük nesne tanımayı önemli ölçüde iyileştirir.

En iyi performans dengesini arayan geliştiriciler için, nesne algılama, segmentasyon ve ötesinde modelleri Ultralytics Platformu aracılığıyla dağıtmak eşsiz, sıfır sürtünmeli bir deneyim sunar.

YOLO26 hakkında daha fazla bilgi edinin

Sonuç

Hem YOLOX hem de YOLOv7, açık kaynaklı yapay görme yapay zekasının yörüngesini şekillendiren önemli teknikler sundu. YOLOX, çapa içermeyen ayrık başlıkların uygulanabilirliğini kanıtlarken, YOLOv7 gradyan yolu yeniden parametrelendirmesinin muazzam gücünü gösterdi. Bugün, Ultralytics ekosisteminden yararlanmak, bu tarihsel mimarilerden maksimum potansiyeli çıkarmanızı veya bir sonraki bilgisayar görüşü uygulamanızı geleceğe hazır hale getirmek için son teknoloji YOLO26'ya sorunsuz bir şekilde geçiş yapmanızı sağlar.


Yorumlar