İçeriğe geç

YOLOv7 YOLOX: Gerçek Zamanlı Nesne Algılama Mimarilerine Derinlemesine Bir Bakış

Hızla gelişen bilgisayar görme alanında, doğru nesne algılama modelini seçmek başarı için çok önemlidir. Bu yolculuktaki iki önemli dönüm noktası şunlardır YOLOv7 ve YOLOX'tur. Her iki mimari de piyasaya sürüldüklerinde hız ve doğruluk sınırlarını zorlarken, algılama sorununu çözmek için temelde farklı yaklaşımlar benimsemiştir. Bu kılavuz, geliştiricilerin, araştırmacıların ve mühendislerin belirli kullanım durumları için bilinçli kararlar almalarına yardımcı olmak amacıyla ayrıntılı bir teknik karşılaştırma sunmaktadır.

Modele Genel Bakış ve Kökenleri

Bu modellerin soyunu anlamak, mimari kararlarının bağlamını anlamamızı sağlar.

YOLOv7: Ücretsiz Hediyelerle Dolu Güç Merkezi

Temmuz 2022'de piyasaya sürülen YOLOv7 , o tarihteki en hızlı ve en doğru gerçek zamanlı nesne algılayıcı olarak YOLOv7 . E-ELAN (Genişletilmiş Verimli Katman Toplama Ağları) ve eğitilebilir "bag-of-freebies" gibi mimari optimizasyonlara yoğun bir şekilde odaklanarak, çıkarım maliyetini artırmadan doğruluğu artırmayı amaçlamıştı.

YOLOv7 hakkında daha fazla bilgi edinin.

YOLOX: Bağlantısız Evrim

Megvii tarafından 2021 yılında piyasaya sürülen YOLOX, önceki YOLO (YOLOv3 ve YOLOv5 gibi) hakim olan çapa tabanlı mekanizmadan uzaklaşarak önemli bir değişimi temsil etti. Ayrıştırılmış bir başlık ve çapa içermeyen bir tasarımla YOLOX, eğitim sürecini basitleştirdi ve performansı artırarak araştırma ile endüstriyel uygulama arasındaki boşluğu doldurdu.

Teknik Performans Karşılaştırması

Aşağıdaki tablo, COCO setinde karşılaştırılabilir modellerin performans ölçütlerini göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Mimari Temel Farklılıklar

  1. Çapa Mekanizmaları:

    • YOLOv7: Ankraj tabanlı bir yaklaşım kullanır. Önceden tanımlanmış ankraj kutuları gerektirir; bu kutular hiperparametre ayarlamasına duyarlı olabilir, ancak MS COCO gibi standart veri kümelerinde genellikle sağlam bir performans gösterir.
    • YOLOX: Ankrajsız tasarım benimsemiştir. Bu, ankraj kutularının kümelenmesi ihtiyacını ortadan kaldırır (K-means gibi) ve tasarım parametrelerinin sayısını azaltarak model yapılandırmasını basitleştirir.
  2. Ağ Tasarımı:

    • YOLOv7: Gradyan yollarını çeşitli özellikleri etkili bir şekilde öğrenmeye yönlendiren E-ELAN mimarisini içerir. Ayrıca, çıkarım sırasında katmanları birleştirmek için "planlı yeniden parametreleştirme" kullanır ve eğitim doğruluğundan ödün vermeden hızı artırır.
    • YOLOX: Sınıflandırma ve regresyon görevlerini ayıran Ayrıştırılmış Başlık kullanır. Bu genellikle daha hızlı yakınsama ve daha iyi doğruluk sağlar, ancak birleştirilmiş başlığa kıyasla parametre sayısını biraz artırabilir.
  3. Etiket Atama:

    • YOLOv7: Kaba-ince kurşun kılavuzlu etiket atama stratejisi kullanır.
    • YOLOX: Atama sorununu optimal taşıma görevi olarak ele alan ve eğitim istikrarını artıran dinamik bir etiket atama stratejisi olan SimOTA'yı (Simplified Optimal Transport Assignment) tanıttı.

Modern Standart: YOLO26

YOLOv7 YOLOX devrim niteliğinde olsa da, bu alan daha da ilerlemiştir. 2026 yılının Ocak ayında piyasaya sürülen yeni YOLO26, her iki dünyanın en iyi özelliklerini bir araya getirir. Yerel uçtan uca NMS tasarım (YOLOX'un ankrajsız felsefesi gibi, ancak daha da geliştirilmiş) özelliğine sahiptir ve Dağıtım Odak Kaybını (DFL) ortadan kaldırarak CPU %43'e kadar hızlandırır.

YOLO26 hakkında daha fazla bilgi edinin

Eğitim ve Ekosistem

Geliştirici deneyimi, genellikle ham performans ölçütleri kadar önemlidir. Ultralytics , bu noktada önemli bir farklılık yaratmaktadır.

Kullanım Kolaylığı ve Entegrasyon

YOLOX'u eğitmek için genellikle Megvii kod tabanını kullanmak gerekir. Bu kod tabanı sağlam olmakla birlikte, üst düzey API'lere alışkın kullanıcılar için öğrenme eğrisi daha dik olabilir. Buna karşılık, Ultralytics YOLOv7 çalıştırmak sorunsuz bir deneyim Ultralytics .

Ultralytics Python , iş akışını birleştirir. YOLOv7, YOLOv10ve hatta YOLO11 arasından geçiş yapabilirsiniz. Bu esneklik, hızlı prototip oluşturma ve karşılaştırmalı değerlendirme için hayati önem taşır.

Kod Örneği: Tutarlı Arayüz

Ultralytics kullanarak YOLOv7 nasıl eğitebileceğinizi aşağıda bulabilirsiniz. Aynı kod yapısı, YOLO26 gibi daha yeni modeller için de geçerlidir.

from ultralytics import YOLO

# Load a YOLOv7 model (or swap to "yolo26n.pt" for the latest)
model = YOLO("yolov7.pt")

# Train on a custom dataset
# Ultralytics automatically handles data augmentation and logging
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

Bellek ve Verimlilik

Ultralytics , kaynakları verimli kullanmalarıyla ünlüdür.

  • Eğitim Verimliliği: Ultralytics YOLOv7 , ham uygulamalara veya RT-DETR gibi dönüştürücü tabanlı modellere kıyasla daha az CUDA kullanacak şekilde optimize edilmiştir. RT-DETRgibi dönüştürücü tabanlı modellerle karşılaştırıldığında daha az CUDA belleği kullanacak şekilde optimize edilmiştir, bu da tüketici donanımlarında daha büyük parti boyutlarına olanak tanır.
  • Dağıtım: Modelleri üretim formatlarına aktarmak tek komutla gerçekleştirilen bir işlemdir. Hedeflediğiniz format ne olursa olsun ONNX, TensorRT, veya CoreML, Ultralyticstralytics export modu, grafik dönüştürmenin karmaşıklığını ele alır.

İdeal Kullanım Senaryoları

Bu modeller arasında seçim yapmak genellikle dağıtım ortamınızın belirli kısıtlamalarına bağlıdır.

YOLOv7 Ne Zaman Tercih Edilmeli?

YOLOv7 , en yüksek doğruluğun gerekli olduğu yüksek performanslı GPU için güçlü bir rakip YOLOv7 .

  • Üst Düzey Gözetim: Uzaktan küçük nesneleri algılamanın çok önemli olduğu güvenlik alarm sistemleri için idealdir.
  • Endüstriyel Denetim: Güçlü özellik çıkarma özelliği, montaj hatlarında kusur tespiti gibi karmaşık üretim görevleri için uygun olmasını sağlar.
  • GPU Kenar: NVIDIA Orin serisi gibi cihazlar, YOLOv7 yeniden parametrelendirilmiş mimarisini etkili bir şekilde kullanabilir.

Ne Zaman YOLOX Seçmeli

YOLOX, genellikle araştırma ortamlarında veya belirli eski kenar senaryolarında tercih edilir.

  • Akademik Araştırma: Ankraj içermeyen tasarım ve temiz kod tabanı, YOLOX'u yeni algılama başlıkları veya atama stratejileri ile deneyler yapan araştırmacılar için mükemmel bir temel oluşturur.
  • Mobil Dağıtım (Nano/Tiny): YOLOX-Nano ve Tiny varyantları, mobil CPU'lar için yüksek düzeyde optimize edilmiştir ve YOLOv6 Lite serisinin verimlilik hedeflerine benzer şekilde, mobil CPU'lar için yüksek düzeyde optimize edilmiştir.
  • Eski Kod Tabanları: MegEngine veya belirli PyTorch zaten derinlemesine entegre olmuş ekipler, YOLOX'u daha kolay bakımlı bulabilirler.

Gelecek: YOLO26'ya geçiş

YOLOv7 YOLOX amaçlarına hizmet ederken, YOLO26 bir sonraki adımdır. Her iki öncülünün sınırlamalarını da ortadan kaldırır:

  1. NMS: YOLOv7 NMS gerektirir) ve YOLOX (ankrajları basitleştirir ancak yine de NMS kullanır) aksine, YOLO26 doğal olarak uçtan uca bir tasarım kullanır. Bu, son işlemdeki gecikme darboğazını tamamen ortadan kaldırır.
  2. MuSGD Optimizer: LLM eğitiminden esinlenerek geliştirilen bu optimizer, bilgisayar görme görevleri için eğitimi stabilize eder ve eski YOLO SGD standart SGD geride bırakır.
  3. Görev Çok Yönlülüğü: YOLOX öncelikle algılamaya odaklanırken, YOLO26 Örnek Segmentasyonu, Poz Tahmini ve Yönlendirilmiş Sınırlayıcı Kutular (OBB) alanlarında en son teknolojiye sahip performans sunar.

Sonuç

Hem YOLOv7 YOLOX, nesne algılamanın gelişmesine önemli katkılar sağlamıştır. YOLOv7 , E-ELAN gibi akıllı mimariler sayesinde çapa tabanlı yöntemlerin hala doğruluk açısından üstün olduğunu kanıtlamıştır. YOLOX, YOLO çapa tabanlı olmayan algılamayı yaygınlaştırarak mevcut durumu başarıyla değiştirmiştir.

Bugün yeni projeler başlatan geliştiriciler için Ultralytics yararlanmak en stratejik seçimdir. YOLOv7 erişim sağlayarak eski YOLOv7 karşılaştırma YOLOv7 , YOLO26'nın üstün hız ve doğruluğuna doğrudan erişim imkanı da sunar. Model değiştirmenin kolaylığı, kapsamlı belgeler ve topluluk desteği ile birleştiğinde, bilgisayar görme projelerinizin geleceğe dönük olmasını sağlar.

Daha Fazla Okuma


Yorumlar