İçeriğe geç

YOLOv6.0 ve RTDETRv2: Endüstriyel CNN'ler ve Gerçek Zamanlı Dönüştürücüler Arasındaki Düello

Hızla gelişen bilgisayar görme alanında, en verimli nesne algılama mimarisi için verilen mücadele genellikle yerleşik Convolutional Neural Networks (CNN) ile yeni ortaya çıkan Transformer tabanlı modeller arasında yaşanmaktadır. Bu karşılaştırma, endüstriyel uygulamalar için optimize edilmiş bir CNN gücü olanYOLOv6.YOLOv6 ile YOLO meydan okumak için tasarlanmış bir gerçek zamanlı algılama transformatörü olan RTDETRv2'yi incelemektedir.

Her iki model de etkileyici yetenekler sunsa da, mimari açıdan birbirlerinin eksikliklerini anlamak, projeniz için doğru aracı seçmek açısından çok önemlidir. Hız, doğruluk ve kullanım kolaylığı gibi her iki dünyanın en iyi özelliklerini bir araya getiren birleşik bir çözüm arayan geliştiriciler için Ultralytics , YOLO26 gibi son teknoloji alternatifler sunar.

Performans Metriklerinin Karşılaştırılması

Aşağıdaki tablo, modeller arasındaki performans farklarını göstermektedir. YOLOv6. YOLOv6, özel donanım üzerinde ham verimliliğe odaklanırken, RTDETRv2, dönüştürücü mimarisi sayesinde son işlemdeki darboğazları ortadan kaldırmayı amaçlamaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259

YOLOv6.0: Endüstri Uzmanı

Meituan tarafından geliştirilen ve 2023'ün başlarında piyasaya sürülen YOLOv6. YOLOv6, tek aşamalı nesne algılamada önemli bir dönüm noktasıdır. Fabrika otomasyonu veya lojistik gibi donanım kısıtlamalarının NVIDIA T4 gibi GPU'ların kullanışlılığını en üst düzeye çıkarmayı gerektirdiği endüstriyel uygulamalar için özel olarak tasarlanmıştır.

Mimari ve Tasarım

YOLOv6.YOLOv6, RepVGG tarzı bloklarla güçlendirilmiş çift yönlü yol toplama ağı olan RepBi-PAN mimarisini sunar. Bu tasarım, yüksek çıkarım hızlarını korurken verimli özellik birleştirme sağlar. Model ayrıca, yakınsama kararlılığını iyileştirmek için çapa tabanlı ve çapa içermeyen paradigmaların avantajlarını birleştiren hibrit bir strateji olan Çapa Destekli Eğitim (AAT) kullanır.

Temel Güçlü Yönler

  • GPU : Özel hızlandırıcılar üzerinde, "Nano" ve "Small" varyantları inanılmaz derecede yüksek kare hızları sunarak yüksek hızlı video analizi için uygun hale getirir.
  • Kuantizasyona Uygun: Mimari, kuantizasyon göz önünde bulundurularak tasarlanmıştır ve TensorRT kullanarak uç donanıma daha kolay dağıtım sağlar.
  • Endüstriyel Odak: Ayrılmış kafa gibi özellikler, gecikme değişkenliğinin en aza indirilmesi gereken belirli endüstriyel denetim görevleri için optimize edilmiştir.

YOLOv6 hakkında daha fazla bilgi edinin.

RTDETRv2: Transformer Meydan Okuyucusu

Baidu'dan kaynaklanan RTDETRv2, orijinalini yineler RT-DETR (Real-Time DEtection TRansformer) üzerinde yinelenir. Çok ölçekli özellik işlemeyle ilişkili hesaplama darboğazlarını ele alarak, transformatör tabanlı mimarilerin hem hız hem de doğruluk açısından CNN tabanlı YOLO'lardan daha üstün olduğunu kanıtlamayı amaçlamaktadır.

Mimari ve Tasarım

RTDETRv2, çok ölçekli özellikleri verimli bir şekilde işleyen hibrit bir kodlayıcı ile IoU sorgu seçim mekanizmasını bir araya getirir. RTDETRv2'nin benzersiz bir özelliği, kullanıcıların çıkarım sırasında kod çözücü katmanlarının sayısını ayarlayabilmelerini sağlayan uyarlanabilir kod çözücüdür. Bu, yeniden eğitim gerektirmeden hız ve doğruluk arasında esnek bir ayar yapılmasına olanak tanır ve dinamik ortamlarda önemli bir avantaj sağlar.

Temel Güçlü Yönler

  • NMS: Bir dönüştürücü olarak RTDETRv2, nesneleri doğrudan tahmin eder ve Non-Maximum Suppression (NMS) ihtiyacını ortadan kaldırır. Bu, dağıtım süreçlerini basitleştirir ve gecikme dalgalanmasını azaltır.
  • Yüksek Doğruluk: Model, özellikle COCO etkileyici Ortalama Hassasiyet (mAP) değerleri elde eder ve karmaşık sahnelerde genellikle benzer CNN'leri geride bırakır.
  • Çok yönlülük: Çıkarım hızını dinamik olarak ayarlama yeteneği, dalgalanan hesaplama kaynaklarına yüksek düzeyde uyum sağlar.

RT-DETR hakkında daha fazla bilgi edinin

Ultralytics Avantajı: Neden YOLO26'yı Seçmelisiniz?

YOLOv6. YOLOv6 ve RTDETRv2 kendi alanlarında üstünlük sağlarken, Ultralytics her ikisinin sınırlamalarını da ortadan kaldıran kapsamlı bir çözüm sunar. YOLO en son gelişimi olan YOLO26, transformatörlerin NMS avantajlarını CNN'lerin ham verimliliği ile birleştirir.

Entegre İş Akışı

Ultralytics kullanarak mimariler arasında sorunsuz bir şekilde geçiş Ultralytics . Aynı birleşik API ve veri kümesi formatını kullanarak YOLOv6 eğitebilir, RT-DETR test edebilir ve YOLO26 modelini dağıtabilirsiniz.

Üstün Verimlilik ve Mimari

YNMS26, ilk kez YOLOv10tarafından ilk kez ortaya atılan çığır açıcı bir tasarımdır. Bu tasarım, YOLOv6 gerektirdiği ağır son işlemleri ortadan YOLOv6 RTDETRv2'deki dikkat mekanizmalarıyla ilişkili büyük bellek ayak izini de ortadan kaldırır.

  • MuSGD Optimizer: LLM eğitim yeniliklerinden esinlenen yeni MuSGD optimizer, istikrarlı eğitim ve daha hızlı yakınsama sağlayarak görme görevlerine büyük ölçekli istikrar getirir.
  • %43 Daha Hızlı CPU : Dağıtım Odak Kaybı (DFL) ortadan kaldırarak ve kenar bilgi işlem için mimariyi optimize ederek, YOLO26, YOLOv6 RTDETRv2'den CPU'larda önemli ölçüde daha hızlıdır, bu da onu mobil ve IoT cihazlar için ideal bir seçim haline getirir.
  • ProgLoss + STAL: Gelişmiş kayıp fonksiyonları, geleneksel endüstriyel modellerin genellikle zorlandığı kritik bir alan olan küçük nesne algılamayı iyileştirir.

Rakipsiz Çok Yönlülük

Öncelikle bir algılama uzmanı olan YOLOv6. YOLOv6 farklı olarak, Ultralytics doğası gereği çok modludur. Tek bir çerçeve şunları destekler:

Kullanım Kolaylığı ve Ekosistem

Ultralytics , "sıfırdan kahramana" bir deneyim yaratır. Geliştiriciler, veri kümelerini yönetmek, bulutta eğitim vermek ve aşağıdaki gibi çeşitli formatlara dağıtım yapmak için Ultralytics kullanabilirler ONNX, OpenVINOve CoreML gibi çeşitli formatlara dağıtım yapmak için Ultralytics Platformunu kullanabilirler.

Ekosistem aktif olarak korunur ve projelerinizin en son sürümlerle uyumlu kalmasını sağlar. Python sürümleri ve donanım sürücüleri ile uyumlu kalmasını sağlar. Bu, statik araştırma depoları kullanılırken genellikle göz ardı edilen önemli bir faktördür.

Eğitim Kodu Örneği

Ultralytics ile son teknoloji ürünü bir modeli eğitmek oldukça Ultralytics . Aşağıdaki kod parçacığı, verimli YOLO26n modelini nasıl yükleyip eğiteceğinizi göstermektedir:

from ultralytics import YOLO

# Load the YOLO26 Nano model (End-to-End, NMS-free)
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset for 100 epochs
# The system automatically handles data downloading and caching
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model performance
metrics = model.val()
print(f"mAP50-95: {metrics.box.map}")

Sonuç

Uygulamanız eski donanımlarda kesinlikle endüstriyel GPU gerektiriyorsa, YOLOv6.0 güçlü bir rakip olmaya devam ediyor. Transformatör tabanlı dikkat mekanizmaları gerektiren araştırma senaryoları için RTDETRv2 esneklik sunar. Ancak, hız, doğruluk, düşük bellek kullanımı ve uzun vadeli bakım kolaylığı arasında denge gerektiren çoğu gerçek dünya uygulaması için Ultralytics en üstün seçimdir. Uçtan uca tasarımı ve CPU , önceki nesillerin ulaşamadığı yeni Edge AI olanakları sunar.

YOLO26 hakkında daha fazla bilgi edinin


Yorumlar