İçeriğe geç

YOLOv6.0 ile EfficientDet: Endüstriyel Hız ile Ölçeklenebilir Doğruluk Arasındaki Denge

Gelişen bilgisayar görme alanında, doğru nesne algılama mimarisini seçmek, başarılı bir uygulama için çok önemlidir. Bu karşılaştırma, iki etkili modeli inceliyor: Meituan tarafından geliştirilen, hıza odaklı endüstriyel bir çerçeve olan YOLOv6.YOLOv6 ve Google tarafından geliştirilen, yüksek ölçeklenebilir bir mimari olan EfficientDet. EfficientDet çığır açan verimlilik kavramları getirirken, YOLOv6. YOLOv6 bu ilkeleri modern GPU için optimize ediyor.

Performans Metrikleri Karşılaştırması

Aşağıdaki tablo, iki mimari arasındaki performans farklarını göstermektedir. YOLOv6. YOLOv6, donanım uyumlu tasarımı sayesinde GPU üstün gecikme süresi sunarken, EfficientDet çok çeşitli kısıtlamalar arasında ayrıntılı ölçeklenebilirlik sunar.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

YOLOv6-3.0: Endüstriyel Hız Uzmanı

13 Ocak 2023 tarihinde yazarlar Chuyi Li, Lulu Li ve Meituan ekibi tarafından yayınlanan YOLOv6.YOLOv6 (genellikle "YOLOv6 .0" olarak anılır), çerçevenin "Tam Ölçekli Yeniden Yüklemesi"ni temsil eder. GPU'larda yüksek verim ve düşük gecikme süresinin vazgeçilmez olduğu endüstriyel uygulamalar için özel olarak tasarlanmıştır.

Mimari Yenilikler

YOLOv6.0, standart PANet yapılarına kıyasla özellik birleştirme yeteneklerini geliştiren Çift Yönlü Yol Birleştirme Ağı'nı (Bi-PAN) entegre eder. Önemli bir şekilde, RepVGG tarzı bloklar kullanır ve modelin daha iyi gradyan akışı için eğitim sırasında çok dallı bir topolojiye sahip olmasını sağlar, bu da daha sonra çıkarım sırasında tek yollu bir yapıya dönüşür. Bu yeniden parametreleştirme tekniği, NVIDIA T4 ve GeForce GPU'lar gibi donanımlarda çıkarım hızını önemli ölçüde artırır.

Ek özellikler şunları içerir:

  • Anchor-Aided Training (AAT): Yakınsamayı stabilize etmek için anchor tabanlı ve anchor-free dedektör paradigmalarını birleştiren hibrit bir strateji.
  • Ayrıştırılmış Başlık: Sınıflandırma ve regresyon dallarını ayırarak, her bir görevin bağımsız özellikleri öğrenmesine olanak tanıyarak doğruluğu artırır.

YOLOv6 hakkında daha fazla bilgi edinin.

EfficientDet: Ölçeklenebilir Standart

Google ekibi (Mingxing Tan, Ruoming Pang, Quoc V. Le) tarafından geliştirilen ve 20 Kasım 2019'da piyasaya sürülen EfficientDet, nesne algılamaya bileşik ölçeklendirme kavramını getirdi. EfficientNet backbone üzerine inşa edilen bu sistem backbone Çift Yönlü Özellik Piramidi Ağı (BiFPN) kavramını backbone beraberinde getirdi.

Mimari Güçlü Yönler

EfficientDet'in temel yeniliği, kolay ve hızlı çok ölçekli özellik birleştirmeye olanak tanıyan BiFPN'dir. Geleneksel FPN'lerden farklı olarak, BiFPN öğrenilebilir ağırlıklar kullanarak farklı girdi özelliklerinin önemini anlar. Model, öncelikle çözünürlüğü, derinliği ve genişliği eşit olarak ölçekleyen bileşik katsayı $\phi$ aracılığıyla ölçeklenir. Bu, EfficientDet'in mobil cihazlardan (d0) yüksek hassasiyetli sunucu görevlerine (d7) kadar çok özel kaynak kısıtlamalarını hedeflemesine olanak tanır.

Eski Not

EfficientDet yüksek parametre verimliliği (düşük model boyutu) sağlarken, karmaşık BiFPN katmanları ve Swish aktivasyon fonksiyonları, YOLO kullanılan standart 3x3 konvolüsyonlara kıyasla bazı kenar hızlandırıcılarında hesaplama açısından maliyetli olabilir.

Teknik Karşılaştırma ve Analiz

1. Gecikme süresi ve verimlilik

En belirgin fark, "verimlilik" kavramının tanımlanma biçimindedir. EfficientDet, FLOP'lar (Kayan Nokta İşlemleri) ve parametre sayısı için optimizasyon yapar ve çok küçük model dosyalarıyla mükemmel doğruluk sağlar (örneğin, EfficientDet-d0 sadece 3,9 milyon parametre içerir). Ancak, düşük FLOP'lar her zaman düşük gecikme süresine karşılık gelmez.

YOLOv6, GPU'larda çıkarım gecikmesini optimize eder. Tabloda görüldüğü gibi, YOLOv6. YOLOv6 bir T4 GPU 1,17 ms'de çalışırken, benzer EfficientDet-d0 3,92 ms'deçalışır; daha az parametreye sahip olmasına rağmen neredeyse 3 kat daha yavaştır. Bu, YOLOv6 gerçek zamanlı video analizi için YOLOv6 kılar.

2. Eğitim Ekosistemi

EfficientDet, TensorFlow ve AutoML kütüphanelerine büyük ölçüde dayanmaktadır. Güçlü olmalarına rağmen, bunların modern PyTorch iş akışlarına entegre edilmesi zahmetli olabilir. YOLOv6 ve özellikle Ultralytics ekosistemine entegrasyonu, daha erişilebilir bir PyTorch yararlanarak hata ayıklama, değiştirme ve dağıtım işlemlerini kolaylaştırır.

3. Çok yönlülük

EfficientDet, öncelikle sınırlayıcı kutu algılama için tasarlanmıştır. Buna karşılık, Ultralytics tarafından desteklenen modern YOLO , çok görevli öğrenicilere Ultralytics .

Ultralytics'in Avantajı

YOLOv6. YOLOv6 ve EfficientDet yetenekli modeller olsa da, Ultralytics makine öğrenimi yaşam döngüsünü büyük ölçüde basitleştiren birleşik bir arayüz sunar. YOLOv8, YOLO11 veya en son teknoloji YOLO26 kullanıyor olun, geliştiriciler şu avantajlardan yararlanır:

  • Kullanım Kolaylığı: Tek bir dizeyi değiştirerek modeller arasında geçiş yapmanızı sağlayan tutarlı bir Python .
  • Performans Dengesi: Ultralytics , hız ve ortalama ortalama hassasiyet (mAP) arasında en iyi dengeyi sağlayacak şekilde tasarlanmıştır.
  • İyi Bakımlı Ekosistem: Aktif destek, sık güncellemeler ve veri kümesi yönetimi ve bulut eğitimi için Ultralytics gibi araçlarla sorunsuz entegrasyon.
  • Bellek Gereksinimleri: Transformatör ağırlıklı mimarilere kıyasla eğitim sırasında VRAM kullanımı önemli ölçüde daha düşüktür, bu da üst düzey AI eğitimine erişimi demokratikleştirir.

YOLO26'ya Yükseltin

En yüksek performansı arayan geliştiriciler için, YOLO26 (Ocak 2026'da piyasaya sürüldü) sınırları daha da zorluyor. Uçtan uca NMS Tasarım özelliğini sunarak, Maksimum Baskılama sonrası işleme ihtiyacını ortadan kaldırıyor. Bu, gecikme varyansını azaltır ve dağıtım mantığını basitleştirir.

YOLO26'nın temel yenilikleri şunlardır:

  • MuSGD Optimizer: Kararlı yakınsama için LLM eğitimi (Moonshot AI'nın Kimi K2) esinlenerek geliştirilmiş hibrit bir optimizer.
  • DFL Kaldırma: Dağıtım Odak Kaybının kaldırılması, çıkış kafasını basitleştirerek kenar cihazlarıyla uyumluluğu artırır.
  • ProgLoss + STAL: Drone ve IoT uygulamaları için çok önemli olan küçük nesne algılamayı iyileştiren gelişmiş kayıp fonksiyonları.
  • %43'e kadar daha hızlı CPU : Özel GPU'lar bulunmayan ortamlar için özel olarak optimize edilmiştir.

YOLO26 hakkında daha fazla bilgi edinin

Python : Ultralytics ile Eğitim

Aşağıdaki kod, Ultralytics kullanarak son teknoloji bir modeli eğitmenin ne kadar kolay olduğunu göstermektedir. Bu birleşik API, YOLOv8, YOLO11 ve YOLO26'yı sorunsuz bir şekilde desteklemektedir.

from ultralytics import YOLO

# Load the cutting-edge YOLO26n model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset for 100 epochs
# The system automatically handles dataset downloading and configuration
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a sample image
results = model("https://ultralytics.com/images/bus.jpg")

Kullanım Durumu Önerileri

Ne Zaman YOLOv6-3.0 Seçmeli

  • Üretim Hatları: GPU mevcut olduğu ve gecikmenin 5 ms'nin altında olması gereken yüksek hızlı kusur tespiti.
  • Akıllı Şehir Analitiği: Sunucu sınıfı GPU'larda (ör. T4, A100) çok sayıda video akışını işleme.
  • Perakende Otomasyonu: Otomatik ödeme sistemlerinde gerçek zamanlı ürün tanıma.

Ne Zaman EfficientDet Seçmeli

  • Storage-Constrained Devices: Legacy IoT devices where the model weight file size (e.g., <5MB) is the primary constraint.
  • Akademik Araştırma: Özellik piramidi ağları veya bileşik ölçekleme yasalarına odaklanan çalışmalar.
  • TensorFlow : GoogleTPU derinlemesine kök salmış mevcut boru hatları.

Ultralytics Ne Zaman Seçmelisiniz?

  • Edge Computing: Raspberry Pi veya cep telefonları gibi CPU cihazlara dağıtım, %43 daha hızlı CPU yararlanma.
  • Robotik: Standart algılama ile birlikte poz tahmini veya yönlendirilmiş nesne algılama (OBB) gerektiren uygulamalar.
  • Yeni Gelişmeler: Uzun vadeli bakım gerektiren projeler, kolay dışa aktarım TensorRT veya ONNX'e kolay aktarım ve aktif topluluk desteği gerektiren projeler.

Sonuç

Hem YOLOv6. YOLOv6 hem de EfficientDet, nesne algılama alanını şekillendirmiştir. EfficientDet, bileşik ölçeklemenin değerini kanıtlarken, YOLOv6. YOLOv6, maksimum GPU için mimarinin nasıl uyarlanacağını göstermiştir. Ancak, çoğu modern uygulama için Ultralytics en cazip paketi sunmaktadır: uçtan uca verimlilik, üstün hız ve çok yönlü, geleceğe dönük bir ekosistem.

Diğer yüksek performanslı seçenekleri keşfetmek isteyen kullanıcılar şunu da düşünebilirler YOLOv8, YOLOv9veya YOLO11 'yi kullanabilirler.


Yorumlar