İçeriğe geç

EfficientDet vs YOLOv6.0: Nesne Algılama Mimarilerine Derinlemesine Bir Bakış

Doğru nesne algılama modelini seçmek, genellikle doğruluk, gecikme süresi ve dağıtım kısıtlamaları arasında bir denge kurma işidir. Bu karşılaştırma, bilgisayar görme tarihindeki iki önemli dönüm noktasını ele almaktadır: 2019 yılında parametre verimliliğini yeniden tanımlayan Google ölçeklenebilir mimarisi EfficientDet ve 2023 yılında yüksek verimli GPU için optimize edilmiş Meituan'ın endüstriyel sınıf dedektörü YOLOv6.YOLOv6.

Performans Metrikleri Karşılaştırması

Aşağıdaki tablo, iki mimarinin performans farklılıklarını göstermektedir. EfficientDet parametre verimliliğine (belirli bir doğruluk için daha küçük model boyutu) odaklanırken, YOLOv6. YOLOv6 GPU gibi donanım hızlandırıcılarında çıkarım hızına öncelik vermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

EfficientDet: Ölçeklenebilir ve Parametre Verimli

EfficientDet, nesne algılama modellerini verimli bir şekilde ölçeklendirme sorununu çözmek için Google ekibi tarafından tanıtıldı. Ağları daha derin veya daha geniş hale getiren önceki modellerden farklı olarak, EfficientDet çözünürlüğü, derinliği ve genişliği eşit şekilde ölçeklendiren bir Bileşik Ölçeklendirme yöntemi getirdi.

Temel Mimari Özellikler

  • BiFPN (Ağırlıklı Çift Yönlü Özellik Piramit Ağı): EfficientDet, karmaşık bir özellik birleştirme yolu oluşturur. Standart FPN'den farklı olarak BiFPN, farklı giriş özelliklerine öğrenilebilir ağırlıklar ekleyerek kolay çok ölçekli özellik birleştirme sağlar ve ağın daha önemli bilgilere öncelik vermesini garanti eder.
  • EfficientNet Backbone: Floating-point operations (FLOPs) ve parametre sayısı için yüksek düzeyde optimize edilmiş EfficientNet'i backbone olarak kullanır.
  • Bileşik Ölçeklendirme: Basit bir katsayı $\phi$, backbone, BiFPN ve sınıf/kutu ağlarının ölçeklendirmesini aynı anda kontrol eder.

Karmaşıklık Uyarısı

BiFPN matematiksel olarak zarif ve parametre açısından verimli olsa da, düzensiz bellek erişim modelleri, YOLO bulunan basit konvolüsyon bloklarına kıyasla belirli donanım hızlandırıcılarında optimizasyonu zorlaştırabilir.

Meta Veriler:

EfficientDet hakkında daha fazla bilgi edinin

YOLOv6.0: Endüstriyel Hız Canavarı

Meituan tarafından 2023 yılında piyasaya sürülen YOLOv6. YOLOv6(genellikle "Tam Ölçekli Yeniden Yükleme" olarak anılır), endüstriyel uygulamalar için özel olarak tasarlanmıştır. Yazarlar, teorik FLOP'lardan ziyade GPU'larda gerçek dünya çıkarım hızına öncelik vermişler ve sonuç olarak video analizi gibi yüksek verimli senaryolarda üstünlük sağlayan bir model ortaya çıkmıştır.

Temel Mimari Özellikler

  • RepBi-PAN: Bu güncellenmiş boyun yapısı, RepVGG tarzı bloklar kullanır. Eğitim sırasında, bu bloklar daha iyi gradyan akışı için çok dallı topolojilere sahiptir. Çıkarım sırasında, yapısal olarak tek bir 3x3 konvolüsyona yeniden parametrelendirilirler ve bu da gecikmeyi önemli ölçüde azaltır.
  • Anchor-Aided Training (AAT): YOLOv6 temelde ankarsız bir dedektör YOLOv6 da, v3.0 sürümünde, yakınsama sürecini stabilize etmek ve çıkarım hızını etkilemeden doğruluğu artırmak için eğitim sırasında yardımcı bir ankarsız dal eklenmiştir.
  • Ayrıştırılmış Başlık: Sınıflandırma ve regresyon görevleri farklı dallara ayrılmıştır. Bu tasarım seçimi, bu iki hedef arasındaki çelişkiyi çözmek için modern dedektörlerde standart hale gelmiştir.

Meta Veriler:

  • Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, ve diğerleri.
  • Kuruluş:Meituan
  • Tarih: 13 Ocak 2023
  • Bağlantılar:Arxiv | GitHub

YOLOv6 hakkında daha fazla bilgi edinin.

Karşılaştırmalı Analiz

Gecikme ve Verim

YOLOv6.YOLOv6, GPU önemli ölçüde daha hızlıdır. Tabloda görüldüğü gibi, YOLOv6.0l, sadece 8,95 ms'lik bir TensorRT süresiyle %52, mAP bir mAP ulaşmaktadır. Buna karşılık, EfficientDet-d6 benzer bir %52,6 mAP elde eder, mAP 89,29 msgerektirir; bu, pratikte bir kat daha yavaştır. Bu, YOLOv6 NVIDIA veya Jetson cihazlarında gerçek zamanlı işleme gerektiren uygulamalar için açık YOLOv6 yapar.

Parametre Verimliliği

EfficientDet, depolamanın temel darboğaz olduğu ortamlarda üstün performans gösterir. EfficientDet-d0, yalnızca 3,9 milyon parametre mAP %34,6'lık saygın bir mAP sağlar. Bu, en küçük YOLOv6 daha düşüktür. Akademik araştırma veya son derece kısıtlı depolama ortamları (örneğin, bir modeli doğrudan küçük bir mobil uygulama paketine gömmek) için EfficientDet'in küçük ayak izi önemini korumaktadır.

Eğitim ve Kullanılabilirlik

EfficientDet, modern PyTorch iş akışlarına entegre edilmesi zor olabilen eski TensorFlow ekosistemine dayanmaktadır. Eğitim, genellikle bileşik ölçekleme için karmaşık hiperparametre ayarlamasını içerir. YOLOv6. YOLOv6 daha modern bir eğitim yöntemi sunar, ancak nesne algılamaya yoğun bir şekilde odaklanır ve temel sürümünde segmentasyon veya poz tahmini gibi diğer görevler için yerel destek sunmaz.

Ultralytics'in Avantajı

Bu mimarileri incelemek değerli bilgiler sağlasa da, modern geliştirme için bütünsel bir platform gereklidir. Ultralytics , makine öğreniminin tüm yaşam döngüsüne odaklanarak bireysel model mimarilerinin yerini alan kapsamlı bir ekosistem Ultralytics .

Neden Ultralytics'e geçmelisiniz?

  • Eşsiz Çok Yönlülük: Öncelikle nesne algılayıcıları YOLOv6 EfficientDet ve YOLOv6 aksine, Ultralytics doğal olarak Örnek Segmentasyonu, Poz Tahmini, Yönlendirilmiş Sınırlayıcı Kutular (OBB) ve Sınıflandırmayı destekler.
  • Kullanım Kolaylığı: Tutarlı bir Python , tek bir dizeyi değiştirerek model nesilleri arasında (örneğin, YOLO11 ) geçiş yapmanızı sağlar.
  • Bellek Verimliliği: Ultralytics , eğitim sırasında daha düşük VRAM kullanımı için optimize edilmiştir, bu da EfficientDet'in bellek tüketen mimarilerine kıyasla tüketici GPU'larında daha büyük parti boyutlarına olanak tanır.

YOLO26: Yeni Standart

En son teknolojiyi arayan geliştiriciler için YOLO26, verimlilik ve performansın zirvesini temsil ediyor. Ocak 2026'da piyasaya sürülen bu ürün, EfficientDet (hız) ve YOLOv6 CPU ) ürünlerinin sınırlamalarını ortadan kaldırıyor.

YOLO26'nın Çığır Açan Yenilikleri:

  • Uçtan uca NMS: Non-Maximum Suppression (NMS) özelliğini ortadan kaldırarak, YOLO26 dağıtım mantığını basitleştirir ve çıkarım gecikme varyansını azaltır.
  • MuSGD Optimizer: LLM eğitiminden esinlenilen bu hibrit optimizer, eğitimi stabilize eder ve yakınsamayı hızlandırır.
  • Kenar Optimizasyonu: Dağıtım Odak Kaybı (DFL) ve belirli mimari ayarlamaların kaldırılmasıyla, YOLO26 önceki nesillere kıyasla CPU çıkarımında %43'e kadar daha hızlıdır, bu da EfficientDet'in genellikle zorlandığı Raspberry Pi ve mobil dağıtımlar için üstün bir performans sağlar.
  • Gelişmiş Kayıp Fonksiyonları: ProgLoss ve STAL' ın entegrasyonu, drone görüntüleri ve IoT sensörleri için kritik bir gereklilik olan küçük nesne algılamasını önemli ölçüde iyileştirir.
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on COCO8 dataset with MuSGD optimizer
model.train(data="coco8.yaml", epochs=100, optimizer="MuSGD")

# Export to ONNX for NMS-free deployment
model.export(format="onnx")

YOLO26 hakkında daha fazla bilgi edinin

Kullanım Durumu Önerileri

  • Aşağıdaki durumlarda EfficientDet'i seçin: Özellik birleştirme ölçeklendirme konusunda akademik araştırma yapıyorsanız veya model ağırlık boyutu (MB) katı bir kısıtlama olan eski TensorFlow çalışıyorsanız.
  • Aşağıdaki durumlarda YOLOv6. YOLOv6 seçin: Yalnızca NVIDIA (T4 veya A10 gibi) dağıtım yapıyorsanız ve standart nesne algılama için ham verim (FPS) tek ölçütünüzse.
  • Aşağıdaki durumlarda Ultralytics tercih edin:GPU dengeleyen, karmaşık son işlem gerektirmeyen (NMS), basit algılamanın ötesinde görevleri (segmentasyon veya OBB gibi) yerine getirmesi gereken veya basitleştirilmiş bir eğitim iş akışı gerektiren, üretime hazır bir çözüme ihtiyacınız varsa.

Modern nesne algılayıcıları hakkında daha fazla bilgi edinmek için, YOLOv8 EfficientDetYOLOv8 karşılaştırmamızı veya Gerçek Zamanlı Algılama Dönüştürücülerinin (RT-DETR) yeteneklerini okumanızı öneririz.


Yorumlar