YOLO . EfficientDet: Nesne Algılama Mimarilerine Derinlemesine Bir Bakış

Optimum bilgisayar görme mimarisini seçmek, çıkarım gecikmesinden donanım maliyetlerine kadar her şeyi etkileyen çok önemli bir karardır. Bu teknik karşılaştırmada, iki etkili modeli inceliyoruz: Alibaba'nın YOLO ve Google EfficientDet modelleri. EfficientDet ölçeklenebilir verimlilik kavramını getirirken,YOLO yeni damıtma teknikleriyle gerçek zamanlı performansın sınırlarınıYOLO .

Bu kılavuz, mimarileri, performans ölçütleri ve modern dağıtım için uygunlukları hakkında titiz bir analiz sunarken, Ultralytics gibi yeni nesil çözümlerin kullanım kolaylığı ve uç verimliliği için nasıl yeni standartlar belirlediğini de inceliyor.

DAMO-YOLO'ya Genel Bakış

YOLO Alibaba Group tarafından geliştirilen yüksek performanslı bir nesne algılamaYOLO . Neural Architecture Search (NAS) ve ağır yeniden parametreleştirme gibi teknolojilerden yararlanarak hız ve doğruluk arasındaki dengeyi önceliklendirir. Öncelikle endüstriyel uygulamalar için tasarlanan bu çerçeve, algılama kalitesinden ödün vermeden gecikmeyi azaltmayı amaçlamaktadır.

Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş:Alibaba Group
Tarih: 23 Kasım 2022
Arxiv:YOLO
GitHub:YOLO
Belgeler:YOLO

Temel Mimari Özellikler

MAE-NAS Backbone: Verimli backbone keşfetmek için Maskelenmiş Otomatik Kodlayıcı (MAE) tabanlı Sinir Mimarisi Arama kullanır.
Verimli RepGFPN: Yeniden parametrelendirmeyi kullanan ağır boyun tasarımı ( YOLOv6) kullanarak özellikleri etkili bir şekilde birleştirirken hızlı çıkarım sağlar.
ZeroHead: Son tahmin aşamasında hesaplama yükünü en aza indiren hafif bir algılama başlığı.
AlignedOTA: Eğitim sırasında sınıflandırma ve regresyon görevleri arasındaki uyumsuzluk sorunlarını çözen, geliştirilmiş bir etiket atama stratejisi.

EfficientDet'e Genel Bakış

Google ekibi tarafından geliştirilen EfficientDet, modelleme ölçeklendirmesine sistematik bir yaklaşım getirmiştir. EfficientDet, backbone, çözünürlük ve derinliği birlikte ölçeklendirerek olağanüstü bir verimlilik elde etmektedir. EfficientNet backbone dayanan bu sistem backbone karmaşık özelliklerin birleştirilmesi için BiFPN (Çift Yönlü Özellik Piramit Ağı) teknolojisini kullanmaktadır.

Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
Kuruluş:Google
Tarih: 20 Kasım 2019
Arxiv:EfficientDet Makalesi
GitHub:google
Dokümanlar:EfficientDet README

Temel Mimari Özellikler

Bileşik Ölçeklendirme: Basit bir bileşik katsayı (phi) ile ağ genişliğini, derinliğini ve çözünürlüğünü eşit şekilde ölçeklendirme yöntemi.
BiFPN: Kolay ve hızlı çok ölçekli özellik birleştirme sağlayan, ağırlıklı çift yönlü özellik piramidi ağı.
EfficientNet Backbone: Özellik çıkarma için güçlü EfficientNet mimarisini kullanır.

Performans Karşılaştırması

Aşağıdaki tablo,YOLO EfficientDet varyantlarının performanslarını karşılaştırmaktadır.YOLO , özellikle yeniden parametrelendirilmiş bloklarının öne çıktığı GPU ,YOLO üstün hız-doğruluk oranları sunmaktadır. EfficientDet, doğru olmasına rağmen, karmaşık BiFPN bağlantıları ve daha yavaş aktivasyon fonksiyonları nedeniyle genellikle daha yüksek gecikme süresine maruz kalmaktadır.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20.7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

Sonuçların Analizi

Gecikme:YOLO , TensorRT EfficientDet'tenYOLO daha iyi performans gösterir. Örneğin, DAMO-YOLOl ~7 mAP 50,8 mAP ulaşırken, EfficientDet-d4 benzer bir doğruluk için ~33 ms'ye ihtiyaç duyar.
Mimari Verimliliği: EfficientDet'in düşük parametre sayısı (örneğin, d0 sadece 3,9 milyon parametreye sahiptir) onu depolama açısından uygun hale getirir, ancak karmaşık grafik yapısı (BiFPN) genellikle YOLO modellerin basitleştirilmiş yapılarına kıyasla daha yavaş gerçek çıkarım hızlarına neden olur.
Kaynak Kullanımı:YOLO , eğitim sırasında "Damıtma Geliştirme" özelliğiniYOLO . Bu özellik, daha küçük öğrenci modellerinin daha büyük öğretmenlerden öğrenmesini sağlayarak, çıkarım maliyetini artırmadan performansı artırır.

Yeniden Parametreleştirme Açıklaması

YOLO , RepVGG'ye benzer yeniden parametreleştirme teknikleriYOLO . Eğitim sırasında model, zengin özellikleri öğrenmek için karmaşık çok dallı bloklar kullanır. Çıkarımdan önce, bu dallar matematiksel olarak tek bir konvolüsyon halinde birleştirilir, böylece doğruluk kaybı olmadan hız önemli ölçüde artırılır.

Kullanım Alanları ve Uygulamalar

Her modelin hangi alanlarda üstün olduğunu anlamak, işe uygun doğru aracı seçmeye yardımcı olur.

DAMO-YOLO Ne Zaman Kullanılmalı

Endüstriyel Denetim: Hızlı hareket eden konveyörlerde kusurları tespit etmek için milisaniyelik gecikmenin kritik öneme sahip olduğu üretim hatları için idealdir.
Akıllı Şehir Gözetimi: Yüksek verimi sayesinde tek bir GPU üzerinde birden fazla video akışını işleyebilir.
Robotik: Engelleri önlemek için hızlı tepki sürelerinin gerekli olduğu otonom navigasyon için uygundur.

Ne Zaman EfficientDet Kullanılmalı

Akademik Araştırma: Sistematik ölçeklendirme kuralları, model verimlilik teorilerini incelemek için mükemmel bir temel oluşturur.
Depolama Alanı Kısıtlı Ortamlar: Disk alanı birincil darboğaz ise, d0/d1 varyantlarının son derece düşük parametre sayısı avantajlıdır, ancak RAM kullanımı ve CPU yine de benzer YOLO daha yüksek olabilir.
Mobil Uygulamalar (Eski): İlk mobil uygulamalar, TFLite EfficientDet sürümlerini kullanıyordu, ancak modern mimarilerde YOLO11 gibi modern mimariler büyük ölçüde onun yerini almıştır.

Ultralytics Avantajı: YOLO26 Sahneye Çıkıyor

YOLO EfficientDet önemli kilometre taşları olsa da, bu alan gelişmeye devam etti. Ultralytics , uçtan uca tasarım ve üstün optimizasyon ile önceki mimarilerin sınırlamalarını ortadan kaldırarak, günümüzün en gelişmiş teknolojisini temsil ediyor.

YOLO26 hakkında daha fazla bilgi edinin

Geliştiriciler Neden Ultralytics'i Tercih Ediyor

Kullanım Kolaylığı ve Ekosistem: Ultralytics , sorunsuz bir "sıfırdan kahramana" deneyimi Ultralytics . Araştırma depolarının genellikle gerektirdiği karmaşık yapılandırma dosyalarının aksine, Ultralytics birkaç satır Python ile eğitime başlamanıza Ultralytics . Ekosistem, kolay veri kümesi yönetimi ve bulut eğitimi için Ultralytics içerir.
```
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100)
```
Performans Dengesi: YOLO26, Pareto sınırını domine etmek üzere tasarlanmıştır. Önceki nesillere kıyasla %43'e kadar daha hızlı CPU sahip olup, GPU'ların kullanılamadığı uç AI uygulamaları için güçlü bir işlemci görevi görür.
Uçtan Uca NMS: Nesne algılayıcıların dağıtımında en büyük sorunlardan biri, Maksimum Baskılama (NMS)dır.YOLO EfficientDet, NMS dayanır ve bu da son işlemleri karmaşıklaştırır ve gecikme değişkenliği yaratır. YOLO26, doğal olarak uçtan uca çalışır ve deterministik ve daha hızlı çıkarım için NMS ortadan kaldırır.
Eğitim Verimliliği ve MuSGD: YOLO26, SGD Muon'un bir karışımı olan MuSGD Optimizer'ı entegre eder. LLM eğitiminden esinlenen bu yenilik, istikrarlı bir yakınsama sağlar ve kapsamlı hiperparametre ayarlaması ihtiyacını azaltır. Eğitim sırasında daha düşük bellek gereksinimleri ile birleştiğinde, kullanıcıların, bellek gereksinimi yüksek transformatör hibritlerine kıyasla tüketici donanımında daha büyük parti boyutlarını eğitmelerine olanak tanır. RT-DETRgibi bellek gereksinimi yüksek transformatör hibritlerine kıyasla daha büyük parti boyutlarını tüketici
Çok yönlülük: EfficientDet veYOLO öncelikle sınırlayıcı kutularaYOLO , Ultralytics tek bir birleşik API içinde örnek segmentasyonu, poz tahmini, OBB ve sınıflandırma dahil olmak üzere çok çeşitli görevleri doğal olarak destekler.

Karşılaştırma Özeti

Özellik	EfficientDet	DAMO-YOLO	Ultralytics YOLO26
Mimari	Çapa tabanlı, BiFPN	Çapa içermeyen, RepGFPN	Uçtan uca, NMS
Çıkarım Hızı	Yavaş (karmaşık grafik)	Hızlı (GPU )	SOTA (CPU GPU)
Dağıtım	Karmaşık (NMS )	Orta (NMS )	Basit (NMS)
Eğitim Hafızası	Yüksek	Orta Düzey	Düşük (Optimize Edilmiş)
Görev Desteği	Algılama	Algılama	Algıla, Böl, Poz, OBB

Sonuç

YOLO EfficientDet, bilgisayar görme tarihine önemli katkılarda bulunmuştur. EfficientDet, bileşik ölçeklemenin gücünü gösterirken,YOLO yeniden parametreleştirme ve damıtmanın etkinliğiniYOLO . Ancak, 2026 yılında yeni projelere başlayan geliştiriciler için Ultralytics , cazip bir avantaj sunmaktadır.

NMS kaldırılması, dağıtım süreçlerini NMS , MuSGD optimizasyonu eğitimi hızlandırır ve optimize edilmiş mimarisi hem uç CPU'larda hem de güçlü GPU'larda üstün hız sağlar. Akıllı kamera sistemi veya bulut tabanlı video analiz platformu oluşturuyor olsanız da, Ultralytics sağlam ekosistemi ve performansı onu önerilen seçim Ultralytics .

Daha fazla araştırma yapmak için, YOLO26 ile YOLOv10 karşılaştırmak veya YOLO11'in avantajlarını anlamak da ilginizi çekebilir. YOLO11 'nin avantajlarını anlamak ilginizi çekebilir.

YOLO . EfficientDet: Nesne Algılama Mimarilerine Derinlemesine Bir Bakış

DAMO-YOLO'ya Genel Bakış

Temel Mimari Özellikler

EfficientDet'e Genel Bakış

Temel Mimari Özellikler

Performans Karşılaştırması

Sonuçların Analizi

Kullanım Alanları ve Uygulamalar

DAMO-YOLO Ne Zaman Kullanılmalı

Ne Zaman EfficientDet Kullanılmalı

Ultralytics Avantajı: YOLO26 Sahneye Çıkıyor

Geliştiriciler Neden Ultralytics'i Tercih Ediyor

Karşılaştırma Özeti

Sonuç

Yorumlar