YOLO . EfficientDet: Nesne Algılama Mimarilerine Derinlemesine Bir Bakış
Optimum bilgisayar görme mimarisini seçmek, çıkarım gecikmesinden donanım maliyetlerine kadar her şeyi etkileyen çok önemli bir karardır. Bu teknik karşılaştırmada, iki etkili modeli inceliyoruz: Alibaba'nın YOLO ve Google EfficientDet modelleri. EfficientDet ölçeklenebilir verimlilik kavramını getirirken,YOLO yeni damıtma teknikleriyle gerçek zamanlı performansın sınırlarınıYOLO .
Bu kılavuz, mimarileri, performans ölçütleri ve modern dağıtım için uygunlukları hakkında titiz bir analiz sunarken, Ultralytics gibi yeni nesil çözümlerin kullanım kolaylığı ve uç verimliliği için nasıl yeni standartlar belirlediğini de inceliyor.
DAMO-YOLO'ya Genel Bakış
YOLO Alibaba Group tarafından geliştirilen yüksek performanslı bir nesne algılamaYOLO . Neural Architecture Search (NAS) ve ağır yeniden parametreleştirme gibi teknolojilerden yararlanarak hız ve doğruluk arasındaki dengeyi önceliklendirir. Öncelikle endüstriyel uygulamalar için tasarlanan bu çerçeve, algılama kalitesinden ödün vermeden gecikmeyi azaltmayı amaçlamaktadır.
Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş:Alibaba Group
Tarih: 23 Kasım 2022
Arxiv:YOLO
GitHub:YOLO
Belgeler:YOLO
Temel Mimari Özellikler
- MAE-NAS Backbone: Verimli backbone keşfetmek için Maskelenmiş Otomatik Kodlayıcı (MAE) tabanlı Sinir Mimarisi Arama kullanır.
- Verimli RepGFPN: Yeniden parametrelendirmeyi kullanan ağır boyun tasarımı ( YOLOv6) kullanarak özellikleri etkili bir şekilde birleştirirken hızlı çıkarım sağlar.
- ZeroHead: Son tahmin aşamasında hesaplama yükünü en aza indiren hafif bir algılama başlığı.
- AlignedOTA: Eğitim sırasında sınıflandırma ve regresyon görevleri arasındaki uyumsuzluk sorunlarını çözen, geliştirilmiş bir etiket atama stratejisi.
EfficientDet'e Genel Bakış
Google ekibi tarafından geliştirilen EfficientDet, modelleme ölçeklendirmesine sistematik bir yaklaşım getirmiştir. EfficientDet, backbone, çözünürlük ve derinliği birlikte ölçeklendirerek olağanüstü bir verimlilik elde etmektedir. EfficientNet backbone dayanan bu sistem backbone karmaşık özelliklerin birleştirilmesi için BiFPN (Çift Yönlü Özellik Piramit Ağı) teknolojisini kullanmaktadır.
Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
Kuruluş:Google
Tarih: 20 Kasım 2019
Arxiv:EfficientDet Makalesi
GitHub:google
Dokümanlar:EfficientDet README
Temel Mimari Özellikler
- Bileşik Ölçeklendirme: Basit bir bileşik katsayı (phi) ile ağ genişliğini, derinliğini ve çözünürlüğünü eşit şekilde ölçeklendirme yöntemi.
- BiFPN: Kolay ve hızlı çok ölçekli özellik birleştirme sağlayan, ağırlıklı çift yönlü özellik piramidi ağı.
- EfficientNet Backbone: Özellik çıkarma için güçlü EfficientNet mimarisini kullanır.
Performans Karşılaştırması
Aşağıdaki tablo,YOLO EfficientDet varyantlarının performanslarını karşılaştırmaktadır.YOLO , özellikle yeniden parametrelendirilmiş bloklarının öne çıktığı GPU ,YOLO üstün hız-doğruluk oranları sunmaktadır. EfficientDet, doğru olmasına rağmen, karmaşık BiFPN bağlantıları ve daha yavaş aktivasyon fonksiyonları nedeniyle genellikle daha yüksek gecikme süresine maruz kalmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Sonuçların Analizi
- Gecikme:YOLO , TensorRT EfficientDet'tenYOLO daha iyi performans gösterir. Örneğin, DAMO-YOLOl ~7 mAP 50,8 mAP ulaşırken, EfficientDet-d4 benzer bir doğruluk için ~33 ms'ye ihtiyaç duyar.
- Mimari Verimliliği: EfficientDet'in düşük parametre sayısı (örneğin, d0 sadece 3,9 milyon parametreye sahiptir) onu depolama açısından uygun hale getirir, ancak karmaşık grafik yapısı (BiFPN) genellikle YOLO modellerin basitleştirilmiş yapılarına kıyasla daha yavaş gerçek çıkarım hızlarına neden olur.
- Kaynak Kullanımı:YOLO , eğitim sırasında "Damıtma Geliştirme" özelliğiniYOLO . Bu özellik, daha küçük öğrenci modellerinin daha büyük öğretmenlerden öğrenmesini sağlayarak, çıkarım maliyetini artırmadan performansı artırır.
Yeniden Parametreleştirme Açıklaması
YOLO , RepVGG'ye benzer yeniden parametreleştirme teknikleriYOLO . Eğitim sırasında model, zengin özellikleri öğrenmek için karmaşık çok dallı bloklar kullanır. Çıkarımdan önce, bu dallar matematiksel olarak tek bir konvolüsyon halinde birleştirilir, böylece doğruluk kaybı olmadan hız önemli ölçüde artırılır.
Kullanım Alanları ve Uygulamalar
Her modelin hangi alanlarda üstün olduğunu anlamak, işe uygun doğru aracı seçmeye yardımcı olur.
DAMO-YOLO Ne Zaman Kullanılmalı
- Endüstriyel Denetim: Hızlı hareket eden konveyörlerde kusurları tespit etmek için milisaniyelik gecikmenin kritik öneme sahip olduğu üretim hatları için idealdir.
- Akıllı Şehir Gözetimi: Yüksek verimi sayesinde tek bir GPU üzerinde birden fazla video akışını işleyebilir.
- Robotik: Engelleri önlemek için hızlı tepki sürelerinin gerekli olduğu otonom navigasyon için uygundur.
Ne Zaman EfficientDet Kullanılmalı
- Akademik Araştırma: Sistematik ölçeklendirme kuralları, model verimlilik teorilerini incelemek için mükemmel bir temel oluşturur.
- Depolama Alanı Kısıtlı Ortamlar: Disk alanı birincil darboğaz ise, d0/d1 varyantlarının son derece düşük parametre sayısı avantajlıdır, ancak RAM kullanımı ve CPU yine de benzer YOLO daha yüksek olabilir.
- Mobil Uygulamalar (Eski): İlk mobil uygulamalar, TFLite EfficientDet sürümlerini kullanıyordu, ancak modern mimarilerde YOLO11 gibi modern mimariler büyük ölçüde onun yerini almıştır.
Ultralytics Avantajı: YOLO26 Sahneye Çıkıyor
YOLO EfficientDet önemli kilometre taşları olsa da, bu alan gelişmeye devam etti. Ultralytics , uçtan uca tasarım ve üstün optimizasyon ile önceki mimarilerin sınırlamalarını ortadan kaldırarak, günümüzün en gelişmiş teknolojisini temsil ediyor.
YOLO26 hakkında daha fazla bilgi edinin
Geliştiriciler Neden Ultralytics'i Tercih Ediyor
Kullanım Kolaylığı ve Ekosistem: Ultralytics , sorunsuz bir "sıfırdan kahramana" deneyimi Ultralytics . Araştırma depolarının genellikle gerektirdiği karmaşık yapılandırma dosyalarının aksine, Ultralytics birkaç satır Python ile eğitime başlamanıza Ultralytics . Ekosistem, kolay veri kümesi yönetimi ve bulut eğitimi için Ultralytics içerir.
from ultralytics import YOLO # Load the latest YOLO26 model model = YOLO("yolo26n.pt") # Train on a custom dataset results = model.train(data="coco8.yaml", epochs=100)Performans Dengesi: YOLO26, Pareto sınırını domine etmek üzere tasarlanmıştır. Önceki nesillere kıyasla %43'e kadar daha hızlı CPU sahip olup, GPU'ların kullanılamadığı uç AI uygulamaları için güçlü bir işlemci görevi görür.
Uçtan Uca NMS: Nesne algılayıcıların dağıtımında en büyük sorunlardan biri, Maksimum Baskılama (NMS)dır.YOLO EfficientDet, NMS dayanır ve bu da son işlemleri karmaşıklaştırır ve gecikme değişkenliği yaratır. YOLO26, doğal olarak uçtan uca çalışır ve deterministik ve daha hızlı çıkarım için NMS ortadan kaldırır.
Eğitim Verimliliği ve MuSGD: YOLO26, SGD Muon'un bir karışımı olan MuSGD Optimizer'ı entegre eder. LLM eğitiminden esinlenen bu yenilik, istikrarlı bir yakınsama sağlar ve kapsamlı hiperparametre ayarlaması ihtiyacını azaltır. Eğitim sırasında daha düşük bellek gereksinimleri ile birleştiğinde, kullanıcıların, bellek gereksinimi yüksek transformatör hibritlerine kıyasla tüketici donanımında daha büyük parti boyutlarını eğitmelerine olanak tanır. RT-DETRgibi bellek gereksinimi yüksek transformatör hibritlerine kıyasla daha büyük parti boyutlarını tüketici
Çok yönlülük: EfficientDet veYOLO öncelikle sınırlayıcı kutularaYOLO , Ultralytics tek bir birleşik API içinde örnek segmentasyonu, poz tahmini, OBB ve sınıflandırma dahil olmak üzere çok çeşitli görevleri doğal olarak destekler.
Karşılaştırma Özeti
| Özellik | EfficientDet | DAMO-YOLO | Ultralytics YOLO26 |
|---|---|---|---|
| Mimari | Çapa tabanlı, BiFPN | Çapa içermeyen, RepGFPN | Uçtan uca, NMS |
| Çıkarım Hızı | Yavaş (karmaşık grafik) | Hızlı (GPU ) | SOTA (CPU GPU) |
| Dağıtım | Karmaşık (NMS ) | Orta (NMS ) | Basit (NMS) |
| Eğitim Hafızası | Yüksek | Orta Düzey | Düşük (Optimize Edilmiş) |
| Görev Desteği | Algılama | Algılama | Algıla, Böl, Poz, OBB |
Sonuç
YOLO EfficientDet, bilgisayar görme tarihine önemli katkılarda bulunmuştur. EfficientDet, bileşik ölçeklemenin gücünü gösterirken,YOLO yeniden parametreleştirme ve damıtmanın etkinliğiniYOLO . Ancak, 2026 yılında yeni projelere başlayan geliştiriciler için Ultralytics , cazip bir avantaj sunmaktadır.
NMS kaldırılması, dağıtım süreçlerini NMS , MuSGD optimizasyonu eğitimi hızlandırır ve optimize edilmiş mimarisi hem uç CPU'larda hem de güçlü GPU'larda üstün hız sağlar. Akıllı kamera sistemi veya bulut tabanlı video analiz platformu oluşturuyor olsanız da, Ultralytics sağlam ekosistemi ve performansı onu önerilen seçim Ultralytics .
Daha fazla araştırma yapmak için, YOLO26 ile YOLOv10 karşılaştırmak veya YOLO11'in avantajlarını anlamak da ilginizi çekebilir. YOLO11 'nin avantajlarını anlamak ilginizi çekebilir.