Meet YOLO26: next-gen vision AI.

Link to this sectionEfficientDet ile DAMO-YOLO#

Ölçeklenebilir bilgisayarlı görü süreçleri oluştururken, doğru model mimarisini seçmek hem dağıtım yapılabilirliğini hem de algılama doğruluğunu etkileyen kritik bir karardır. Bu kılavuz, görsel tanıma dünyasındaki iki iyi bilinen mimari olan EfficientDet ve DAMO-YOLO arasında derinlemesine ve teknik bir karşılaştırma sunar.

Her iki model de nesne algılama alanına önemli yenilikler getirmiş olsa da, yapay zeka görüşündeki hızlı ilerleme daha entegre ekosistemlerin önünü açtı. Bu analiz boyunca, bu eski ağların temel mekanizmalarını keşfedecek ve Ultralytics Platform ve Ultralytics YOLO26 gibi modern çözümlerin neden üretim ortamları için endüstri standardı haline geldiğini açıklayacağız.

Link to this sectionEfficientDet: Ölçeklenebilir ve Verimli Nesne Algılama#

Google araştırmacıları tarafından tanıtılan EfficientDet, yüksek verimliliği korurken model mimarisini sistematik olarak ölçeklendirmek için tasarlanmıştır. Bunu, ağ derinliği, genişliği ve giriş çözünürlüğü genelinde bileşik ölçeklendirmeden yararlanarak başarmıştır.

EfficientDet Detayları: Yazarlar: Mingxing Tan, Ruoming Pang ve Quoc V. Le
Kuruluş: Google Brain
Tarih: 2019-11-20
Arxiv: 1911.09070
GitHub: google/automl

Link to this sectionMimari Yenilikler#

EfficientDet'in birincil katkısı Çift Yönlü Özellik Piramidi Ağıdır (BiFPN). Geleneksel FPN'lerin aksine BiFPN, farklı girdi özelliklerinin önemini anlamak için öğrenilebilir ağırlıklardan yararlanarak kolay ve hızlı çok ölçekli özellik füzyonuna olanak tanır. Bu, EfficientNet backbone ile birleşerek, tahmin edilebilir şekilde ölçeklenen bir model ailesi (D0'dan D7'ye kadar) oluşturur.

Link to this sectionGüçlü ve Zayıf Yönler#

EfficientDet'in temel gücü, parametre verimliliğinde yatar. Ortalama Kesinlik (mAP) değerinin kısıtlı bulut ortamlarında en üst düzeye çıkarılması gereken görevler için, bileşik ölçeklendirme yöntemi oldukça tahmin edilebilirdir. Bununla birlikte, EfficientDet'in sıfırdan eğitilmesi oldukça karmaşıktır ve genellikle önemli ölçüde hiperparametre ayarlaması gerektirir. Ayrıca, belirli TensorFlow operasyonlarına olan yoğun bağımlılığı, modern YOLO modellerinde bulunan geliştirilmiş dışa aktarma yeteneklerine kıyasla ONNX veya TensorRT aracılığıyla uç dağıtımlara geçişi daha hantal hale getirir.

EfficientDet hakkında daha fazla bilgi edin

Link to this sectionDAMO-YOLO: İş Başında Otomatik Mimari Arama#

DAMO-YOLO, gerçek zamanlı çıkarım için optimum ağ yapılarını otomatik olarak tasarlamak amacıyla Sinir Mimarisi Arama (NAS) kullanan farklı bir yaklaşımı temsil eder.

DAMO-YOLO Detayları: Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş: Alibaba Group
Tarih: 2022-11-23
Arxiv: 2211.15444v2
GitHub: tinyvision/DAMO-YOLO

Link to this sectionMimari Yenilikler#

DAMO-YOLO birkaç yeni teknoloji sunar. NAS tarafından üretilen MAE-NAS adlı bir backbone, boyun kısmı için verimli bir RepGFPN ve algılama başlığının hesaplama maliyetini önemli ölçüde azaltan bir ZeroHead tasarımı kullanır. Ayrıca, etiket ataması için AlignedOTA kullanır ve daha küçük varyantlarının performansını artırmak için büyük ölçüde bilgi damıtma iyileştirmesine güvenir.

Link to this sectionGüçlü ve Zayıf Yönler#

DAMO-YOLO, TensorRT kullanan NVIDIA mimarilerinde dağıtım için özel olarak tasarlanmış GPU çıkarım hızlarıyla öne çıkar. Ağır baş yapılarını çıkararak, model düşük gecikmeli tahminler sunar. Bunun tersine, otomatik mimari arama, model yapısını opak hale getirebilir ve özel uç cihazlar için manuel olarak hata ayıklamayı veya ince ayar yapmayı zorlaştırabilir. Son derece çok yönlü olan Ultralytics YOLO11'in aksine, DAMO-YOLO öncelikle standart bounding box algılamasına odaklanır ve poz tahmini veya yönlendirilmiş bounding box (OBB) algılama gibi gelişmiş görevler için kutudan çıktığı gibi yerel destekten yoksundur.

DAMO-YOLO hakkında daha fazla bilgi edinin

Link to this sectionPerformans Karşılaştırması#

Ampirik dengeleri anlamak, bir model seçmek için çok önemlidir. Aşağıdaki tablo, EfficientDet ailesini DAMO-YOLO serisi ile kritik performans metrikleri açısından karşılaştırır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
Verileri Analiz Etme

EfficientDet-d7 en yüksek teorik doğruluğa ulaşır ancak muazzam bir bilgi işlem gücü gerektirir, bu da onu uç yapay zeka için uygunsuz kılar. DAMO-YOLO olağanüstü TensorRT hızları sunar, ancak benzer doğruluğa ulaşmak için genellikle alt seviye EfficientDet modellerinden daha fazla parametre gerektirir.

Link to this sectionKullanım Durumları ve Öneriler#

EfficientDet ile DAMO-YOLO arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

Link to this sectionNe Zaman EfficientDet Seçilmeli#

EfficientDet şu durumlar için güçlü bir tercihtir:

  • Google Cloud ve TPU İşlem Hatları: EfficientDet'in yerel optimizasyona sahip olduğu Google Cloud Vision API'leri veya TPU altyapısıyla derinlemesine entegre edilmiş sistemler.
  • Bileşik Ölçekleme Araştırmaları: Dengeli ağ derinliği, genişliği ve çözünürlük ölçeklemenin etkilerini incelemeye odaklanan akademik kıyaslamalar.
  • TFLite ile Mobil Dağıtım: Android veya gömülü Linux cihazlar için özel olarak TensorFlow Lite dışa aktarma gerektiren projeler.

Link to this sectionNe Zaman DAMO-YOLO Seçilmeli#

DAMO-YOLO şunlar için önerilir:

  • Yüksek Verimli Video Analitiği: Toplu-1 (batch-1) veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS'li video akışlarını işleme.
  • Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite kontrol gibi, özel donanımlarda katı GPU gecikme kısıtlamaları olan senaryolar.
  • Neural Architecture Search Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametreleştirilmiş omurgaların algılama performansı üzerindeki etkilerini inceleme.

Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#

Çoğu yeni proje için, Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Link to this sectionUltralytics Avantajı: Eski Modellerin Ötesine Geçmek#

EfficientDet ve DAMO-YOLO değerli akademik bilgiler sağlasa da, modern geliştiriciler en son performans ile geliştirici ergonomisini dengeleyen çerçevelere ihtiyaç duyarlar. Ultralytics ekosisteminin mükemmel olduğu nokta burasıdır.

Link to this sectionBenzersiz Kullanım Kolaylığı ve Ekosistem#

Ayrı, ağır özelleştirilmiş araştırma depolarından modeller dağıtmak genellikle entegrasyon kabuslarına yol açar. Ultralytics, kapsamlı belgeler ve pythonik bir API ile birleşik, derinlemesine iyi bakılan bir ekosistem sağlar. Eğitim için Google Colab kullanıyor olsan da veya mobil çıkarım için CoreML formatına dışa aktarıyor olsan da, süreç sadece birkaç satır kod gerektirir.

from ultralytics import YOLO

# Load the highly recommended YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model effortlessly on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Export the trained model to ONNX for production
model.export(format="onnx")

Link to this sectionYOLO26 Devrimi#

EfficientDet veya DAMO-YOLO'yu değerlendiren geliştiriciler için, Ultralytics YOLO26 nihai evrimsel adımı temsil eder. 2026'nın başlarında piyasaya sürülen model, paradigma değiştiren yetenekler sunar:

  • Uçtan Uca NMS'siz Tasarım: İlk olarak YOLOv10 tarafından öncülük edilen YOLO26, Non-Maximum Suppression (NMS) sonrası işleme ihtiyacını yerel olarak ortadan kaldırır. Bu, çok daha basit dağıtım mimarileri ve farklı donanımlarda tutarlı gecikme süreleri anlamına gelir.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Ağır GPU'lardan yoksun uç dağıtımlar için (DAMO-YOLO'nun zorlandığı senaryolar), YOLO26 ağır bir şekilde optimize edilmiştir ve standart CPU'larda muazzam hız artışları sağlar.
  • MuSGD Optimize Edici: LLM yenilikleri ile bilgisayarlı görü arasındaki boşluğu dolduran YOLO26, inanılmaz derecede kararlı eğitim ve EfficientDet'in kırılgan eğitim döngülerine kıyasla hızlı yakınsama sağlayan (Moonshot AI'dan ilham alan) MuSGD optimize ediciyi bünyesinde barındırır.
  • DFL Kaldırma: Distribution Focal Loss'un kaldırılması, dışa aktarma sürecini basitleştirir ve düşük güçlü mikro denetleyiciler ve Raspberry Pi cihazlarıyla üstün uyumluluğu garanti eder.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, eski mimarilerin geleneksel olarak başarısız olduğu bir alan olan küçük nesne tanımada çarpıcı iyileştirmeler sağlar.

Link to this sectionBellek Verimliliği ve Görev Çok Yönlülüğü#

transformer modellerinden veya yoğun şekilde birleştirilmiş NAS ağlarından farklı olarak, Ultralytics modelleri katı bellek verimlilikleri ile karakterize edilirler. Eğitim sırasında belirgin şekilde daha düşük CUDA belleği tüketirler, bu da tüketici sınıfı donanımlarda hızlı yinelemeye olanak tanır.

Ayrıca, EfficientDet ve DAMO-YOLO katı bir şekilde bounding box ile kısıtlıyken, Ultralytics aynı sezgisel çerçeve içinde yerel olarak örnek segmentasyon ve görüntü sınıflandırmayı destekler. Eski projeleri sürdüren kullanıcılar için Ultralytics YOLOv8, keşfedilmeye değer, kaya gibi sağlam ve yaygın olarak dağıtılan bir alternatif olmaya devam etmektedir.

Link to this sectionSonuç#

Doğru vizyon mimarisini seçmek, teorik performans ile dağıtım gerçekliğini tartmayı içerir. EfficientDet matematiksel olarak zarif bir ölçeklendirme yaklaşımı sunar ve DAMO-YOLO zorlayıcı ham GPU hızları sağlar. Ancak, hızlı geliştirmeye, güvenilir dağıtımlara ve en son özelliklere öncelik veren ekipler için Ultralytics modelleri açıkça öndedir. NMS'siz çıkarım ve MuSGD optimizasyonu gibi yenilikleri birleştiren YOLO26, bilgisayarlı görü projelerinin bugün mevcut olan en yetenekli, sürdürülebilir ve verimli temel üzerine inşa edilmesini sağlar.

Katkıda Bulunanlar

Yorumlar