İçeriğe geç

EfficientDet ve YOLOv10: Gerçek Zamanlı Nesne Algılamanın Evrimi

Bilgisayar görüşünün manzarası, Google 2019'da EfficientDet'i ve Tsinghua Üniversitesi'nin YOLOv10 piyasaya sürmesi arasında önemli ölçüde değişti. Geliştiriciler ve araştırmacılar için, karmaşık bileşik ölçeklemeden basitleştirilmiş, uçtan uca mimarilere geçiş sürecini anlamak, iş için doğru aracı seçmek açısından hayati önem taşıyor. Bu analiz, EfficientDet'in eski hassasiyetini, düşük gecikmeli yenilik olan YOLOv10'nin düşük gecikmeli yenilikçiliğiyle karşılaştırırken, Ultralytics gibi modern çözümlerin üretim ortamları için nasıl yeni standartlar belirlediğini vurgulamaktadır.

EfficientDet: Bileşik Ölçeklendirmenin Mirası

Google ekibi tarafından piyasaya sürülen EfficientDet, sinir ağının verimliliğini optimize etmede önemli bir dönüm noktası oldu. Tek bir boyutu ayarlamak yerine, ağ backbone çözünürlüğünü, derinliğini ve genişliğini eşit şekilde ölçeklendiren Bileşik Ölçeklendirme kavramını ortaya attı.

EfficientDet Teknik Detaylar:

EfficientDet'in merkezinde, Çift Yönlü Özellik Piramit Ağı (BiFPN) yer almaktadır. Farklı ölçeklerden özellikleri toplayan geleneksel FPN'lerden farklı olarak, BiFPN karmaşık, ağırlıklı özellik birleştirmesine olanak tanır ve modelin farklı girdi özelliklerinin önemini öğrenmesini sağlar. Bu mimari, o dönemde COCO en gelişmiş ortalama hassasiyet (mAP) değerine ulaşmış olsa da, BiFPN katmanlarının karmaşık bağlantıları önemli bir hesaplama yükü oluşturarak, özellikle uç cihazlarda, modern mimarilere kıyasla daha yavaş bir çıkarım süreci ortaya çıkarmaktadır.

YOLOv10: Uçtan Uca Devrim

Tsinghua Üniversitesi araştırmacıları tarafından geliştirilen YOLOv10, önceki YOLO temel darboğazını ele alıyor: Non-Maximum Suppression (NMS). Eğitim sırasında tutarlı bir çift atama stratejisi kullanarak, YOLOv10 her nesne için tek bir optimal sınırlayıcı kutu tahmin etmeyi YOLOv10 ve böylece NMS, uçtan uca bir dedektör haline geliyor.

YOLOv10 Detaylar:

Bu mimari değişiklik, önemli ölçüde daha düşük çıkarım gecikmesi sağlar. Model ayrıca, eski modellerde görülen parametre şişkinliği olmadan performansı iyileştirmek için büyük çekirdekli konvolüsyonlar ve kısmi öz dikkat kullanarak bütünsel bir verimlilik-doğruluk odaklı tasarım sunar.

YOLOv10 hakkında daha fazla bilgi edinin.

Performans Karşılaştırması: Hız - Doğruluk

Bu iki nesil model arasındaki performans farkı, özellikle çıkarım hızı açısından oldukça belirgindir. EfficientDet-d7 yüksek doğruluk sağlarken, bunu büyük bir gecikme (100 ms'nin üzerinde) pahasına yapmaktadır. YOLOv10 ise tek haneli milisaniye aralıklarında benzer veya daha iyi doğruluk elde etmektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Mimari Analiz

  1. Son İşleme: EfficientDet, üst üste binen kutuları filtrelemek NMS büyük ölçüde NMS dayanır. Yoğun sahnelerde, bu son işleme adımı CPU haline gelir ve GPU bağımsız olarak toplam gecikmeyi artırır. YOLOv10 NMS tasarımı, bu adımı tamamen ortadan kaldırır.
  2. Bellek Kullanımı: EfficientDet, özellikle d7 gibi daha yüksek ölçeklemeler, BiFPN yapısı nedeniyle önemli miktarda VRAM tüketir. YOLOv10 , daha düşük bellek ayak izi için optimize YOLOv10 , bu da onu kenar AI uygulamaları için daha uygun hale getirir.
  3. Optimizasyon: EfficientDet, TensorFlow üzerine kuruludur TensorFlow ONNX TensorRT gibi formatlara aktarılması karmaşık PyTorch

Ultralytics Ekosisteminin Avantajı

YOLOv10 etkileyici mimari gelişmeler YOLOv10 , Ultralytics kullanılması onun faydalarını daha da artırıyor. Geliştiriciler genellikle akademik depoların parçalanmışlığıyla mücadele ediyor. Ultralytics , modelleri tek bir, iyi bakımlı Python altında birleştirerek bu sorunu Ultralytics .

Neden Ultralytics Seçmelisiniz?

  • Kullanım Kolaylığı: Tek bir kod satırı ile YOLOv8, YOLOv10, YOLO11 ve YOLO26 arasında geçiş yapın.
  • Eğitim Verimliliği: Önceden ayarlanmış hiperparametreler ve otomatik parti boyutu yönetimi, kaynakların en uygun şekilde kullanılmasını sağlar.
  • Dağıtım için hazır: TFLite, CoreML, OpenVINO ve ONNX tek tıklamayla dışa aktarma.
  • Ultralytics : Ultralytics aracılığıyla veri kümelerini sorunsuz bir şekilde yönetin, bulutta eğitim verin ve modelleri dağıtın.

Kod Örneği

Ultralytics ile çıkarım çalıştırmak, Python tarzında ve basit olacak şekilde Ultralytics . YOLOv10 yükleyip tahmin çalıştırmak için aşağıdaki adımları izleyin:

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Run inference on an image from the internet
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Üretim Önerisi: YOLO26'ya yükseltin

EfficientDet önemli bir tarihsel referans noktası olarak hizmet ederken, YOLOv10 NMS paradigmayı YOLOv10 . Ultralytics modeli, üretim kullanımında bu evrimin zirvesini temsil etmektedir.

2026 yılının Ocak ayında piyasaya sürülen YOLO26, YOLOv10 NMS çığır açan özelliğini temel alır, YOLOv10 gerçek dünya koşullarında sağlamlık açısından daha da geliştirilmiştir. Dağıtım Odak Kaybı (DFL) kaldırma özelliği sayesinde model grafiği basitleştirilerek daha kolay dışa aktarım ve düşük güç tüketen uç cihazlarla daha iyi uyumluluk sağlanır.

Ayrıca, YOLO26, SGD Muon'un (LLM eğitim yeniliklerinden esinlenerek) bir karışımı olan MuSGD optimizer'ı içermekte olup, daha hızlı yakınsama ve istikrarlı eğitim sağlar. ProgLoss ve STAL (Shape-aware Task Alignment Loss) gibi optimizasyonlarla YOLO26, üstün küçük nesne algılama özelliği sunar ve önceki nesillere göre CPU %43'e kadar daha hızlıdır.

YOLO26 hakkında daha fazla bilgi edinin

Gerçek Dünya Kullanım Durumları

Doğru modeli seçmek, özel kısıtlamalarınıza bağlıdır:

  • EfficientDet: Bileşik ölçeklendirme veya BiFPN mimarilerini incelemek gereken akademik araştırmalar için en uygun seçenektir. Ayrıca, geçiş maliyetinin yeni modellerin performans avantajlarından daha ağır bastığı eski sistemlerde de kullanılır.
  • YOLOv10 YOLO26: İdeal seçim gerçek zamanlı uygulamalar.
    • Robotik: NMS tasarım, navigasyon ve engellerden kaçınma için kritik öneme sahip gecikme dalgalanmasını azaltır.
    • Trafik İzleme: Yüksek verimlilik, nesne izleme özelliği GPU tek bir GPU üzerinde birden fazla video akışının işlenmesini sağlar.
    • Mobil Uygulamalar: Daha düşük parametre sayısı ve bellek kullanımı, bu modelleri iOS Android kullanıma mükemmel hale getirir.

Hız, doğruluk ve dağıtım kolaylığı arasında en iyi dengeyi arayan geliştiriciler için, Ultralytics veya YOLO11 'e geçiş yapmak önerilen yoldur.


Yorumlar