İçeriğe geç

EfficientDet ve YOLOv7: Gerçek Zamanlı Nesne Algılamanın Evrimi

Bilgisayar görüşünün görünümü, doğruluk ile hesaplama verimliliği arasında denge kurma çabasıyla şekillenmiştir. Bu evrimde iki farklı felsefe, ölçeklenebilir verimliliğe odaklanan bir model ailesi olan EfficientDet ve YOLOv7, mimari optimizasyon yoluyla gerçek zamanlı çıkarım hızına öncelik veren bir model ailesi tarafından temsil edilmektedir.

Bu karşılaştırma, bu iki etkili modelin teknik özelliklerini, mimari farklılıklarını ve performans ölçütlerini incelerken, YOLO26 gibi modern çözümlerin neden geliştiriciler için yeni standart haline geldiğini vurgulamaktadır.

EfficientDet: Ölçeklenebilir Verimlilik

2019 yılının sonlarında piyasaya sürülen EfficientDet, ölçeklendirmenin genellikle manuel veya düzensiz bir şekilde yapıldığı önceki dedektörlerdeki verimsizlikleri gidermek için tasarlanmıştır. Çözünürlük, derinlik ve genişliği aynı anda ölçeklendirmek için sistematik bir yöntem getirmiştir.

Teknik Genel Bakış

Mimari ve Temel Özellikler

EfficientDet, ağırlıklı Çift Yönlü Özellik Piramidi Ağı (BiFPN) ile backbone EfficientNet backbone kullanır. BiFPN, farklı girdi özelliklerinin çıktıya eşit olmayan katkıda bulunduğu dengesizliği düzelterek, kolay ve hızlı çok ölçekli özellik birleştirme sağlar.

Model, basit bir katsayı kullanarak backbone , BiFPN, sınıf/kutu ağı ve çözünürlüğü ölçeklendiren Bileşik Ölçeklendirme yöntemini kullanır. Bu yaklaşım, belirli bir parametre sayısı (FLOP) için yüksek doğruluk sağlarken, BiFPN katmanlarındaki karmaşık bağlantılar, bu tür düzensiz bellek erişim modelleri için özel olarak optimize edilmemiş donanımlarda daha yüksek çıkarım gecikmelerine neden olabilir.

YOLOv7: "Ücretsiz Avantajlar Paketi" Güç Merkezi

Temmuz 2022'de piyasaya sürülen YOLOv7 , YOLO You Only Look Once) ailesinde önemli bir sıçrama YOLOv7 . EfficientDet'in parametre verimliliğine odaklanmasından farklı olarak, YOLOv7 çıkarım hızına YOLOv7 ve standart GPU gerçek zamanlı nesne algılama için mümkün olan sınırları zorladı.

Teknik Genel Bakış

Mimari ve Temel Özellikler

YOLOv7 , Genişletilmiş Verimli Katman Toplama Ağı (E-ELAN) özelliğini YOLOv7 . Bu mimari, en kısa ve en uzun gradyan yollarını kontrol ederek ağın orijinal gradyan yolunu bozmadan daha çeşitli özellikleri öğrenmesini sağlar.

YOLOv7 temel kavramlarından biri YOLOv7 "eğitilebilir bag-of-freebies" YOLOv7 . Bu, tahmin maliyetini artırmadan eğitim sırasında doğruluğu artıran optimizasyon yöntemleridir. Buna, karmaşık bir eğitim yapısının dağıtım için basitleştirilmiş bir konvolüsyon setine dönüştürüldüğü model yeniden parametreleştirme gibi teknikler dahildir. Bu, eğitim sürecinin sağlam olmasını sağlarken, nihai dağıtım modelinin olağanüstü hızlı olmasını garanti eder.

YOLOv7 hakkında daha fazla bilgi edinin.

Performans Karşılaştırması

Aşağıdaki tablo, çeşitli EfficientDet ve YOLOv7 performanslarını karşılaştırmaktadır. EfficientDet modelleri (d0-d7) iyi parametre verimliliği gösterirken, standart donanımdaki gecikme süreleri, yüksek hızlı GPU için optimize edilmiş YOLOv7 göre önemli ölçüde daha yüksektir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Metrik Analizi

Veriler önemli bir ayrımı ortaya koyuyor: gecikme süresi ve FLOP'lar. EfficientDet-d7, %53,7 gibi yüksek bir mAP ulaşsa da, bunu T4 GPU 128 ms'nin üzerinde bir gecikme süresiyle gerçekleştiriyor. Buna karşılık, YOLOv7x benzer bir %53,1 mAP ulaşıyor, ancak sadece 11,57 ms'deçalışıyor, yani 10 kat daha hızlı. Otonom araçlar veya video analizi gibi gerçek dünya uygulamaları için bu hız avantajı genellikle belirleyici faktördür.

Gecikme Önemlidir

FLOP'lar (Kayan Nokta İşlemleri) karmaşıklık için iyi bir teorik ölçüt olsa da, her zaman çıkarım hızıyla doğrusal bir ilişki göstermez. BiFPN gibi mimariler, gerçek çalışma süresini yavaşlatan yüksek bellek erişim maliyetlerine sahip olabilirken, YOLO basit CNN yapıları GPU için yüksek düzeyde optimize edilmiştir.

Ultralytics'in Avantajı: Ekosistem ve Kullanılabilirlik

Bir model seçimi, genellikle ham metrikler kadar yazılım ekosistemine de bağlıdır. İşte bu noktada, Ultralytics geçiş, eski depolara kıyasla önemli avantajlar sunar.

Kolaylaştırılmış Kullanıcı Deneyimi

EfficientDet, modern sistemlere entegre edilmesi zor olabilen eski TensorFlow dayanmaktadır. PyTorch iş akışlarına entegre edilmesi zor olabilen eski TensorFlow Python dayanmaktadır. Buna karşılık, Ultralytics , model eğitimi, doğrulama ve dağıtımı basit, standartlaştırılmış görevler olarak ele alan Birleşik Python Ultralytics .

Eğitim Verimliliği ve Bellek

Ultralytics YOLO en büyük avantajlarından biri bellek gereksinimleridir. Optimize edilmiş veri yükleyiciler ve verimli mimari tasarım sayesinde, YOLO karmaşık çok dallı ağlara kıyasla eğitim sırasında genellikle daha az CUDA tüketir. Bu, geliştiricilerin daha büyük parti boyutları kullanmasına olanak tanır, bu da eğitimi stabilize eder ve yakınsamayı hızlandırır.

from ultralytics import YOLO

# Load a model (YOLOv7 or newer)
model = YOLO("yolov7.pt")

# Train the model with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Algılamanın Ötesinde Çok Yönlülük

EfficientDet öncelikle bir nesne algılayıcı olsa da, Ultralytics Örnek Segmentasyonu, Poz Tahmini ve Yönlendirilmiş Sınırlayıcı Kutular (OBB) dahil olmak üzere daha geniş bir görev yelpazesini destekler. Bu çok yönlülük, ekiplerin çeşitli bilgisayar görme zorlukları için tek bir çerçeve kullanabileceği anlamına gelir.

Yeni Standart: YOLO26

YOLOv7 , 2022 teknolojisinin zirvesini YOLOv7 de, bu alan hızla gelişmektedir. Yeni projeler için, Ocak 2026'da piyasaya sürülen YOLO26'yı öneriyoruz. Bu sürüm, önceki nesillerin güçlü yönlerini temel alırken, temel mimari değişiklikler de getiriyor.

  • Uçtan Uca NMS Tasarım: Non-Maximum Suppression (NMS) son işlem gerektiren YOLOv7 EfficientDet'ten farklı olarak, YOLO26 doğal olarak uçtan uca bir tasarımdır. Bu, gecikme darboğazlarını ortadan kaldırır ve dağıtım mantığını basitleştirir; bu, YOLOv10'da öncü bir yeniliktir. YOLOv10.
  • MuSGD Optimizer: Moonshot AI'nın Kimi K2'sinden esinlenen bu optimizer, SGD kararlılığını Muon'un SGD LLM eğitimi yeniliklerini görme görevlerine getiriyor.
  • Geliştirilmiş Kenar Performansı: Dağıtım Odak Kaybı (DFL) ve belirli optimizasyonların kaldırılmasıyla YOLO26, CPU %43'e kadar daha hızlıdır ve bu da onu Raspberry Pi veya cep telefonları gibi kenar cihazlar için EfficientDet'ten çok daha üstün kılar.
  • ProgLoss + STAL: Yeni kayıp fonksiyonları, önceki tek aşamalı dedektörlerdeki yaygın bir zayıflığı gidererek küçük nesnelerin tanınmasını önemli ölçüde iyileştirir.

YOLO26 hakkında daha fazla bilgi edinin

Gerçek Dünya Uygulamaları

Ne Zaman EfficientDet Seçmeli

EfficientDet,TensorFlow derinlemesine entegre edilmiş eski sistemler veya bileşik ölçeklendirme ile ilgili belirli akademik araştırmalar için hala geçerlidir. Daha küçük varyantları (d0-d2) da, çalışma hızından ziyade disk depolama alanı (model ağırlığı boyutu MB cinsinden) birincil kısıtlama olduğu durumlarda kullanışlıdır.

YOLOv7 Ne Zaman Tercih Edilmeli?

YOLOv7 , aşağıdakileri gerektiren mevcut üretim süreçleri için mükemmel bir YOLOv7 :

  • Video Analizi: Güvenlik veya perakende sektörüne ilişkin içgörüler için yüksek FPS akışlarını işleme.
  • Robotik: Navigasyon için düşük gecikme süresinin kritik öneme sahip olduğurobotik alanında bilgisayar görüşünün entegrasyonu.
  • Genel Algılama: Olgun, geniş destekli bir mimari gerektiren senaryolar.

YOLO26'ya Ne Zaman Geçiş Yapmalı?

YOLO26, aşağıdakileri sunarak neredeyse tüm yeni dağıtımlar için ideal seçimdir:

  • Edge Computing: IoT ve mobil uygulamalar için üstün CPU .
  • Karmaşık Görevler: Segmentasyon, poz ve OBB için yerel destek.
  • Basitleştirilmiş İşlemler: NMS tasarım, son işlem ve dışa aktarım sırasında yaşanan büyük bir sorunu ortadan kaldırarak, eğitim sırasında gördüğünüzün tam olarak dağıtımda elde edeceğiniz sonuç olmasını sağlar.

En son teknolojileri takip etmek isteyen araştırmacılar ve geliştiriciler için, YOLO26 ile Ultralytics geçiş yapmak, eğitim istikrarı, model verimliliği ve dağıtım çok yönlülüğü alanlarındaki en son gelişmelere erişim sağlar.


Yorumlar