Meet YOLO26: next-gen vision AI.

Link to this sectionEfficientDet ile RTDETRv2: Nesne Algılama Mimarilerinin Derinlemesine Karşılaştırması#

Bilgisayarlı görü projelerin için en uygun mimariyi seçmek, çok çeşitli sinir ağlarından oluşan bir dünyada yol almayı gerektirir. Bu rehber, iki farklı yaklaşım arasında detaylı bir teknik karşılaştırma sunuyor: oldukça ölçeklenebilir bir Evrişimli Sinir Ağı (CNN) ailesi olan EfficientDet ve son teknoloji bir gerçek zamanlı Transformer modeli olan RTDETRv2. Yapısal farklılıklarını, eğitim metodolojilerini ve çeşitli donanım ortamlarındaki dağıtım uygunluklarını değerlendiriyoruz.

Eski verimlilik anlayışı ile modern Transformer yetenekleri arasındaki ödünleşimleri anlayarak, bilinçli kararlar alabilirsin. Ayrıca, yeni Ultralytics YOLO26 gibi modern alternatiflerin, sundukları eşsiz hız, doğruluk ve kullanım kolaylığı ile bu boşluğu nasıl kapattığını keşfedeceğiz.

Link to this sectionEfficientDet'i Anlamak#

EfficientDet, model ölçeklendirmeye ilkeli bir yaklaşım getirerek nesne algılamada devrim yarattı.

Link to this sectionMimari ve Temel Kavramlar#

EfficientDet temelinde, omurga olarak EfficientNet'i kullanır ve Bi-directional Feature Pyramid Network (BiFPN) yapısını tanıtır. BiFPN, farklı girdi özelliklerinin önemini öğrenmek için eğitilebilir ağırlıklar uygulayarak kolay ve hızlı çok ölçekli özellik füzyonuna olanak tanır. Bu, tüm omurga, özellik ağı ve kutu/sınıf tahmin ağları için çözünürlüğü, derinliği ve genişliği aynı anda tekdüze bir şekilde ölçeklendiren bir bileşik ölçeklendirme yöntemiyle birleştirilir.

Link to this sectionGüçlü ve Zayıf Yönler#

EfficientDet'in başlıca gücü, parametre verimliliğidir. Yayınlandığı tarihte, EfficientDet-D0 gibi modeller, önceki YOLO sürümlerine kıyasla daha az parametre ve FLOP ile daha yüksek doğruluk elde etmiştir. Bu durum, katı hesaplama sınırlarına sahip ortamlar için onu oldukça cazip hale getirmiştir.

Ancak EfficientDet, çakışan sınırlayıcı kutuları filtrelemek için işleme sonrası aşamada standart non-maximum suppression (NMS) yöntemine güvenir; bu da gerçek zamanlı hatlarda gecikme darboğazlarına neden olabilir. Ayrıca, eğitim süreci iyi belgelenmiş olsa da, modern araçlarda bulunan oldukça optimize edilmiş geliştirici deneyimlerine kıyasla EfficientDet'te ince ayar yapmak zahmetli olabilir.

EfficientDet hakkında daha fazla bilgi edinin

Eski Sürüm Desteği

EfficientDet ölçeklenebilir ağların yolunu açmış olsa da, bu modelleri modern NPU'larda çalıştırmak genellikle kapsamlı manuel optimizasyon gerektirir. Daha akıcı dağıtımlar için, yeni Ultralytics modelleri tek tıkla dışa aktarma işlevi sunar.

Link to this sectionRTDETRv2'yi Keşfetmek#

RTDETRv2, paradigmayı geleneksel çapa tabanlı CNN'lerden uzaklaştırarak Transformer tabanlı mimarilerin evrimini temsil eder.

Link to this sectionTransformer'lardaki Gelişmeler#

RTDETRv2, Real-Time Detection Transformer (RT-DETR) temel üzerine inşa edilmiştir. Modelin, standart evrişimlerin yerel kısıtlamaları olmaksızın karmaşık sahne bağlamlarını anlamasını sağlayan küresel dikkat mekanizmalarından yararlanır. En önemli mimari avantajı, yerel olarak NMS gerektirmeyen tasarımıdır. Nesneleri doğrudan girdi görüntüsünden tahmin ederek, NMS sonrası işlem gerektiren sezgisel ayarlamalardan kaçınır ve çıkarım hattını basitleştirir.

Link to this sectionGüçlü ve Zayıf Yönler#

RTDETRv2, geleneksel CNN'lerin çakışan nesneler nedeniyle zorlandığı yüksek yoğunluklu ortamlarda mükemmel performans gösterir. COCO gibi karmaşık kıyaslama veri kümelerinde oldukça yüksek doğruluk sunar.

Doğruluğuna rağmen, Transformer modelleri doğal olarak ciddi bellek gerektirir. Eğitim verimliliği belirgin şekilde daha düşüktür; CNN'lere kıyasla yakınsaması için önemli ölçüde daha fazla dönem ve daha yüksek CUDA bellek ayak izi gerektirir. Bu durum, kısıtlı bulut bütçeleriyle çalışan veya hızlı prototiplemeye ihtiyaç duyan geliştiriciler için RTDETRv2'yi daha az ideal hale getirir.

RTDETRv2 hakkında daha fazla bilgi edin

Transformer Bellek Kısıtlamaları

RTDETRv2 gibi Transformer modellerini eğitmek genellikle üst düzey GPU'lar gerektirir. Bellek yetersizliği (OOM) hatalarıyla karşılaşırsan, eğitim sırasında Ultralytics YOLO serisi gibi daha düşük bellek gereksinimlerine sahip modelleri kullanmayı düşün.

Link to this sectionPerformans Kıyaslama Karşılaştırması#

Ham performans metriklerini anlamak, model seçimi için hayati önem taşır. Aşağıdaki tablo, EfficientDet ve RTDETRv2'nin çeşitli boyutlardaki karşılaştırmasını göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259

Link to this sectionKullanım Durumları ve Öneriler#

EfficientDet ve RT-DETR arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

Link to this sectionNe Zaman EfficientDet Seçilmeli#

EfficientDet şu durumlar için güçlü bir tercihtir:

  • Google Cloud ve TPU İşlem Hatları: EfficientDet'in yerel optimizasyona sahip olduğu Google Cloud Vision API'leri veya TPU altyapısıyla derinlemesine entegre edilmiş sistemler.
  • Bileşik Ölçekleme Araştırmaları: Dengeli ağ derinliği, genişliği ve çözünürlük ölçeklemenin etkilerini incelemeye odaklanan akademik kıyaslamalar.
  • TFLite ile Mobil Dağıtım: Özellikle Android veya gömülü Linux cihazları için TensorFlow Lite dışa aktarımı gerektiren projeler.

Link to this sectionRT-DETR Ne Zaman Seçilmeli#

RT-DETR şunlar için önerilir:

  • Transformer Tabanlı Algılama Araştırması: NMS olmadan uçtan uca nesne algılama için dikkat mekanizmalarını ve transformer mimarilerini keşfeden projeler.
  • Esnek Gecikmeli Yüksek Doğruluklu Senaryolar: Algılama doğruluğunun en önemli öncelik olduğu ve biraz daha yüksek çıkarım gecikmesinin kabul edilebilir olduğu uygulamalar.
  • Büyük Nesne Algılama: Transformer'ların küresel dikkat mekanizmasının doğal bir avantaj sağladığı, ağırlıklı olarak orta-büyük nesnelerin olduğu sahneler.

Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#

Çoğu yeni proje için, Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Link to this sectionUltralytics Avantajı: YOLO26 ile Tanışın#

EfficientDet ve RTDETRv2 bilgisayarlı görü tarihinde yerlerini sağlamlaştırmış olsa da, modern üretim ortamları hız, doğruluk ve olağanüstü bir geliştirici deneyiminin mükemmel dengesini talep ediyor. Yakın zamanda yayınlanan Ultralytics YOLO26, bu farklı mimarilerin en iyi yönlerini bir araya getiriyor.

YOLO26, Ultralytics ekosisteminin bilinen akıcı yapısını çığır açan dahili mekanizmalarla birleştirerek öne çıkıyor.

Link to this sectionNeden Rakiplere Göre YOLO26'yı Seçmelisin?#

  • Uçtan Uca NMS-Free Tasarım: RTDETRv2 gibi Transformer'lardan ilham alan YOLO26, yerel olarak uçtan uca bir yapıdadır. NMS sonrası işlemi ortadan kaldırarak, saf Transformer'ların devasa parametre şişkinliği olmadan daha hızlı ve daha basit dağıtım hatlarını garanti eder.
  • MuSGD Optimizer: Büyük dil modeli eğitimi yeniliklerinden (Moonshot AI'ın Kimi K2'si gibi) ilham alan YOLO26, SGD ve Muon'un hibrit bir yapısını kullanır. Bu, RTDETRv2'nin gerektirdiği uzun süreli programlara kıyasla benzeri görülmemiş bir eğitim kararlılığı ve önemli ölçüde daha hızlı yakınsama oranları sağlar.
  • Edge için Optimize Edildi: %43'e kadar daha hızlı CPU çıkarımı ile YOLO26, edge AI için üretilmiştir. Cep telefonları ve akıllı kameralar gibi kısıtlı donanımlarda ağır Transformer modellerini kolayca geride bırakır.
  • DFL Kaldırılması: Distribution Focal Loss'un kaldırılması model grafiğini basitleştirerek, kesintisiz TensorRT ve ONNX dışa aktarımlarını kolaylaştırır.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, hava görüntüleri ve robotikte yaygın bir darboğazı çözen küçük nesne tanımada kayda değer iyileştirmeler sağlar.
  • Çok Yönlülük: Öncelikle algılamaya odaklanan RTDETRv2'nin aksine, YOLO26 yerel olarak örnek segmentasyonu, poz tahmini, görüntü sınıflandırma ve yönlendirilmiş sınırlayıcı kutuları (OBB) destekler; ayrıca poz için RLE ve OBB için özel açı kaybı gibi göreve özgü iyileştirmeler sunar.
Entegre Ekosistem

Ultralytics Platform sayesinde veri kümelerini yönetebilir, YOLO26 veya YOLO11 gibi modelleri bulutta eğitebilir ve esnek API'ler aracılığıyla sorunsuz bir şekilde dağıtabilirsin.

Link to this sectionUltralytics ile Kod Basitliği#

İyi korunan Ultralytics Python API, model eğitimini ve çıkarımını basitleştirir. Geliştiriciler, minimum kodla modelleri kolayca kıyaslayabilir veya eğitim komut dosyalarını başlatabilir.

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on a test image
predictions = model.predict("image.jpg")

Eski altyapıları yönetenler için, oldukça beğenilen Ultralytics YOLOv8 kararlı ve güçlü bir seçenek olmaya devam ederek Ultralytics ekosisteminin uzun vadeli güvenilirliğini sergiliyor. İster karmaşık gerçek zamanlı takip algoritmaları ister basit bir hata tespiti yürütüyor ol, YOLO26'ya yükseltme yapmak sisteminin geleceğe hazır, yüksek doğruluklu ve bellek açısından verimli olmasını sağlar.

Yorumlar