İçeriğe geç

DAMO-YOLO ve YOLOv5: Gerçek Zamanlı Nesne Tespitine Derinlemesine Bir Bakış

Bilgisayar görüşünün evrimi, gerçek zamanlı nesne tespitindeki sürekli yeniliklerle damgasını vurmuştur. Günümüzde geliştiriciler ve araştırmacılar, görüş işlem hatları tasarlarken sayısız mimari seçenekle karşı karşıyadır. Bu kapsamlı teknik karşılaştırma, DAMO-YOLO ve Ultralytics YOLOv5 arasındaki nüansları, ilgili mimarilerini, eğitim metodolojilerini, performans metriklerini ve ideal dağıtım senaryolarını vurgulayarak inceler.

DAMO-YOLO'ya Giriş

Alibaba Group tarafından piyasaya sürülen DAMO-YOLO, tespit hızı ve doğruluğunun sınırlarını zorlamayı amaçlayan çeşitli yeni teknikler tanıttı.

DAMO-YOLO hakkında daha fazla bilgi edinin

Mimari Yenilikler

DAMO-YOLO, Sinirsel Mimari Arama (NAS) temeli üzerine inşa edilmiştir. Yazarlar, gecikme ve doğruluğu dengeleyen backbone'ları otomatik olarak tasarlamak için MAE-NAS kullandılar. Model, farklı ölçeklerde özellik füzyonunu iyileştiren verimli bir RepGFPN (Yeniden Parametrelendirilmiş Genelleştirilmiş Özellik Piramit Ağı) sunar. Ayrıca, DAMO-YOLO, çıkarım sırasında yeniden parametrelendirmeye büyük ölçüde dayanan daha basit, daha verimli bir yapı lehine karmaşık çok dallı tahmin başlıklarını ortadan kaldıran bir "ZeroHead" tasarımı içerir.

Eğitimi iyileştirmek için model, etiket ataması için AlignedOTA'yı ve daha büyük bir "öğretmen" modelinin daha küçük "öğrenci" modelini daha yüksek doğruluk elde etmesi için yönlendirdiği yoğun bir damıtma geliştirme sürecini kullanır.

Ultralytics YOLOv5'e Giriş

Ultralytics YOLOv5, kararlılığı, kullanım kolaylığı ve kapsamlı dağıtım ekosistemiyle tanınan, dünyada en yaygın olarak benimsenen görüş mimarilerinden biridir.

YOLOv5 hakkında daha fazla bilgi edinin.

Ekosistem Standardı

YOLOv5, kullanılabilirlik için endüstri standardını yeniden tanımladı. Natif olarak PyTorch içinde inşa edilen bu model, sağlam özellik toplama için yüksek düzeyde optimize edilmiş bir CSPNet backbone ve bir PANet boyun kullanır. Daha sonraki modellerde görülen anchor-free trendinden önce gelmesine rağmen, otomatik anchor öğrenimiyle birleşen yüksek düzeyde rafine edilmiş anchor tabanlı yaklaşımı, kutudan çıktığı gibi mükemmel performans sağlar.

YOLOv5'in gerçek gücü, İyi Yönetilen Ekosisteminde yatmaktadır. Comet ve Weights & Biases gibi izleme araçlarıyla sorunsuz bir şekilde entegre olur ve ONNX, TensorRT ve CoreML gibi formatlara tek tıklamayla dışa aktarımı destekler.

YOLOv5 ile Başlarken

YOLOv5, özel veri kümeleri üzerinde eğitilmesi inanılmaz derecede kolaydır. Akıcı API, prototipten üretime geçişteki sürtünmeyi azaltarak çevik mühendislik ekipleri arasında favori olmasını sağlar.

Performans ve Metrik Karşılaştırması

Bu modelleri karşılaştırırken, ortalama Hassasiyet (mAP), çıkarım hızı ve parametre sayısı dengesine bakmak çok önemlidir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Ödünleşimleri Analiz Etme

DAMO-YOLO, parametre boyutlarına göre etkileyici mAP skorları elde eder ve damıtma eğitim aşamasından büyük ölçüde faydalanır. Ancak bu, Eğitim Verimliliği maliyetiyle gelir. Çok aşamalı damıtma süreci, önce ağır bir öğretmen modelinin eğitilmesini gerektirir, bu da gerekli GPU hesaplama süresini ve VRAM'i önemli ölçüde artırır.

Tersine, YOLOv5 mükemmel Bellek Gereksinimleri sunar. Ultralytics YOLO modelleri, karmaşık damıtma işlem hatlarına veya RT-DETR gibi transformatör tabanlı modellere kıyasla hem eğitim hem de çıkarım sırasında daha düşük bellek kullanımıyla bilinir. Bu, YOLOv5'in tüketici sınıfı donanımlarda veya Google Colab gibi erişilebilir bulut ortamlarında verimli bir şekilde eğitilmesine olanak tanır.

Gerçek Dünya Uygulamaları ve Çok Yönlülük

Doğru mimariyi seçmek genellikle dağıtım ortamına bağlıdır.

DAMO-YOLO'nun Mükemmel Olduğu Yerler

DAMO-YOLO, kesinlikle bir nesne tespit modelidir. Akademik araştırmalar için, özellikle Sinirsel Mimari Arama üzerinde çalışan veya makalede detaylandırılan yeniden parametrelendirme tekniklerini yeniden üretmeyi amaçlayan ekipler için mükemmel bir seçimdir. Bir projenin damıtma eğitim aşamasını yürütmek için kapsamlı hesaplama kaynakları varsa ve yalnızca 2D sınırlayıcı kutular için doğruluğun son kısmını sıkmaya odaklanmışsa, DAMO-YOLO güçlü bir rakiptir.

Ultralytics'in Avantajı

Gerçek dünya üretimi için, Ultralytics modellerinin Kullanım Kolaylığı ve Çok Yönlülüğü onları tercih edilen seçenek haline getirir. YOLOv5 tespit ve görüntü sınıflandırma için temel bir model olmaya devam ederken, daha geniş Ultralytics ekosistemi geliştiricilerin görevler arasında zahmetsizce geçiş yapmasına olanak tanır.

Örneğin, Ultralytics ailesindeki daha yeni iterasyonlar, yerel olarak örnek segmentasyon, poz tahmini ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) tespitini destekler. Bu çok görevli yetenek, ekiplerin otomatik plaka tanıma ile araç segmentasyonunu birleştirmek gibi karmaşık işlem hatları için tek, birleşik bir Python API'si kullanabilmesini sağlar.

Kullanım Durumları ve Öneriler

DAMO-YOLO ve YOLOv5 arasında seçim yapmak, projenizin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerinize bağlıdır.

Ne Zaman DAMO-YOLO Seçmeli

DAMO-YOLO şunlar için güçlü bir seçimdir:

  • Yüksek Verimli Video Analizi: Batch-1 veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS video akışlarını işleme.
  • Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite denetimi gibi özel donanımlarda katı GPU gecikme kısıtlamaları olan senaryolar.
  • Sinirsel Mimari Arama Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametrelendirilmiş backboneların algılama performansı üzerindeki etkilerini inceleme.

YOLOv5 Ne Zaman Tercih Edilmeli?

YOLOv5, aşağıdaki durumlar için önerilir:

  • Kanıtlanmış Üretim Sistemleri: YOLOv5'in uzun süreli istikrar geçmişinin, kapsamlı dokümantasyonunun ve büyük topluluk desteğinin değerli olduğu mevcut dağıtımlar.
  • Kaynak Kısıtlı Eğitim: Sınırlı GPU kaynaklarına sahip ortamlarda, YOLOv5'in verimli eğitim hattının ve daha düşük bellek gereksinimlerinin avantaj sağladığı durumlar.
  • Kapsamlı Dışa Aktarma Formatı Desteği: ONNX, TensorRT, CoreML ve TFLite dahil olmak üzere birçok formatta dağıtım gerektiren projeler.

Ultralytics (YOLO26) Ne Zaman Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Gelecek: YOLO26'ya Geçiş

YOLOv5 efsanevi olsa ve DAMO-YOLO ilginç akademik içgörüler sunsa da, en son teknoloji gelişti. Ocak 2026'da piyasaya sürülen Ultralytics YOLO26, görüş topluluğu için büyük bir ilerlemeyi temsil ediyor.

YOLO26 hakkında daha fazla bilgi edinin

YOLO26, kenar dağıtımının ve eğitim kararsızlığının geleneksel darboğazlarını ele alıyor:

  • Uçtan Uca NMS-Free Tasarım: YOLO26, Non-Maximum Suppression (NMS) son işlemeyi doğal olarak ortadan kaldırır. Bu çığır açan gelişme, dağıtım mantığını basitleştirir ve gecikme değişkenliğini önemli ölçüde azaltarak, yüksek hızlı robotik ve otonom sistemler için ideal hale getirir.
  • MuSGD Optimizatörü: LLM eğitim yeniliklerinden (Moonshot AI'nin Kimi K2'si gibi) ilham alan YOLO26, MuSGD optimizatörünü (SGD ve Muon'un bir hibriti) kullanır. Bu, son derece kararlı eğitim süreçleri ve dikkat çekici derecede daha hızlı yakınsama sağlar.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Dağıtım Odak Kaybını (DFL) stratejik olarak kaldırarak, YOLO26, YOLO11 ve YOLOv8 gibi seleflerine kıyasla CPU'larda ve kenar cihazlarda çok daha üstün hızlar elde eder.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, hava drone görüntülerini ve IoT sensör beslemelerini analiz etmek için kritik olan küçük nesne tanımada önemli iyileştirmeler sağlar.

Kod Örneği: Uygulamada Basitlik

Ultralytics paketi, modelleri yalnızca birkaç satır kodla eğitmenize ve dağıtmanıza olanak tanır. İster YOLOv5 kullanıyor olun ister önerilen YOLO26'ya yükseltme yapıyor olun, arayüz tutarlı ve sezgisel kalır.

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 small model
model = YOLO("yolo26s.pt")

# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

# Export the model for edge deployment
model.export(format="onnx")

Sonuç

Hem DAMO-YOLO hem de YOLOv5, bilgisayar görüşü alanına önemli katkılarda bulunmuştur. DAMO-YOLO, Sinirsel Mimari Arama (Neural Architecture Search) ve damıtmanın gücünü sergileyerek araştırmacılar için ilgi çekici bir çalışma haline gelmektedir. Ancak, YOLOv5, Performans Dengesi, düşük bellek gereksinimleri ve benzersiz kullanım kolaylığı sayesinde pratik bir güç merkezi olmaya devam etmektedir.

Bugün yeni projelere başlayan geliştiriciler için öneri, Ultralytics Platformu'ndan yararlanmak ve YOLO26'yı benimsemektir. YOLOv5'in sevilen kullanıcı dostu ekosistemini çığır açan mimari gelişmelerle birleştirerek, hem bulut hem de uç yapay zeka uygulamaları için üst düzey doğruluk ve ışık hızında çıkarım sağlar. Geliştiriciler, belirli eski donanım kısıtlamalarına bağlı olarak YOLOv6 veya YOLOX gibi diğer verimli modelleri de keşfetmek isteyebilirler.


Yorumlar