Link to this sectionYOLOv9 ile DAMO-YOLO karşılaştırması#
Bilgisayarlı görüdeki hızlı gelişim, farklı dağıtım kısıtlamalarına ve doğruluk gereksinimlerine göre uyarlanmış bir dizi güçlü mimariyi ortaya çıkardı. Bu alandaki iki önemli giriş, bilgi darboğazlarını sağlam bir şekilde ele almasıyla övülen YOLOv9 ve yoğun bir şekilde Sinirsel Mimari Arama (NAS) ile verimli özellik piramitlerine odaklanan DAMO-YOLO'dur.
Bu kılavuz, YOLOv9 ve DAMO-YOLO'nun derinlemesine, teknik bir karşılaştırmasını sunarak mimari farklılıklarını, eğitim metodolojilerini ve ideal dağıtım senaryolarını öne çıkarıyor. Ayrıca Ultralytics ekosisteminin geliştirmeden üretime nasıl kesintisiz bir yol sağladığını ve YOLO26 gibi modern modellerin neden yeni projeler için önerilen standart haline geldiğini inceleyeceğiz.
Link to this sectionMimari Derinlemesine İnceleme#
Her bir modele güç veren temel mekanizmaları anlamak, bunların çeşitli metrikler genelinde neden farklı performans gösterdiklerini ortaya koyar.
Link to this sectionYOLOv9: Programlanabilir Gradyan Bilgisi#
YOLOv9, derin sinir ağlarında veriler ilerledikçe oluşan bilgi kaybını doğrudan ele almak için tasarlandı.
Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
Kurum: Institute of Information Science, Academia Sinica, Tayvan
Tarih: 21 Şubat 2024
Bağlantılar: Arxiv, GitHub, Dokümanlar
YOLOv9 hakkında daha fazla bilgi edin
YOLOv9, Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN) kavramlarını tanıtır. PGI, hayati uzamsal ve anlamsal bilgilerin ileri besleme sürecinde korunmasını sağlayarak ağırlık güncellemeleri için kullanılan gradyanların bozulmasını önler. GELAN, bunu parametre verimliliğini maksimize ederek tamamlar ve modelin birçok geleneksel CNN'den daha az FLOP ile en gelişmiş ortalama Hassasiyet (mAP) değerine ulaşmasını sağlar.
Link to this sectionDAMO-YOLO: NAS Destekli Verimlilik#
Alibaba Group tarafından geliştirilen DAMO-YOLO, hız ve doğruluk arasındaki optimum dengeyi bulmak için otomatik mimari aramasından yararlanarak farklı bir yaklaşım benimser.
Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kurum: Alibaba Group
Tarih: 23 Kasım 2022
Bağlantılar: Arxiv, GitHub
DAMO-YOLO hakkında daha fazla bilgi edinin
DAMO-YOLO, verimli ağ yapılarını otomatik olarak oluşturmak için bir MAE-NAS (Sinirsel Mimari Arama için Maskelenmiş Otomatik Kodlayıcılar) omurgasına dayanır. Sağlam özellik füzyonu için bir RepGFPN (Yeniden Parametrelendirilmiş Genelleştirilmiş Özellik Piramit Ağı) ve algılama başlığının hesaplama yükünü en aza indirmek için "ZeroHead" tasarımı kullanır. Ayrıca, etiket ataması için AlignedOTA'yı ve daha küçük varyantlarının performansını artırmak için bilgi damıtmayı bünyesinde barındırır.
Sinirsel Mimari Arama (NAS), yapay sinir ağlarının tasarımını otomatikleştirir. DAMO-YOLO gibi oldukça verimli modeller üretebilse de, mimari uzayını aramak genellikle devasa hesaplama kaynakları gerektirir; bu durum, YOLOv9 gibi modellerin daha deterministik tasarım felsefesiyle tezat oluşturur.
Link to this sectionPerformans ve Metrik Karşılaştırması#
Bir nesne algılama modeli seçerken doğruluk, hız ve hesaplama ayak izini dengelemek kritik öneme sahiptir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Link to this sectionAnaliz#
- Doğruluk ve Parametreler: YOLOv9 genel olarak üstün bir parametre-doğruluk oranı sergiler. Örneğin, YOLOv9c 25.3M parametre ile %53.0 mAP elde ederken, DAMO-YOLOl %50.8 mAP elde eder ancak önemli ölçüde daha fazla parametre (42.1M) gerektirir.
- Çıkarım Hızı: DAMO-YOLO'nun mimarisi, T4 GPU'larda rekabetçi TensorRT çıkarım hızları sağlar ve orta seviyelerde YOLOv9'u biraz geride bırakır. Bununla birlikte, YOLOv9'un FLOP ve parametre sayısındaki verimliliği, olağanüstü bir GPU bellek verimliliğine dönüşür.
- Bellek Gereksinimleri: YOLOv9 dahil Ultralytics YOLO modelleri, karmaşık NAS üretimi modellere veya ağır Transformer mimarilerine kıyasla eğitim ve çıkarım sırasında genellikle daha düşük bellek kullanımı sergiler, bu da onları kısıtlı uç donanımlarda dağıtım için oldukça erişilebilir kılar.
Link to this sectionUltralytics Ekosistemi Avantajı#
Teorik metrikler önemli olsa da, pratik uygulama bir projenin başarısını büyük ölçüde belirler. İşte Ultralytics Platformu ve kapsamlı yazılım ekosisteminin, DAMO-YOLO gibi bağımsız depolardan daha parlak olduğu nokta burasıdır.
Link to this sectionKullanım Kolaylığı ve Eğitim Verimliliği#
Özel bir YOLOv9 modeli eğitmek minimum hazır kod (boilerplate) gerektirir. Ultralytics Python API; veri artırma, dağıtık eğitim ve donanım optimizasyonu gibi karmaşık süreçleri soyutlar.
from ultralytics import YOLO
# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")
# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate model performance
metrics = model.val()
# Export for production deployment
model.export(format="onnx")Buna karşılık, DAMO-YOLO kullanmak genellikle kendi benzersiz eğitim hattına özgü katı yapılandırma dosyaları ve karmaşık bağımlılık zincirleri arasında gezinmeyi gerektirir, bu da daha dik bir öğrenme eğrisiyle sonuçlanır.
Link to this sectionGörevler Arasında Çok Yönlülük#
Ultralytics modellerinin bir alametifarikası, doğuştan gelen çok yönlülükleridir. Standart sınırlayıcı kutu (bounding box) algılamasının ötesinde, Ultralytics çerçevesi Örnek Bölütleme, Poz Tahmini, Görüntü Sınıflandırma ve Yönlendirilmiş Sınırlayıcı Kutu (OBB) algılama gibi görevleri sorunsuz bir şekilde destekler. DAMO-YOLO ise kesinlikle 2D nesne algılama için optimize edilmiştir ve diğer görsel paradigmalara uyarlanması önemli ölçüde yeniden mühendislik gerektirir.
Ultralytics simplifies the deployment pipeline by offering one-click model export to formats like TensorRT, OpenVINO, and CoreML, ensuring maximum performance regardless of your target hardware.
Link to this sectionKullanım Durumları ve Öneriler#
YOLOv9 ile DAMO-YOLO arasında seçim yapmak; projenin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
Link to this sectionNe Zaman YOLOv9 Seçilmeli#
YOLOv9 şunlar için güçlü bir seçimdir:
- Bilgi Darboğazı Araştırması: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN) mimarilerini inceleyen akademik projeler.
- Gradyan Akışı Optimizasyonu Çalışmaları: Eğitim sırasında derin ağ katmanlarındaki bilgi kaybını anlamaya ve azaltmaya odaklanan araştırmalar.
- Yüksek Doğrulukta Algılama Kıyaslaması: YOLOv9'un güçlü COCO karşılaştırma performansının mimari karşılaştırmalar için referans noktası olarak gerektiği senaryolar.
Link to this sectionNe Zaman DAMO-YOLO Seçilmeli#
DAMO-YOLO şunlar için önerilir:
- Yüksek Verimli Video Analitiği: Toplu-1 (batch-1) veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS'li video akışlarını işleme.
- Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite kontrol gibi, özel donanımlarda katı GPU gecikme kısıtlamaları olan senaryolar.
- Neural Architecture Search Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametreleştirilmiş omurgaların algılama performansı üzerindeki etkilerini inceleme.
Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#
Çoğu yeni proje için, Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Link to this sectionGelecek: YOLO26'ya Geçiş#
YOLOv9 ve DAMO-YOLO güçlü tarihi dönüm noktalarını temsil etse de, modern bilgisayarlı görü, yerel olarak uçtan uca mimarilere yöneldi. Her türlü yeni geliştirme için önerilen standart YOLO26'dır.
2026'da piyasaya sürülen YOLO26, seleflerinin başarılarının üzerine inşa edilerek hem doğruluk hem de dağıtım basitliğinde bir sıçrama sunuyor.
Link to this sectionTemel YOLO26 Yenilikleri#
- Uçtan Uca NMS-Süz Tasarım: YOLO26, Maksimum Olmayan Baskılama (NMS) sonrası işlemeyi tamamen ortadan kaldırır. Bu, YOLOv10 içinde ilk kez öncülük edilen bir buluş olan, yerel olarak uçtan uca çalışan modern bir dağıtım hattı oluşturur.
- DFL Kaldırma: Basitleştirilmiş dışa aktarma ve daha iyi uç/düşük güçlü cihaz uyumluluğu için Dağılım Odaklı Kayıp (Distribution Focal Loss) kaldırıldı.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Karmaşık son işlemlerin kaldırılarak temel evrişimlerin optimize edilmesiyle, YOLO26 özel GPU'lardan yoksun uç bilişim senaryoları için benzersiz bir şekilde uygundur.
- MuSGD Optimize Edici: LLM eğitim yeniliklerinden ilham alan YOLO26, daha istikrarlı eğitim süreçleri ve belirgin şekilde daha hızlı yakınsama süreleri garanti etmek için SGD ve Muon'un (MuSGD) bir hibritini kullanır.
- ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, küçük nesne tanımada dikkate değer iyileştirmeler sağlayarak YOLO26'yı yüksek irtifa hava görüntüleri ve IoT cihazları için ideal kılar.
Bir sonraki projen için şu anda YOLO11 veya YOLOv8 araştırıyorsan, YOLO26'ya yükseltme yapmak, bugün mevcut olan en optimize edilmiş, en gelişmiş görü yapay zeka çerçevesini kullandığından emin olmanı sağlar.
Link to this sectionÖzet#
Doğru modeli seçmek, özel operasyonel kısıtlamalarına bağlıdır:
- DAMO-YOLO, RepGFPN mimarisinin parladığı çok özel donanım profilleri için rekabetçi hızlar sağlayarak, NAS destekli optimizasyona büyüleyici bir bakış sunar.
- YOLOv9, derin ağlardaki bilgi kaybını önlemek için PGI mimarisinden yararlanarak ince taneli görsel detayları korumaya odaklanan araştırmacılar için mükemmel bir seçimdir.
- Ultralytics YOLO26, modern kurumsal ve araştırma uygulamaları için kesin seçim olarak duruyor. Benzersiz kullanım kolaylığı, NMS'siz mimarisi ve en ileri MuSGD eğitim optimizasyonları, onu bilgisayarlı görü ortamındaki en güvenilir, doğru ve kolayca dağıtılabilir model haline getiriyor.