Link to this sectionDAMO-YOLO ile YOLOv9 karşılaştırması#
Gerçek zamanlı nesne algılama dünyası baş döndürücü bir hızla evrimleşmeye devam ediyor. Mühendislik ekipleri ve araştırmacılar doğruluk, çıkarım hızı ve hesaplama verimliliği arasında mükemmel dengeyi yakalamaya çalışırken, araştırma topluluğundan iki önemli mimari ortaya çıktı: DAMO-YOLO ve YOLOv9. Her iki model de bilgisayarlı görü alanında mümkün olanın sınırlarını zorlamayı amaçlayan önemli mimari yenilikler sunuyor.
Bu detaylı teknik kılavuz, bu iki modelin derinlemesine bir analizini sunarak benzersiz mimari yaklaşımlarını, eğitim metodolojilerini ve gerçek dünya dağıtım yeteneklerini karşılaştırıyor. Ayrıca, modern yapay zeka geliştirmede geniş yazılım ekosisteminin nasıl kritik bir rol oynadığını inceleyecek ve Ultralytics Platform ile yeni nesil YOLO26 gibi modellerin sunduğu avantajları vurgulayacağız.
Link to this sectionYönetici Özeti: Doğru Mimariyi Seçmek#
Her iki model de derin öğrenme araştırmalarında önemli kilometre taşlarını temsil etse de, biraz farklı dağıtım felsefelerine hitap ediyorlar.
DAMO-YOLO, belirli performans profillerini ortaya çıkarmak için yoğun Sinirsel Mimari Arama (NAS) tekniklerinin kullanılabildiği ortamlarda öne çıkıyor ve bu da onu özelleştirilmiş uç nokta dağıtımı için ilginç bir çalışma konusu haline getiriyor. Buna karşılık YOLOv9, derin öğrenme bilgi darboğazlarını çözmeye odaklanarak olağanüstü yüksek parametre verimliliği sunuyor.
Ancak, üretime hazır dağıtımlar için mühendislik ekipleri sürekli olarak birleşik Ultralytics ekosisteminden yararlanmayı öneriyor. Yeni projeler için en güncel YOLO26 modeli, karmaşık işlem sonrası adımlara olan ihtiyacı ortadan kaldıran doğal uçtan uca tasarımı ile en son teknoloji doğruluğu birleştirerek her iki dünyanın en iyi yönlerini sunuyor.
DAMO-YOLO ve YOLOv9 güçlü akademik modeller olsalar da, bunları üretim ortamında kullanmak genellikle ciddi bir özel mühendislik çalışması gerektirir. Ultralytics YOLO26 kullanmak, modern ve sürdürülebilir bir API ile en üst düzey performansa erişmeni sağlar.
Link to this sectionTeknik Özellikler ve Yazarlık#
Bu modellerin kökenlerini ve geliştirme odaklarını anlamak, sahip oldukları güçlü yönler için temel bir bağlam sağlar.
Link to this sectionDAMO-YOLO#
Alibaba Group araştırmacıları tarafından geliştirilen DAMO-YOLO, otomatik mimari oluşturma ve verimli özellik füzyonuna yoğun bir şekilde odaklanır.
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Kuruluş: Alibaba Group
- Yayın Tarihi: 23 Kasım 2022
- Arxiv Makalesi: DAMO-YOLO Araştırma Makalesi
- Resmi GitHub: tinyvision/DAMO-YOLO Deposu
- Dokümantasyon: DAMO-YOLO README
DAMO-YOLO hakkında daha fazla bilgi edinin
Link to this sectionYOLOv9#
Derin evrişimli ağlardaki bilgi kaybına bir çözüm olarak tanıtılan YOLOv9, eğitim sırasında gradyan korunumu teorik sınırlarını zorlar.
- Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Tayvan
- Yayın Tarihi: 21 Şubat 2024
- Arxiv Makalesi: YOLOv9 Araştırma Makalesi
- Resmi GitHub: WongKinYiu/yolov9 Deposu
- Dokümantasyon: YOLOv9 Ultralytics Dokümanları
YOLOv9 hakkında daha fazla bilgi edin
Link to this sectionMimari Yenilikler#
Link to this sectionDAMO-YOLO: Sinirsel Mimari Arama (NAS) ile Desteklenir#
DAMO-YOLO, yoğun şekilde özelleştirilmiş, makine tarafından oluşturulan bileşenlerle kendini farklılaştırır. Omurgası, özellikle değişken donanımlar üzerinde düşük gecikmeli çıkarımı hedefleyen Sinirsel Mimari Arama (NAS) kullanılarak oluşturulmuştur.
Mimari, özellik füzyonu için verimli bir RepGFPN (Yeniden Parametrelendirilmiş Genelleştirilmiş Özellik Piramit Ağı) içerir; bu da hesaplama yükünü aşırı artırmadan çok ölçekli nesne algılamayı geliştirir. Ayrıca, algılama başını basitleştirmek için bir ZeroHead tasarımı kullanır ve eğitim sırasında sofistike bir damıtma iyileştirme süreciyle eşleştirilmiş, etiket ataması için AlignedOTA'dan yararlanır. Bu teknikler hızlı çıkarım sağlasa da, çok aşamalı damıtma süreci genellikle önemli miktarda VRAM ve uzun eğitim süreleri gerektirir.
Link to this sectionYOLOv9: Bilgi Darboğazını Çözmek#
YOLOv9, derin ağlarda temel bir sorunu ele alır: verinin ardışık katmanlardan geçerken kademeli olarak kaybolması.
Bununla mücadele etmek için yazarlar, derin katmanlar için kritik detayları korumak üzere tasarlanmış ve ağırlık güncellemeleri için son derece güvenilir gradyanlar üreten bir yardımcı denetim çerçevesi olan Programlanabilir Gradyan Bilgisi'ni (PGI) tanıttılar. PGI'ye, GELAN (Genelleştirilmiş Verimli Katman Birleştirme Ağı) mimarisi eşlik eder. GELAN, CSPNet ve ELAN'ın güçlü yönlerini birleştirerek parametre verimliliğini optimize eder, bilgi akışını maksimize ederken Kayan Noktalı İşlemleri (FLOPs) kesinlikle minimize eder.
Link to this sectionPerformans Analizi ve Metrikler#
Performans değerlendirildiğinde, her iki model de COCO gibi standart ölçütlerde güçlü bir ortalama Hassasiyet (mAP) sergiler. YOLOv9, zorlu veri setlerinde yüksek doğruluğu korumak için PGI mimarisinden yararlanarak eşdeğer model boyutlarında daha yüksek mutlak doğruluk elde eder.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Yukarıda gösterildiği gibi, YOLOv9-E en yüksek doğruluğu sağlarken, daha küçük DAMO-YOLO ve YOLOv9 varyantları TensorRT optimizasyonları sayesinde son derece rekabetçi çıkarım hızlarını korur.
Link to this sectionEğitim Metodolojileri ve Ekosistem#
Ham mimari önemli olsa da, bir modelin ekosistemi tarafından belirlenen kullanılabilirlik ve eğitim verimliliği gerçek dünya uygulamaları için en önemlisidir.
DAMO-YOLO'nun bilgi damıtma işlemine olan bağımlılığı, bilgiyi hedef "öğrenci" modele aktarmadan önce hantal bir "öğretmen" modelin eğitilmesini gerektirir. Bu geleneksel araştırma yaklaşımı, bellek gereksinimlerini ve eğitim döngüsü sürelerini önemli ölçüde artırır. Benzer şekilde, orijinal YOLOv9 deposu, çevik geliştirmeyi yavaşlatabilecek karmaşık yapılandırma dosyalarında gezinmeyi gerektirir.
Buna karşılık, modelleri Ultralytics Platform içerisine entegre etmek, geliştirici deneyimini tamamen dönüştürür. Ultralytics Python paketi, standart kodları soyutlayarak ekiplerin veri artırma, hiperparametre ayarlama ve model dışa aktarma işlemlerini zahmetsizce gerçekleştirmelerini sağlar.
Link to this sectionGerçek Dünya Uygulamaları ve Kullanım Durumları#
Farklı mimariler, kaynak gereksinimlerine ve doğruluk profillerine göre doğal olarak belirli endüstrilerde daha iyi performans gösterir.
- Uç Nokta Yapay Zekasında DAMO-YOLO: NAS ile optimize edilmiş omurgaları sayesinde DAMO-YOLO, temel üretim kalite kontrolü süreçlerinde özel ASIC dağıtımı gibi donanıma özgü yeniden parametrelendirmenin kesin bir gereklilik olduğu gömülü sistemlerde sıklıkla incelenir.
- Hassas Analitikte YOLOv9: Yüksek parametre verimliliği ve PGI odaklı gradyan koruma özelliği ile YOLOv9, hava görüntülerini analiz etme veya kalabalık perakende ortamlarında küçük nesneleri izleme gibi yoğun nesne algılama senaryoları için mükemmeldir.
Link to this sectionKullanım Durumları ve Öneriler#
DAMO-YOLO ve YOLOv9 arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
Link to this sectionNe Zaman DAMO-YOLO Seçilmeli#
DAMO-YOLO şunlar için güçlü bir seçimdir:
- Yüksek Verimli Video Analitiği: Toplu-1 (batch-1) veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS'li video akışlarını işleme.
- Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite kontrol gibi, özel donanımlarda katı GPU gecikme kısıtlamaları olan senaryolar.
- Neural Architecture Search Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametreleştirilmiş omurgaların algılama performansı üzerindeki etkilerini inceleme.
Link to this sectionNe Zaman YOLOv9 Seçilmeli#
YOLOv9 şunlar için önerilir:
- Bilgi Darboğazı Araştırması: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN) mimarilerini inceleyen akademik projeler.
- Gradyan Akışı Optimizasyonu Çalışmaları: Eğitim sırasında derin ağ katmanlarındaki bilgi kaybını anlamaya ve azaltmaya odaklanan araştırmalar.
- Yüksek Doğrulukta Algılama Kıyaslaması: YOLOv9'un güçlü COCO karşılaştırma performansının mimari karşılaştırmalar için referans noktası olarak gerektiği senaryolar.
Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#
Çoğu yeni proje için, Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Link to this sectionUltralytics Avantajı: YOLO26'ya Geçiş#
Eski mimarileri karşılaştıran kullanıcılar için, modern Ultralytics ekosistemine (özellikle en son YOLO26 modellerine) geçiş yapmak, benzersiz bir avantaj sağlar.
YOLO26, Uçtan Uca NMS-İçermeyen Tasarımı ile dağıtım dünyasını temelden değiştirir. Maksimum Olmayan Bastırma (NMS) işlem sonrası adımlarını tamamen ortadan kaldırarak, daha hızlı ve çok daha basit dağıtım mimarileri sunar. Dağılım Odaklı Kayıp (DFL) işleminin kaldırılmasıyla birleşen YOLO26, uç nokta ve düşük güç tüketen cihazlar için üstün uyumluluk sunar.
Ayrıca YOLO26, LLM eğitimi yeniliklerinden esinlenen Stokastik Gradyan İnişi ve Muon optimizasyonlarının bir melezi olan devrim niteliğindeki MuSGD Optimize Ediciyi içerir. Bu, Transformer ağırlıklı alternatiflere kıyasla son derece düşük bellek kullanımı sağlarken oldukça kararlı eğitim yakınsaması sunar.
Sezgisel Ultralytics API sayesinde, birkaç satır Python koduyla dahili deney takibine sahip en son teknoloji bir YOLO26 modelini eğitebilirsin.
from ultralytics import YOLO
# Load the latest NMS-free YOLO26 model
model = YOLO("yolo26n.pt")
# Train on your custom dataset efficiently
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to ONNX format
model.export(format="onnx")Gelişmiş örnek segmentasyonu, yüksek hassasiyetli poz tahmini veya standart sınırlayıcı kutu algılama işlemlerinden hangisine ihtiyacın olursa olsun, Ultralytics çerçevesinin çok yönlülüğü, ekibinin derin öğrenme ortamlarını yapılandırmak yerine sağlam yapay zeka çözümleri dağıtmaya daha fazla zaman ayırmasını sağlar. Gelişmiş küçük nesne tanıma için ProgLoss + STAL gibi özel görev iyileştirmeleriyle YOLO26, yeni nesil görü uygulamaları için bir numaralı tercihtir.