Link to this sectionYOLOv10 ile DAMO-YOLO Karşılaştırması#
Modern bilgisayarlı görü hatları oluştururken, doğru gerçek zamanlı nesne algılama mimarisini seçmek kritiktir. Bu kapsamlı teknik analizde, YOLOv10 ve DAMO-YOLO mimarilerini, performans ölçümlerini ve ideal kullanım durumlarını inceliyoruz. Her iki model de nesne algılama yeteneklerinde önemli bir sıçramayı temsil etse de, hedeflerine ulaşmak için farklı mimari yollar izliyorlar.
Projen ister kısıtlı uç yapay zeka donanımlarında çalışmayı gerektirsin, ister bulut GPU'larında maksimum doğruluk talep etsin; bu mimarilerin inceliklerini anlamak, bilinçli bir karar vermene yardımcı olacaktır.
Link to this sectionYOLOv10'u Keşfetmek#
Tsinghua Üniversitesi'ndeki araştırmacılar tarafından tanıtılan YOLOv10, yerel olarak uçtan uca (end-to-end) bir yaklaşım sunarak YOLO ailesinde devrim yarattı ve işlem sonrası aşamada Non-Maximum Suppression (NMS) ihtiyacını etkili bir şekilde ortadan kaldırdı.
YOLOv10 Detayları:
- Yazarlar: Ao Wang, Hui Chen, Lihao Liu ve diğerleri.
- Kurum: Tsinghua Üniversitesi
- Tarih: 23-05-2024
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- Dokümanlar: https://docs.ultralytics.com/models/yolov10/
Link to this sectionTemel Mimari Özellikler#
YOLOv10'un birincil yeniliği, NMS'siz eğitim için uyguladığı Tutarlı İkili Atama stratejisidir. Geleneksel nesne dedektörleri, üst üste binen sınırlayıcı kutuları filtrelemek için büyük ölçüde NMS'ye güvenir; bu da otonom araçlar ve yüksek hızlı robotik gibi gerçek zamanlı uygulamalar için önemli bir darboğaz olan öngörülemez bir gecikmeye neden olur. Nesne başına doğrudan tek bir optimal sınırlayıcı kutu tahmin eden YOLOv10, öngörülebilir ve ultra düşük gecikmeli çıkarım sağlar.
Ayrıca model, Bütünsel Verimlilik-Doğruluk Odaklı Tasarım kullanır. Mimari, hafif bir sınıflandırma başlığı ve uzamsal-kanal ayrıştırmalı alt örnekleme dahil olmak üzere çeşitli bileşenleri optimize ederek hesaplama yedekliliğini önemli ölçüde azaltır. Bu, ortalama Hassasiyet (mAP) değerinde rekabetçi kalırken, daha düşük bir parametre sayısı ve daha az FLOP'a sahip bir mimari ile sonuçlanır.
YOLOv10 hakkında daha fazla bilgi edin
Link to this sectionKullanım Örneği#
YOLOv10, Ultralytics ekosistemine derinlemesine entegre edilmiştir ve Ultralytics Python paketi aracılığıyla kullanımını inanılmaz derecede kolaylaştırır.
from ultralytics import YOLO
# Load a pre-trained YOLOv10 nano model
model = YOLO("yolov10n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a test image
results = model("https://ultralytics.com/images/bus.jpg")
# Export the model to TensorRT format
model.export(format="engine", quantize=16)Link to this sectionDAMO-YOLO'yu Keşfetmek#
Alibaba Group tarafından geliştirilen DAMO-YOLO, hız ve doğruluk açısından Pareto sınırını zorlamayı hedefleyerek, otomatik Sinirsel Mimari Arama (NAS) yoluyla yüksek verimli ağ yapıları keşfetmeye odaklanır.
DAMO-YOLO Detayları:
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Organizasyon: Alibaba Group
- Tarih: 23-11-2022
- Arxiv: https://arxiv.org/abs/2211.15444v2
- GitHub: https://github.com/tinyvision/DAMO-YOLO
Link to this sectionTemel Mimari Özellikler#
DAMO-YOLO, endüstriyel uygulamalar için özel olarak tasarlanmış birkaç yeni teknoloji sunar. Modelin temeli, Çok Amaçlı Evrimsel arama yoluyla oluşturulan MAE-NAS Omurgasıdır. Bu otomatik süreç, doğruluk ve çıkarım gecikmesi arasında hassas bir denge kurarak önceden tanımlanmış hesaplama bütçelerine sıkı sıkıya bağlı omurga yapılarını keşfeder.
Ek olarak mimari, Verimli RepGFPN boyun yapısını kullanır. Bu özellik piramidi ağı, nesnelerin boyutlarının büyük ölçüde değiştiği hava görüntü analizi gibi karmaşık görevler için kritik olan farklı ölçeklerde özellik füzyonunu iyileştirmek üzere tasarlanmıştır. Bunu tamamlamak için DAMO-YOLO, son tahmin katmanlarının karmaşıklığını önemli ölçüde azaltan ve çıkarım sırasında değerli hesaplama süresinden tasarruf sağlayan minimalist bir algılama başlığı olan ZeroHead'i uygular.
DAMO-YOLO hakkında daha fazla bilgi edin
Link to this sectionPerformans Karşılaştırması#
Nesne algılama mimarilerini değerlendirirken, çıkarım hızı, parametre verimliliği ve algılama doğruluğu arasında doğru dengeyi bulmak çok önemlidir. Aşağıdaki tablo, YOLOv10 ve DAMO-YOLO'nun performansını ilgili model boyutlarına göre karşılaştırmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Benchmarklarda gözlemlendiği gibi, YOLOv10, TensorRT üzerinde tutarlı bir şekilde olağanüstü gecikme profilleri sunar; özellikle nano varyantında, DAMO-YOLO'nun benzer modellerine kıyasla önemli ölçüde daha az parametre ve FLOP gerektirir. DAMO-YOLO, tiny varyantında güçlü bir mAP sunsa da, YOLOv10 ailesinin parametre verimliliği ve çıkarım gecikmesi, kısıtlı dağıtım ortamları için belirgin bir avantaj sağlar.
Link to this sectionKullanım Durumları ve Öneriler#
YOLOv10 ile DAMO-YOLO arasında seçim yapmak; özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
Link to this sectionNe Zaman YOLOv10 Seçilmeli#
YOLOv10 şunlar için güçlü bir seçimdir:
- NMS'siz Gerçek Zamanlı Tespit: Non-Maximum Suppression (NMS) olmadan uçtan uca tespitten yararlanan ve dağıtım karmaşıklığını azaltan uygulamalar.
- Dengeli Hız-Doğruluk Takasları: Çeşitli model ölçeklerinde çıkarım hızı ile tespit doğruluğu arasında güçlü bir denge gerektiren projeler.
- Tutarlı Gecikme Süreli Uygulamalar: robotik veya otonom sistemler gibi öngörülebilir çıkarım sürelerinin kritik olduğu dağıtım senaryoları.
Link to this sectionNe Zaman DAMO-YOLO Seçilmeli#
DAMO-YOLO şunlar için önerilir:
- Yüksek Verimli Video Analitiği: Toplu-1 (batch-1) veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS'li video akışlarını işleme.
- Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite kontrol gibi, özel donanımlarda katı GPU gecikme kısıtlamaları olan senaryolar.
- Neural Architecture Search Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametreleştirilmiş omurgaların algılama performansı üzerindeki etkilerini inceleme.
Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#
Çoğu yeni proje için, Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Link to this sectionUltralytics Avantajı#
Her iki model de teknik olarak etkileyici olsa da, üretim için bir mimari seçmek ham metriklerin ötesine bakmayı gerektirir. Ultralytics ekosistemi tarafından yerel olarak desteklenen modellerle çalışmak, geliştiriciler ve araştırmacılar için benzersiz avantajlar sağlar.
Link to this sectionKullanım Kolaylığı ve Bakımlı Ekosistem#
Genellikle terk edilme riskiyle karşı karşıya olan bağımsız akademik depoların aksine, Ultralytics sağlam ve aktif olarak sürdürülen bir ekosistem sunar. NAS boru hatlarına yoğun bir şekilde dayanan modeller için karmaşık ortamlar kurmak göz korkutucu olabilir. Buna karşılık Ultralytics, kapsamlı dokümantasyon ile desteklenen, standartlaştırılmış ve sezgisel bir Python API'si ile güçlü bir CLI sağlar. Bu, özel görü çözümleri için pazara sunma süresini radikal bir şekilde azaltır.
Link to this sectionEğitim Verimliliği ve Bellek Gereksinimleri#
Büyük modelleri eğitmek hızla hesaplama açısından maliyetli hale gelebilir. Ultralytics YOLO mimarileri, eğitim ve çıkarım sırasında düşük CUDA bellek ayak izleriyle bilinir. Bu verimlilik, geliştiricilerin modelleri tüketici sınıfı donanımlarda veya uygun maliyetli bulut örneklerinde, RT-DETR gibi Transformer tabanlı modellerle çalışırken sıkça karşılaşılan bellek yetersizliği hatalarıyla karşılaşmadan eğitmesine olanak tanır.
Ultralytics, en iyi MLOps araçlarıyla yerel olarak entegre olur. Weights & Biases, Comet veya ClearML entegrasyonlarını kullanarak, ek kod yazmadan model eğitimi ilerlemeni kolayca takip edebilirsin.
Link to this sectionGörevler Arasında Çok Yönlülük#
A significant limitation of many specialized detection models is their narrow focus. Within the Ultralytics ecosystem, you are not limited to just object detection. The tools seamlessly extend to multiple computer vision tasks, including instance segmentation, image classification, pose estimation, and oriented bounding box (OBB) detection.
Link to this sectionGeleceğe Bakış: YOLO26 Evrimi#
YOLOv10 NMS'siz çıkarıma öncülük ederken ve DAMO-YOLO, NAS'ın gücünü sergilerken, bilgisayarlı görü alanı hızla ilerliyor. En üst düzey çözüm arayan geliştiriciler için Ultralytics YOLO26 modeline göz atmalarını öneriyoruz.
YOLO11'in kesin halefi olarak yayınlanan YOLO26, YOLOv10 tarafından atılan NMS'siz temel üzerine inşa edilmiş olsa da, onu çok daha ileriye taşıyor.
YOLO26'daki temel gelişmeler şunlardır:
- %43'e varan Daha Hızlı CPU Çıkarımı: Özellikle uç bilişim ve düşük güçlü cihazlar için optimize edilmiştir.
- DFL Kaldırma: Dağılımsal Odak Kaybı (Distribution Focal Loss) kaldırılarak daha basit dışa aktarımlar ve çeşitli dağıtım hedefleriyle gelişmiş uyumluluk sağlanmıştır.
- MuSGD Optimize Edici: SGD ve Muon'un bir melezi olup, gelişmiş LLM eğitim kararlılığını ve daha hızlı yakınsamayı doğrudan bilgisayarlı görüye getirir.
- ProgLoss + STAL: Tarım ve uzaktan algılama gibi kullanım durumları için gerekli olan küçük nesne tanımada kayda değer iyileştirmeler sunan büyük ölçüde geliştirilmiş kayıp fonksiyonları.
Yeni yenilenen Ultralytics Platform'u kullanan geliştiriciler, YOLO26 gibi yeni nesil modelleri birkaç tıklamayla sorunsuz bir şekilde etiketleyebilir, eğitebilir ve dağıtabilir; böylece bilgisayarlı görü hattının hem en güncel hem de geleceğe hazır olmasını sağlarsın.