YOLOv7 vs. DAMO-YOLO: Kapsamlı Bir Teknik Karşılaştırma
Gerçek zamanlı nesne algılama alanı sürekli gelişmekte olup, araştırmacılar ve mühendisler hız ve doğruluk arasında en uygun dengeyi bulmaya çalışmaktadır. Bu teknik karşılaştırmada, 2022'den iki önemli mimariyi derinlemesine inceleyeceğiz: YOLOv7 ve DAMO-YOLO. Her iki model de bilgisayar görüşü topluluğuna yeni kavramlar sunarak model eğitimi, mimari tasarım ve dağıtım konularındaki farklı zorlukları ele almıştır.
Model Arka Planları ve Teknik Detaylar
Mimarilerine dalmadan önce, bu iki modelin kökenlerini anlamak önemlidir. Her ikisi de önde gelen araştırma grupları tarafından geliştirilmiş ve gerçek zamanlı nesne algılamanın sınırlarını zorlamak için gelişmiş metodolojiler sunmuştur.
YOLOv7 Detayları
YOLO ailesinin bir devamı olarak geliştirilen YOLOv7, çıkarım maliyetini artırmadan doğruluğu önemli ölçüde artırmak için eğitilebilir "bag-of-freebies" kavramını tanıttı.
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Kuruluş:Institute of Information Science, Academia Sinica, Taiwan
- Tarih: 2022-07-06
- Arxiv:https://arxiv.org/abs/2207.02696
- GitHub:https://github.com/WongKinYiu/yolov7
- Belgeler:https://docs.ultralytics.com/models/yolov7/
YOLOv7 hakkında daha fazla bilgi edinin.
DAMO-YOLO Detayları
Alibaba Group'taki araştırmacılar tarafından oluşturulan DAMO-YOLO, çeşitli donanımlar için yüksek verimli modeller oluşturmak amacıyla Sinirsel Mimari Arama (NAS) ve gelişmiş bilgi damıtma üzerine yoğunlaştı.
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Kuruluş:Alibaba Group
- Tarih: 2022-11-23
- Arxiv:https://arxiv.org/abs/2211.15444v2
- GitHub:https://github.com/tinyvision/DAMO-YOLO
DAMO-YOLO hakkında daha fazla bilgi edinin
Mimari Yenilikler
YOLOv7: Gradyan Yolu Analizi ve Yeniden Parametrelendirme
YOLOv7, Genişletilmiş Verimli Katman Toplama Ağlarına (E-ELAN) büyük ölçüde odaklanmaktadır. Yazarlar, ağın gradyan yollarını analiz ederek E-ELAN'ı tasarlamış, böylece ağın orijinal gradyan yolunu bozmadan sürekli öğrenebilmesini sağlamıştır. Ayrıca, YOLOv7 çıkarım sırasında model yeniden parametrelendirmesini etkili bir şekilde kullanarak katmanları sorunsuz bir şekilde birleştirerek FLOPs'u azaltır ve yürütme sürelerini hızlandırır. Bu da onu modern GPU'larda gerçek zamanlı çıkarım için oldukça yetenekli kılar.
DAMO-YOLO: Sinirsel Mimari Arama ve RepGFPN
DAMO-YOLO, gecikme kısıtlamaları altında Sinirsel Mimari Arama (NAS) yöntemini yoğun bir şekilde kullanarak farklılaşır. Mobil cihazlar veya belirli kenar hızlandırıcılar gibi özel donanımlar için optimize edilmiş en uygun backbone'ları keşfetmek amacıyla MAE-NAS adlı bir çerçeve kullanır. Boyun kısmı için verimli bir RepGFPN (Yeniden Parametrelendirilmiş Genelleştirilmiş Özellik Piramit Ağı) sunar ve tahmin başlıklarındaki hesaplama yükünü en aza indirmek için ZeroHead tasarımını kullanır.
Damıtma Farklılıkları
YOLOv7 güçlü içsel mimari optimizasyonlara dayanırken, DAMO-YOLO karmaşık çok aşamalı bir bilgi damıtma sürecine büyük ölçüde bağımlıdır. Bu, daha küçük bir öğrenci modeline bilgi damıtmak için büyük bir öğretmen modelinin eğitilmesini gerektirir ve bu da eğitim aşamasında hesaplama açısından maliyetli olabilir.
Performans ve Metrik Karşılaştırması
Bu modelleri karşılaştırırken, mAP (Ortalama Hassasiyet Ortalaması), çıkarım hızı ve model karmaşıklığına bakmak çok önemlidir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Yukarıdaki tablo, YOLOv7'nin yüksek doğruluk alanlarına (YOLOv7x) iyi ölçeklendiğini, DAMO-YOLO'nun ise kısıtlı ortamlar için yüksek düzeyde optimize edilmiş küçük modeller sunduğunu göstermektedir.
Eğitim Verimliliği ve Bellek Gereksinimleri
İki mimari arasındaki önemli bir fark, eğitim metodolojilerinde yatmaktadır. DAMO-YOLO'nun damıtmaya bağımlılığı, sıfırdan yeni bir model eğitmenin veya özel bir bilgisayar görüşü veri kümesi üzerinde ince ayar yapmanın genellikle önemli ölçüde daha fazla VRAM ve GPU hesaplama süresi gerektirdiği anlamına gelir.
Buna karşılık, YOLOv7 ve sonraki sürümleri gibi Ultralytics ekosistemine entegre modeller, bellek gereksinimleri açısından yoğun bir şekilde optimize edilmiştir. Bu modeller, geliştiricilerin tüketici donanımında bellek yetersizliği hatalarıyla karşılaşmadan daha büyük toplu iş boyutları kullanmasına olanak tanıyarak deney takibi ve yineleme sürecini basitleştirir.
Ultralytics'in Avantajı
Hem YOLOv7 hem de DAMO-YOLO cazip özellikler sunsa da, modelleri Ultralytics ekosistemi içinde dağıtmak, eşsiz bir geliştirici deneyimi sağlar.
- Kullanım Kolaylığı: Ultralytics Python paketi, birleşik ve basit bir API sunar. Birkaç satır kodla model mimarileri arasında hızla geçiş yapabilir, eğitim döngülerini başlatabilir veya çıkarım çalıştırabilirsiniz.
- İyi Yönetilen Ekosistem: Ultralytics, en son PyTorch sürümleri ve CUDA sürücüleriyle yerel uyumluluğu sağlayarak sık güncellemeler sunar. Ayrıca, modelleri ONNX, TensorRT ve OpenVINO gibi formatlara aktarmayı basitleştirir.
- Çok Yönlülük: Yalnızca bir nesne dedektörü olan DAMO-YOLO'nun aksine, Ultralytics ekosistemi, çeşitli görevleri yerel olarak destekler. Ultralytics ailesindeki modeller, standart sınırlayıcı kutu algılama, poz tahmini, örnek segmentasyon ve Yönlendirilmiş Sınırlayıcı Kutular (OBB) gerçekleştirebilir.
Kod Örneği: Hızlı Başlangıç
Ultralytics modellerini kullanarak modelleri ne kadar kolay yükleyebileceğinizi, eğitebileceğinizi ve çıkarım yapabileceğinizi aşağıda görebilirsiniz:
from ultralytics import YOLO
# Load a pre-trained YOLOv7 model (or newer models like yolo26n.pt)
model = YOLO("yolov7.pt")
# Train the model on the COCO8 dataset with automated hyperparameter handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX format for deployment
model.export(format="onnx")
Modelleri Dışa Aktarma
Ultralytics ile eğitilmiş ağırlıklarınızı çeşitli donanım hızlandırmalı formatlara (TensorRT veya CoreML gibi) dışa aktarmak, dışa aktarma komutundaki tek bir argüman aracılığıyla yapılır ve saatler süren karmaşık betik yapılandırmalarından tasarruf edilir.
Yeni Nesil: YOLO26
YOLOv7 güçlü bir eski mimari olmaya devam etse de, alan hızla ilerledi. Yeni dağıtımlar için Ultralytics YOLO26 (Ocak 2026'da yayınlandı) önerilen standarttır ve önceki nesilleri neredeyse her metrikte geride bırakmaktadır.
- Uçtan Uca NMS'siz Tasarım: YOLOv10'da öncülük edilen YOLO26, Non-Maximum Suppression (NMS) son işlemeyi doğal olarak ortadan kaldırır. Bu, robotik ve otonom sürüş teknolojileri için kritik olan deterministik, ultra düşük gecikmeli çıkarım sağlar.
- MuSGD Optimize Edici: Gelişmiş LLM eğitim tekniklerinden (Moonshot AI'nin Kimi K2'si gibi) ilham alan bu hibrit optimize edici, SGD ve Muon'u harmanlayarak veri kümeleri genelinde oldukça kararlı eğitim ve daha hızlı yakınsama sağlar.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Distribution Focal Loss (DFL) stratejik olarak kaldırılarak, YOLO26 kenar bilişim platformlarında ve CPU'larda performansı önemli ölçüde artırır.
- ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, küçük nesneleri detect etmede önemli iyileşmeler sağlar ve YOLO26'yı hava görüntüleri ve detaylı gözetim için son derece uygun hale getirir.
YOLO26 hakkında daha fazla bilgi edinin
İdeal Kullanım Senaryoları
Ne Zaman DAMO-YOLO Seçmeli
- NAS'ta Akademik Araştırma: Kuruluşunuz, Sinirsel Mimari Arama metodolojilerini incelemeye yoğun bir şekilde yatırım yapıyorsa.
- Belirli Donanımlarda Aşırı Kısıtlı Gecikme: Özel bir yapay zeka hızlandırıcı çipi için özel bir backbone bulmak amacıyla kapsamlı NAS aramaları yapacak kaynaklara sahipseniz.
YOLOv7 Ne Zaman Tercih Edilmeli?
- Mevcut GPU İş Akışları: Yüksek performanslı NVIDIA donanımında YOLOv7'nin belirli E-ELAN mimarisi etrafında derinlemesine optimize edilmiş eski üretim iş akışlarını sürdüren ekipler için.
Neden Modern Ultralytics Modellerine (YOLO11 / YOLO26) Geçilmeli
Perakende analizinden akıllı üretime ve sağlık hizmetlerine kadar kurumsal uygulamaların büyük çoğunluğu için modern Ultralytics modelleri rakipsizdir. Ultralytics Platformu ile entegrasyon, kullanım kolaylığı, üstün dokümantasyon, güçlü topluluk desteği ve çok görevli çok yönlülük sunan eksiksiz bir ML iş akışı sağlar. Bir Raspberry Pi üzerinde envanter track etmek veya bulutta yoğun analizler yapmak olsun, YOLO26 gibi modeller bilgisayar görüşünün geleceği için ideal performans dengesini sunar.