YOLOv6.0 ileYOLO: Teknik Karşılaştırma
Gerçek zamanlı nesne algılama alanı, hız ve doğruluk arasında optimum dengeyi sağlamak için hızlı yineleme ve rekabet ile tanımlanır. Bu alana yapılan iki önemli katkı, Meituan tarafından geliştirilen YOLOv6.YOLOv6 ve Alibaba'nın DAMO Akademisi'nden YOLO. Bu karşılaştırma, her iki modelin mimari yeniliklerini, performans karşılaştırmalarını ve ideal dağıtım senaryolarını incelerken, modern Ultralytics bilgisayar görüşünün sınırlarını nasıl zorlamaya devam ettiğini de vurgulamaktadır.
Performans Kıyaslaması
Her iki model de gerçek zamanlı endüstriyel uygulamaları hedeflemektedir, ancak sonuçlarını farklı optimizasyon stratejileriyle elde etmektedirler. Aşağıdaki tablo, COCO veri setindeki performanslarını ayrıntılı olarak göstermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
YOLOv6-3.0'a Genel Bakış
Meituan tarafından 2023'ün başlarında piyasaya sürülen YOLOv6.YOLOv6, önceki mimarilerinin "tam kapsamlı bir yeniden yüklemesi" niteliğindedir. GPU gibi özel donanımlarda kullanıma optimize edilmiş mühendislik modellerine yoğun bir şekilde odaklanarak endüstriyel otomasyon için favori bir seçenek haline gelmiştir.
Temel Özellikler:
- Çift Yönlü Birleştirme (BiC): Boyunda, önemli bir hesaplama maliyeti olmadan lokalizasyon doğruluğunu artıran, geliştirilmiş bir özellik birleştirme yöntemi.
- Anchor-Aided Training (AAT): Yakınsamayı stabilize etmek ve nihai doğruluğu artırmak için anchor tabanlı ve anchor-free paradigmaları birleştiren hibrit bir eğitim stratejisi.
- Ayrıştırılmış Başlık: Modern dedektörlerde standart olan sınıflandırma ve regresyon görevlerini ayırarak, daha hassas sınırlayıcı kutu iyileştirmelerine olanak tanır.
- Kuantizasyona Uygun: Mimari, RepOptimizer ve kanal bazlı damıtma gibi teknikler kullanılarak INT8'e kuantize edildiğinde doğruluk kaybını en aza indirecek şekilde özel olarak tasarlanmıştır.
YOLOv6 hakkında daha fazla bilgi edinin.
DAMO-YOLO'ya Genel Bakış
Alibaba Group tarafından geliştirilen ve 2022'nin sonlarında piyasaya sürülen YOLO, özellikle Nöral Mimari Arama (NAS) yoluyla hız-doğruluk dengesi sınırlarını zorlamayı amaçlayan birkaç yeni teknolojiyi tanıtıyor.
Temel Özellikler:
- MAE-NAS Backbone: Maksimum Entropi ilkesine dayalı Neural Architecture Search (NAS) aracılığıyla backbone bir backbone kullanır ve yüksek bilgi akışı ve verimlilik sağlar.
- Verimli RepGFPN: Standart PANet'i genelleştirilmiş özellik piramidi ağı (GFPN) ile değiştiren ve daha iyi çok ölçekli özellik füzyonu sunan bir heavyneck tasarımı.
- ZeroHead: "Ağır" ayrıştırılmış kafalarla genellikle ilişkili olan hesaplama yükünü azaltmak için tasarlanmış, son derece hafif bir algılama kafası.
- AlignedOTA: Eğitim sırasında sınıflandırma ve regresyon görevlerini daha etkili bir şekilde uyumlu hale getiren güncellenmiş bir etiket atama stratejisi.
Karşılaştırmalı Analiz
Mimari ve Tasarım Felsefesi
Temel fark, tasarımlarının kökeninde yatmaktadır. YOLOv6.YOLOv6, "kullanım kolaylığı"na odaklanarak manuel olarak tasarlanmış olup, özellikle NVIDIA TensorRT hedeflemektedir. Standart konvolüsyonlar ve RepVGG tarzı bloklar kullanması, üretim ortamlarında yüksek öngörülebilirlik sağlar.
Buna karşılık, YOLO, optimum yapıları bulmak için büyük ölçüde otomatik aramaya (NAS) dayanmaktadır. Bu, mükemmel teorik verimlilik (FLOP) sağlasa da, NAS'tan türetilen omurgalarda bulunan karmaşık dallanma yapıları, YOLOv6 basit tasarımına kıyasla belirli donanım derleyicileri için optimize edilmesi bazen daha zor olabilir.
Kenar Cihazlarda Performans
Taşma kenarı AI'yı içeren görevler için kenar AIiçeren görevler için her iki model de rekabetçi "Tiny" veya "Nano" varyantları sunar. YOLOv6 son derece hafiftir (4,7 milyon parametre) ve bu da onu ciddi kısıtlamalara sahip cihazlar için uygun hale getirir.YOLO ise biraz daha büyüktür, ancak genellikle daha yüksek doğruluk (42,0 mAP) sağlar ve bu da daha ince ayrıntılar gerektiren uygulamalar için ekstra hesaplama maliyetini haklı çıkarabilir.
Eğitim Metodolojileri
YOLOv6 , eğitim sırasında daha büyük bir öğretmen modelinin öğrenci modeline rehberlik ettiği kendi kendine damıtma yöntemini yaygın olarak YOLOv6 . Bu, yüksek performans için çok önemlidir, ancak eğitim sürecini daha karmaşık hale getirir.YOLO , damıtma geliştirme modülünüYOLO , ancak öğrenme sürecinde zor örnekleri daha etkili bir şekilde işlemek için AlignedOTA etiket atamasını vurgular.
Dağıtım Hususları
Üretime geçirken şunu göz önünde bulundurun YOLOv6 genellikle TensorRT aracılığıyla INT8 niceleme için daha iyi hazır destek sağlar ve bu da NVIDIA Orin gibi uyumlu donanımlarda çıkarım hızlarını iki katına çıkarabilir.
Ultralytics'in Avantajı
YOLO YOLOv6 etkileyici araştırma başarıları YOLOv6 da, Ultralytics kullanım kolaylığı, sürdürülebilirlik ve üretim hazırlığını önceliklendiren geliştiriciler için belirgin bir avantaj sunar.
Kesintisiz Geliştirici Deneyimi
Ultralytics , aşağıdakiler dahil YOLO11 ve son teknoloji YOLO26 dahil olmak üzere tüm ultralytics modelleri, birleşik bir çerçeve üzerinde oluşturulmuştur. Bu, basit ve tutarlı bir API kullanarak modelleri eğitebileceğiniz, doğrulayabileceğiniz ve uygulayabileceğiniz anlamına gelir.
from ultralytics import YOLO
# Load a model (switch freely between versions)
model = YOLO("yolo26n.pt")
# Train on your custom dataset
results = model.train(data="coco8.yaml", epochs=100)
# Export to ONNX for deployment
model.export(format="onnx")
Görevler Arası Çok Yönlülük
Birçok özel depodan farklı olarak, Ultralytics basit algılamanın ötesinde geniş bir yelpazede bilgisayar görme görevlerini destekler. Buna örnek segmentasyonu, poz tahmini, sınıflandırma ve yönlendirilmiş sınırlayıcı kutu (OBB) algılama dahildir. Bu çok yönlülük, ekiplerin AI araçlarını tek bir iş akışında birleştirmelerine olanak tanır.
Platform Entegrasyonu
Ultralytics Platformu Ultralytics , veri kümesi yönetimi, otomatik açıklama ve tek tıklamayla bulut eğitimi için araçlar sağlayarak yaşam döngüsünü daha da basitleştirir. Bu entegre yaklaşım, karmaşık yerel ortamlar kurma ve farklı veri kümelerini yönetme zorluklarını ortadan kaldırır.
Gelecek: Ultralytics
En son performans ve mimari yenilikleri arayan geliştiriciler için YOLO26 yeni bir standart belirliyor.
- Uçtan uca NMS: Non-Maximum Suppression (NMS) özelliğini ortadan kaldırarak, YOLO26 dağıtım sürecini basitleştirir ve gecikme varyansını azaltır; bu özellik, gerçek zamanlı güvenlik sistemleri için çok önemlidir.
- CPU : Dağıtım Odak Kaybı (DFL) özelliğinin kaldırılması ve kenar kısıtlamaları için optimizasyon sayesinde, YOLO26 önceki nesillere kıyasla %43'e varan daha hızlı CPU ulaşarak, özel GPU'su olmayan cihazlar için üstün bir seçim haline gelmiştir.
- Gelişmiş Eğitim Kararlılığı: LLM eğitim tekniklerinden esinlenerek geliştirilen MuSGD Optimizer'ın kullanılması, görme modeli eğitimine benzeri görülmemiş bir kararlılık getirerek daha hızlı yakınsama ve daha iyi genelleme sağlar.
- Göreve Özel Kazanımlar: İster hassas poz tahmini için Artık Log Olasılık Tahmini (RLE) ister OBB için özel açı kayıpları olsun, YOLO26 karmaşık kullanım durumları için hedefe yönelik iyileştirmeler sunar.
YOLO26 hakkında daha fazla bilgi edinin
Özet
- Birincil dağıtım hedefiniz yüksek verimli NVIDIA (ör. T4, A100) ise ve endüstriyel denetim veya video analizi için olgun kuantizasyon desteğine ihtiyacınız varsa YOLOv6. YOLOv6 seçin.
- NAS tabanlı mimarilerle ilgileniyorsanız ve araştırma veya RepGFPN'nin daha iyi özellik birleştirme sunduğu belirli senaryolar backbone yüksek verimli bir backbone ihtiyacınız varsa YOLO seçin.
- Hız, doğruluk ve geliştirici deneyiminin en iyi genel dengesi için Ultralytics seçin. NMS tasarımı, eğitim sırasında düşük bellek gereksinimleri ve kapsamlı ekosistem desteği, hızlı prototiplerden üretim kurumsal çözümlerine ölçeklendirme için ideal seçimdir.
Daha Fazla Okuma
Ultralytics daha fazla karşılaştırma ve model keşfedin:
- YOLOv8 vs. YOLOv6
- RT-DETR - Gerçek zamanlı Algılama Dönüştürücü.
- YOLOv10 - Gerçek Zamanlı Uçtan Uca Nesne Algılama.
- COCO - Nesne algılama için standart karşılaştırma ölçütü.