İçeriğe geç

YOLOv9 YOLOv6.0: Mimari Yenilik ve Performans Analizi

Gerçek zamanlı nesne algılama alanı, araştırmacıların doğruluk ve verimlilik sınırlarını sürekli olarak zorlamasıyla hızla değişmektedir. Bu evrimdeki iki önemli dönüm noktası şunlardır YOLOv9ve Meituan'ın 2023 yılında piyasaya sürdüğü sağlam bir sürüm olan YOLOv6.YOLOv6. Her iki model de endüstriyel zorlukları çözmeyi amaçlasa da, yüksek performans elde etmek için temelde farklı mimari yaklaşımlar benimsemektedir.

Mimari Felsefeler

Bu iki model arasındaki temel fark, sinir ağı boyunca bilgi akışını ve özellik çıkarmayı nasıl yönettiklerinde yatmaktadır.

YOLOv9: Kayıp Bilgileri Kurtarma

YOLOv9 derin öğrenmede temel bir sorunu ele alır: veriler derin katmanlardan geçerken bilgi kaybı. Yazarlar Chien-Yao Wang ve Hong-Yuan Mark Liao, Programlanabilir Gradyan Bilgisi (PGI) kavramını ortaya attılar. PGI, kritik semantik bilgilerin korunmasını sağlayan yardımcı bir denetim dalı sunarak, modelin çıkarım maliyetini artırmadan daha sağlam özellikleri öğrenmesini sağlar.

Ek olarak, YOLOv9 GELAN (Genelleştirilmiş Verimli Katman Toplama Ağı) mimarisini YOLOv9 . GELAN, CSPNet ve ELAN'ın güçlü yönlerini birleştirerek parametre kullanımını optimize eder ve önceki nesillere kıyasla daha az FLOP ile üstün doğruluk sağlar.

YOLOv9 hakkında daha fazla bilgi edinin.

YOLOv6-3.0: Endüstriyel Optimizasyon

Meituan görme ekibi tarafından geliştirilen YOLOv6.YOLOv6, pratik endüstriyel uygulamalara büyük önem vermektedir. "Tam Ölçekli Yeniden Yükleme" olarak adlandırılan bu sürüm, eğitimi stabilize etmek için çapa tabanlı ve çapa içermeyen dedektörlerin avantajlarını birleştiren Çapa Destekli Eğitim (AAT) özelliğini sunmaktadır. Ayrıca, özellik füzyonunu iyileştirmek için Çift Yönlü Birleştirme (BiC) kullanan yenilenmiş bir boyun tasarımına sahiptir.

YOLOv6 , RepVGG tarzı yeniden parametreleştirmeyi yoğun bir şekilde kullanmasıyla YOLOv6 ve bu sayede karmaşık eğitim yapılarının daha basit ve daha hızlı çıkarım bloklarına dönüştürülmesini sağlar.

YOLOv6 hakkında daha fazla bilgi edinin.

Performans Karşılaştırması

Performans karşılaştırmasında, YOLOv9 benzer veya daha düşük hesaplama maliyetlerinde daha yüksek ortalama hassasiyet (mAP) gösterir. GELAN mimarisi, YOLOv9 görüntüleri yüksek verimlilikle YOLOv9 olanak tanır ve bu da onu yüksek hassasiyet gerektiren görevler için mükemmel bir seçim haline getirir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

YOLOv6, büyük ölçüde donanım dostu backbone sayesinde rekabetçi TensorRT sergilerken,YOLOv9 parametre başına daha yüksek doğruluk elde eder. Örneğin, YOLOv9m, YOLOv6.YOLOv6 doğruluk açısından geride bırakırken (51,4%'ye karşı 50,0%), önemli ölçüde daha az parametre kullanır (20,0 milyon'a karşı 34,9 milyon).

Ekosistem ve Kullanım Kolaylığı

Geliştiriciler için en önemli faktörlerden biri, modeli çevreleyen ekosistemdir. Ultralytics ve kütüphanesi bu konuda belirgin bir avantaj sağlar.

Ultralytics'in Avantajı

YOLOv9 , Ultralytics tamamen entegre YOLOv9 ve tüm makine öğrenimi operasyonları (MLOps) yaşam döngüsünü basitleştiren birleşik bir API sunar.

  • Basit Eğitim: YOLOv9 , sadece birkaç satırlık Python kodu ile özel veriler üzerinde eğitebilirsiniz.
  • Bellek Verimliliği: Ultralytics , eğitim sırasında GPU kullanımını azaltmak için optimize edilmiştir ve diğer depolarda sıkça görülen bellek yetersizliği (OOM) hatalarını önler.
  • Çok yönlülük: Ekosistem, aşağıdaki formatlara kolayca dışa aktarım yapılmasını destekler ONNX, OpenVINOve TensorRT.

Kolaylaştırılmış İş Akışı

Ultralytics kullanmak, bağımsız araştırma depolarını yapılandırmaya kıyasla önemli ölçüde mühendislik zamanından Ultralytics .

from ultralytics import YOLO

# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train on a custom dataset with default augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

Buna karşılık, YOLOv6 kullanmak YOLOv6 belirli Meituan deposunu klonlamayı, özel bir ortam kurmayı ve yapılandırma dosyalarını ve veri artırma boru hatlarını manuel olarak yönetmeyi gerektirir.

Gerçek Dünya Uygulamaları

Bu modeller arasında seçim yapmak genellikle dağıtım ortamınızın belirli kısıtlamalarına bağlıdır.

Yüksek Hassasiyetli Senaryolar (YOLOv9)

YOLOv9 anlamsal bilgileri saklama yeteneği, küçük ayrıntıların önemli olduğu zorlu algılama görevleri için ideal hale getirir.

  • Tıbbi Görüntüleme: Tümör tespiti gibi görevlerde, PGI mimarisi, aksi takdirde derin ağ katmanlarında kaybolabilecek zayıf özelliklerin korunmasına yardımcı olur.
  • Hava Gözetimi: Drone görüntülerinden araçlar veya insanlar gibi küçük nesneleri tespit etmek için YOLOv9 geliştirilmiş özellik koruma özelliği, geri çağırma oranlarını artırır.

Endüstriyel Otomasyon (YOLOv6.0)

YOLOv6 , donanımın sabit olduğu ve verimlilik öncelikli olan endüstriyel uygulamalar için özel olarak YOLOv6 .

  • Üretim Hatları: Kameraların konveyör bant üzerindeki parçaları incelediği pil üretimi gibi kontrollü ortamlarda, YOLOv6 TensorRT oldukça etkili YOLOv6 .

İleriye Bakış: YOLO26'nın Gücü

YOLOv9 YOLOv6.0 mükemmel modeller olsa da, bu alanda gelişmeler devam etmektedir. En son YOLO26 , hız, doğruluk ve kullanım kolaylığı arasında mükemmel dengeyi arayan geliştiriciler için mevcut en son teknolojiyi temsil etmektedir.

YOLO26, çığır açan çeşitli özellikler sunar:

  • Uçtan uca NMS: Non-Maximum Suppression (NMS) özelliğini kaldırarak, YOLO26 dağıtım süreçlerini basitleştirir ve gecikme değişkenliğini azaltır.
  • MuSGD Optimizer: Bir hibrit SGD ve Muon'un bir karışımı olan bu optimize edici, Büyük Dil Modeli (LLM) eğitiminden esinlenerek kararlılık iyileştirmeleri sağlar.
  • Geliştirilmiş Verimlilik: Dağıtım Odak Kaybı (DFL) ve diğer optimizasyonların kaldırılmasıyla YOLO26, %43'e kadar daha hızlı CPU ulaşarak Raspberry Pi gibi uç cihazlar için mükemmel bir seçim haline gelmiştir.
  • Görev Çok Yönlülüğü: Algılamanın ötesinde, YOLO26 poz tahmini (Kalan Log-Olasılık Tahmini kullanarak) ve segmentasyon için özel iyileştirmeler sunar.

YOLO26 hakkında daha fazla bilgi edinin

Sonuç

Her ikisi de YOLOv9 ve YOLOv6.YOLOv6 etkileyici yetenekler sunar. YOLOv6.0, TensorRT belirli endüstriyel iş akışları için güçlü bir rakip olmaya devam ediyor. Ancak, çoğu araştırmacı ve geliştirici için YOLOv9 üstün parametre verimliliği ve doğruluğu sunar. Ayrıca, Ultralytics bir parçası olması, uzun vadeli destek, önceden eğitilmiş ağırlıklara kolay erişim ve YOLO26 gibi daha yeni mimarilere sorunsuz bir yükseltme yolu sağlar.

Referanslar

  1. YOLOv9: Wang, C.-Y. ve Liao, H.-Y. M. (2024). "YOLOv9: Programlanabilir Gradyan Bilgisini Kullanarak Öğrenmek İstediğinizi Öğrenin." arXiv:2402.13616.
  2. YOLOv6 .0: Li, C., et al. (2023). "YOLOv6 .0: Tam Ölçekli Yeniden Yükleme." arXiv:2301.05586.
  3. Ultralytics :ultralytics

Yorumlar