Link to this sectionYOLOv9 ve YOLOv6-3.0#
Gerçek zamanlı nesne algılamanın evrimi, sinir ağı mimarilerindeki sürekli yeniliklerle, çıkarım hızı, doğruluk ve hesaplama verimliliği arasındaki hassas dengenin optimize edilmesiyle yönlendirilmiştir. Geliştiriciler ve araştırmacılar bilgisayarlı görü çerçevelerinin kalabalık ortamında gezinirken, iş için doğru aracı seçmek adına önde gelen mimarileri karşılaştırmak esastır.
Bu teknik kılavuz, oldukça yetenekli iki model arasında derinlemesine bir karşılaştırma sunar: Derin öğrenme bilgi tutma kapasitesiyle tanınan YOLOv9 ve endüstriyel uygulamalar için özel olarak tasarlanmış YOLOv6-3.0.
Link to this sectionYOLOv9'a Genel Bakış: Özellik Tutma Kapasitesini En Üst Düzeye Çıkarma#
2024'ün başlarında tanıtılan YOLOv9, derin sinir ağlarındaki en kalıcı zorluklardan birini ele alıyor: ileri beslemeli süreç sırasında bilgi kaybı. Gradyanların güvenilir olmasını ve özellik haritalarının kritik verileri korumasını sağlayarak, teorik doğruluk sınırlarını zorlar.
- Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
- Kuruluş: Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
- Tarih: 21 Şubat 2024
- Bağlantılar: Arxiv Makalesi, GitHub Deposu
Link to this sectionMimari ve Metodolojiler#
YOLOv9, Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN) ile birlikte Programlanabilir Gradyan Bilgisi (PGI) kavramını tanıtır. PGI, ana ağın çıkarım ek yükü eklemeden sağlam, güvenilir özellikler öğrenmesini sağlayan yardımcı denetim sağlayarak bilgi darboğazını ele alır. Bu arada GELAN, parametre kullanımını optimize ederek modelin, hesaplama maliyetini yönetilebilir tutarken en son teknoloji ortalama Hassasiyet (mAP) değerine ulaşmasını sağlar. Bu, onu tıbbi görüntü analizi veya özellik sadakatinin kritik olduğu son derece küçük nesnelerin algılanması için olağanüstü bir seçim haline getirir.
YOLOv9 hakkında daha fazla bilgi edin
Link to this sectionYOLOv6-3.0'a Genel Bakış: Endüstriyel Ölçek İçin İnşa Edilmiştir#
Meituan tarafından geliştirilen YOLOv6-3.0 (v3.0 olarak da bilinir), ağır hizmet tipi endüstriyel uygulamalara hizmet etmek için temelden tasarlanmıştır. 2023'ün başlarında piyasaya sürülen model, uç donanımlarda mükemmel performans gösteren niceleme dostu bir model paketi sunarak dağıtım verimliliğine büyük ölçüde odaklanır.
- Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
- Kuruluş: Meituan
- Tarih: 13 Ocak 2023
- Bağlantılar: Arxiv Makalesi, GitHub Deposu
Link to this sectionMimari ve Metodolojiler#
YOLOv6-3.0, RepOptimizer ve Çapa Destekli Eğitim (AAT) stratejileriyle öne çıkar. Model, RepVGG'den ilham alan donanım farkında bir sinir ağı tasarımı kullanır ve bu tasarım, katmanları birleştirerek çıkarım sırasında GPU'larda son derece hızlı çalışmasını sağlar. 3.0 güncellemesi, yerelleştirme doğruluğunu artırmak için Çift Yönlü Birleştirme (BiC) modülü tanıtarak mimariyi daha da geliştirmiştir. TensorRT ve OpenVINO gibi dağıtım biçimleri için yüksek düzeyde optimize edildiğinden, YOLOv6-3.0 lojistik, üretim otomasyonu ve yüksek verimli sunucu ortamlarında sıklıkla benimsenir.
YOLOv6-3.0 hakkında daha fazla bilgi edin
Link to this sectionPerformans Karşılaştırması#
Bu modelleri standart COCO veri kümesinde değerlendirirken, doğruluk ve ham çıkarım hızı arasındaki belirgin dengeleri gözlemleyebiliriz.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Link to this sectionTeknik Analiz#
YOLOv6-3.0n, T4 donanımında ham hız (1.17ms) konusunda liderliği alırken, YOLOv9t parametrelerin yarısından azını (2.0M'ye karşı 4.7M) ve önemli ölçüde daha az FLOP kullanarak biraz daha yüksek mAP (%38.3) elde etmeyi başarır. Karmaşık, yüksek doğruluk gereksinimleri için devasa YOLOv9e, PGI mimarisinin derin ağlardaki gücünü göstererek doğruluğu %55.6 mAP seviyesine taşır.
Yeni bir bilgisayarlı görü girişimi başlatıyorsan, YOLO26 kullanmanı şiddetle tavsiye ederiz. 2026'da piyasaya sürülen model, işlem sonrası gecikmeyi tamamen ortadan kaldıran ve %43'e Kadar Daha Hızlı CPU Çıkarımı sağlayan yerel bir Uçtan Uca NMS'siz Tasarım özelliğine sahiptir.
Link to this sectionUltralytics Ekosistemi Avantajı#
Hangi modelin mimari felsefesi sana hitap ederse etsin, bunları Ultralytics Python API aracılığıyla yerel olarak uygulamak, üstün bir geliştirici deneyimi sağlar.
Link to this sectionKullanım Kolaylığı ve Eğitim Verimliliği#
Karmaşık derin öğrenme modellerini eğitmek geleneksel olarak büyük miktarda standart kod gerektirir. Ultralytics Platformu bu karmaşıklıkları soyutlar. İster kusur tespiti için YOLOv9'da ince ayar yap, ister mobil uygulamalar için YOLOv6'yı dışa aktar, iş akışı son derece tutarlı kalır.
Dahası, Ultralytics mimarileri genellikle eğitim sırasında hantal Transformer tabanlı modellere kıyasla daha düşük CUDA bellek gereksinimlerine sahiptir. Bu, geliştiricilerin tüketici sınıfı GPU'larda daha büyük yığın boyutları kullanmasına olanak tanıyarak eğitim verimliliğini büyük ölçüde artırır.
from ultralytics import YOLO
# Easily swap architectures by changing the weights file string
# model = YOLO("yolov6n.pt")
model = YOLO("yolov9c.pt")
# Train the model with built-in data augmentation and caching
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="0")
# Export to ONNX or TensorRT seamlessly
model.export(format="engine", quantize=16)Link to this sectionGörü Görevlerinde Eşsiz Çok Yönlülük#
YOLOv6-3.0 hızlı sınırlayıcı kutu üretimi için yoğun bir şekilde optimize edilmiş olsa da, modern bilgisayarlı görü projeleri genellikle çok görevli bir yaklaşım gerektirir. Ultralytics modelleri, aşırı çok yönlülükleri ile ünlüdür. Ultralytics YOLOv8 ve daha yeni olan YOLO26 gibi araçlarla, tek bir çerçeve nesne algılama, örnek segmentasyonu, görüntü sınıflandırma, poz tahmini ve yönlendirilmiş sınırlayıcı kutuları (OBB) sorunsuz bir şekilde gerçekleştirir.
Link to this sectionYOLO26 ile Tanışın: Yeni Standart#
Hem performansı hem de dağıtım kolaylığını en üst düzeye çıkarmak isteyen kuruluşlar için YOLO26, hız ve doğruluğun nihai birleşimini temsil eder.
YOLO11 başarılarının üzerine inşa edilen YOLO26, paradigma değiştiren birkaç özellik sunar:
- MuSGD Optimize Edici: Moonshot AI'ın Kimi K2'si gibi Büyük Dil Modeli (LLM) eğitim tekniklerinden esinlenen bu hibrit optimize edici, inanılmaz derecede kararlı eğitim ve hızlı yakınsama sağlar.
- DFL Kaldırma: Distribution Focal Loss'u çıkararak, YOLO26 dışa aktarma grafiğini basitleştirir ve onu düşük güçlü edge computing çipleriyle önemli ölçüde daha uyumlu hale getirir.
- ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, drone operasyonları ve IoT uygulamaları için kritik olan küçük nesne tanıma konusunda kayda değer iyileştirmeler sağlar.
- Göreve Özel İyileştirmeler: YOLO26, segmentasyon için yerel çok ölçekli prototipleme, iskelet takibi için Artık Log-Olabilirlik Tahmini (RLE) ve OBB algılamasındaki uç durumları çözmek için özel açı kayıp algoritmaları içerir.
Link to this sectionİdeal Dağıtım Senaryoları#
Doğru mimariyi seçmek nihayetinde üretim kısıtlamalarına bağlıdır.
Endüstriyel üretimde yerleşik bir hattın varsa, büyük ölçüde nicelemeye güveniyorsan ve mutlak en düşük milisaniye altı donanım gecikmesine ihtiyaç duyduğun özel çıkarım hızlandırıcıları kullanıyorsan YOLOv6-3.0'ı seç.
Karmaşık healthcare diagnostics veya ince, piksel düzeyindeki özellikleri kaçırmanın bir seçenek olmadığı uzun menzilli gözetim işleriyle uğraşıyorsan YOLOv9'u seç.
Bununla birlikte, basitleştirilmiş, NMS'siz dağıtımla birlikte en son teknoloji doğruluğu sunan mükemmel dengeli bir yaklaşım için, Ultralytics YOLO26 modern bilgisayarlı görü mühendisliği için kesin öneridir. Aktif geliştirme döngüsü, kapsamlı belgeleri ve canlı topluluk desteği, onu hem araştırmacılar hem de geliştiriciler için vazgeçilmez bir araç haline getirir.