YOLO11 - YOLOv5: Son Teknoloji Nesne Algılamanın Evrimi
Gerçek zamanlı nesne algılamanın evrimi, Ultralytics YOLO serisi tarafından önemli ölçüde şekillendirilmiştir. 2020'de piyasaya sürülen YOLOv5, kullanım kolaylığı, hız ve güvenilirlik açısından küresel bir standart belirleyerek tarihteki en çok dağıtılan vizyon yapay zeka modellerinden biri haline gelmiştir. En son yineleme olan YOLO11, eşi görülmemiş doğruluk, verimlilik ve çok yönlülük sunmak için bu efsanevi temelin üzerine inşa edilmiştir.
Bu kılavuz, geliştiricilerin ve araştırmacıların mimari değişimleri, performans kazanımlarını ve her biri için ideal kullanım durumlarını anlamalarına yardımcı olmak amacıyla bu iki güçlü araç arasındaki ayrıntılı bir teknik karşılaştırmayı sunar.
Performans Analizi
YOLO11 ve YOLOv5 arasındaki performans farkı, sinir ağı tasarımındaki hızlı gelişmeleri vurgulamaktadır. YOLOv5 yetenekli bir model olmaya devam ederken, YOLO11 özellikle CPU çıkarım hızı ve tespit doğruluğu açısından tüm model ölçeklerinde sürekli olarak daha iyi performans göstermektedir.
Temel Performans Metrikleri
Aşağıdaki tablo, COCO veri kümesi üzerinde doğrudan bir karşılaştırma sunmaktadır. Kritik bir gözlem, 39.5 mAP değerine ulaşan ve YOLOv5n'in 28.0 mAP değerini önemli ölçüde aşarken CPU donanımında da daha hızlı çalışan YOLO11n'nin verimliliğidir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Doğruluk - Verimlilik Karşılaştırması
YOLO11, "verimlilik ve doğruluk" dengesinde bir paradigma değişikliğini temsil eder.
- Küçük Nesne Tespiti: YOLO11, geliştirilmiş özellik çıkarma katmanları sayesinde YOLOv5'e kıyasla küçük nesnelerin tespitini önemli ölçüde iyileştirir.
- Hesaplama Verimliliği: YOLO11l, yalnızca 25.3M parametre ile 53.4 mAP'ye ulaşır. Buna karşılık, YOLOv5l daha düşük bir 49.0 mAP'ye ulaşmak için 53.2M parametre gerektirir. Daha yüksek doğruluk için %50'lik bu parametre azalması, daha düşük bellek kullanımı ve daha hızlı eğitim süreleri anlamına gelir.
Anchorsız - Anchor Tabanlı Karşılaştırması
En önemli teknik farklılıklardan biri, detect baş mekanizmasıdır. YOLOv5, optimum performansı elde etmek için belirli veri kümeleri için ayarlanması gereken önceden tanımlanmış bağlantı kutuları gerektiren bağlantı tabanlı bir yaklaşım kullanır.
YOLO11, anchor-free (bağlantı kutusuz) bir tasarım kullanır. Bu, manuel bağlantı kutusu hesaplama ihtiyacını ortadan kaldırır, eğitim hattını basitleştirir ve hiperparametre ayarlaması olmadan çeşitli veri kümelerinde genelleştirmeyi iyileştirir.
Model Mimarisi ve Tasarımı
Bu iki model arasındaki mimari farklılıklar, bilgisayar görüşü araştırmasının yıllar içindeki gelişimini yansıtmaktadır.
YOLOv5: Kanıtlanmış Standart
YOLOv5, nesne algılamayı kitlelere erişilebilir kılan kullanıcı dostu bir PyTorch uygulaması sundu.
- Backbone: Modern alternatiflerden daha ağır olmasına rağmen oldukça etkili olan değiştirilmiş bir CSPDarknet53 kullanır.
- Odak: 2020'deki lansmanında devrim niteliğinde olan hız ve doğruluk dengesine öncelik verdi.
- Eski: Belirli girdi/çıktı formatlarıyla zaten derinlemesine entegre edilmiş sistemler için "güvenli bir seçim" olmaya devam ediyor.
YOLOv5 hakkında daha fazla bilgi edinin
YOLO11: En Son Teknoloji
YOLO11, özellik yeniden kullanımını en üst düzeye çıkarmak ve hesaplama yükünü en aza indirmek için en son derin öğrenme tekniklerini entegre eder.
- C3k2 Bloğu: CSP darboğazının bir evrimi olan bu blok, daha verimli gradyan akışı ve özellik füzyonuna olanak tanır.
- C2PSA Modülü: Uzamsal dikkat mekanizmalarını tanıtarak modelin daha iyi nesne lokalizasyonu için görüntünün kritik alanlarına odaklanmasını sağlar.
- Çoklu Görev Başlığı: Farklı görevler için ayrı model çatalları gerektiren YOLOv5'in aksine, YOLO11 yerel olarak birleşik bir çerçevede Nesne Algılama, Örnek Segmentasyonu, Poz Tahmini, Yönlendirilmiş Sınırlayıcı Kutular (OBB) ve Sınıflandırmayı destekler.
YOLO11 hakkında daha fazla bilgi edinin
Karşılaştırma Tablosu: Teknik Özellikler
| Özellik | YOLOv5 | YOLO11 |
|---|---|---|
| Mimari | CSPDarknet Backbone | C3k2 ve C2PSA ile Gelişmiş Backbone |
| Tespit Başlığı | Anchor Tabanlı | Anchorsız |
| Görevler | Detect, Segment, Classify | Detect, Segment, Classify, Pose, OBB, Track |
| Lisans | AGPL-3.0 | AGPL-3.0 |
| Yayın Tarihi | Haziran 2020 | Eylül 2024 |
| Kullanım Kolaylığı | Yüksek (Komut Satırı ve PyTorch Hub) | Çok Yüksek (Birleşik python SDK ve CLI) |
Eğitim ve Ekosistem
Her iki model de veri yönetimi, eğitim ve dağıtım için sorunsuz araçlar sağlayan güçlü Ultralytics ekosisteminden yararlanır.
Eğitim Verimliliği
YOLO11, YOLOv5'ten daha hızlı eğitilecek ve daha hızlı yakınsayacak şekilde tasarlanmıştır.
- Akıllı Varsayılanlar: Ultralytics motoru, veri kümesine ve model boyutuna göre hiperparametreleri otomatik olarak yapılandırır ve manuel hiperparametre ayarlama ihtiyacını azaltır.
- Bellek Kullanımı: Azaltılmış parametre sayısı sayesinde, YOLO11 modelleri genellikle eğitim sırasında daha az GPU VRAM'i tüketir ve bu da tüketici donanımında daha büyük toplu iş boyutlarına olanak tanır.
Kod Örneği: YOLO11 Eğitimi
YOLO11'i eğitmek, aşağıdakiler kullanılarak kolaylaştırılmıştır: ultralytics Python paketi. Aşağıdaki örnek, COCO8 veri kümesi üzerinde bir YOLO11n modelinin nasıl eğitileceğini göstermektedir.
from ultralytics import YOLO
# Load a pre-trained YOLO11n model
model = YOLO("yolo11n.pt")
# Train the model
# The device argument can be 'cpu', 0 for GPU, or [0, 1] for multi-GPU
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)
Ekosistem Entegrasyonu
YOLOv5 , yaşı nedeniyle geniş bir üçüncü taraf öğretici koleksiyonuna sahipken, YOLO11 modern Ultralytics paketine yerel olarak entegre edilmiştir. Bu, gelişmiş özelliklere anında erişim sağlar:
- Tek Tıkla Dışa Aktarma: Tek bir komutla ONNX, OpenVINO, TensorRT ve CoreML'ye aktarın.
- İzleme: Harici depolara ihtiyaç duymadan nesne izleme (BoT-SORT, ByteTrack) için yerleşik destek.
- Gezgin: SQL ve semantik arama kullanarak veri kümelerinizi görselleştirmek ve sorgulamak için Ultralytics Gezgini API'sini kullanın.
İdeal Kullanım Senaryoları
Doğru modeli seçmek, projenizin belirli kısıtlamalarına ve gereksinimlerine bağlıdır.
Ne Zaman YOLO11 Seçmeli
YOLO11, yeni projelerin %95'i için önerilen seçimdir.
- Yeni Gelişmeler: Sıfırdan başlıyorsanız, YOLO11 en iyi geleceğe dönüklüğü, doğruluğu ve hızı sunar.
- CPU Dağıtımı: CPU üzerinde çalışan uç cihazlar (örneğin, Raspberry Pi, cep telefonları) için YOLO11n, YOLOv5n'den önemli ölçüde daha hızlı ve daha doğrudur.
- Karmaşık Görevler: Poz Tahmini veya OBB (örneğin, hava görüntüleme, belge analizi) gerektiren projeler, YOLO11 tarafından yerel olarak desteklenir.
- Bulut & Sunucu: YOLO11'in yüksek verimi, büyük video akışlarını gerçek zamanlı olarak işlemek için idealdir.
Ne Zaman YOLOv5'e Bağlı Kalınmalı
YOLOv5, belirli eski senaryolar için uygun bir seçenek olmaya devam ediyor.
- Eski Bakım: Belirli YOLOv5 kod tabanı veya çıktı formatıyla yakından bağlantılı bir üretim sisteminiz varsa.
- Belirli Donanım Ayarı: Bazı eski gömülü hızlandırıcılar, özellikle YOLOv5 katmanları için yüksek düzeyde optimize edilmiş bir ürün yazılımına sahip olabilir (OpenVINO gibi çoğu modern çalışma zamanı artık daha yeni mimarileri tercih etse de).
- Akademik Temel Çizgi: Araştırmacılar, geçmiş temel çizgilerle karşılaştırma yaparken, literatürdeki uzun süredir devam eden varlığı nedeniyle genellikle YOLOv5'i referans gösterir.
YOLO11'e Geçiş
YOLOv5'ten YOLO11'e geçiş basittir. Veri kümesi formatı (YOLO TXT) aynı kalır, yani mevcut etiketli veri kümelerinizi değiştirmeden yeniden kullanabilirsiniz. Python API yapısı da çok benzerdir ve genellikle yalnızca model adı dizesinde bir değişiklik yapılması gerekir (örn. yolov5su.pt için yolo11n.pt içinde ultralytics paketi).
Diğer Seçenekleri Keşfetme
Ultralytics, yalnızca YOLO11 ve YOLOv5'in ötesinde geniş bir model yelpazesini destekler. Belirli ihtiyaçlarınıza bağlı olarak şunları düşünebilirsiniz:
- YOLOv8: Harika özellik dengesi ve geniş endüstriyel benimseme sunan YOLO11'in doğrudan selefi.
- YOLOv10: Belirli gerçek zamanlı uygulamalarda daha düşük gecikme için NMS'siz eğitime odaklanan bir mimari.
- RT-DETR: Çıkarım hızının maksimum hassasiyetten daha az kritik olduğu durumlarda doğrulukta öne çıkan, dönüştürücü tabanlı bir dedektör.
- YOLOv9: Programlanabilir Gradyan Bilgisi (PGI) konseptiyle bilinir ve zorlu detect görevlerinde güçlü performans sunar.
Sonuç
YOLOv5'ten YOLO11'e geçiş, bilgisayar görüşü tarihinde önemli bir dönüm noktasıdır. YOLOv5, yapay zekayı demokratikleştirerek nesne algılamayı herkes için erişilebilir hale getirdi. YOLO11, daha hızlı, daha hafif ve daha doğru bir model sunarak bu vizyonu mükemmelleştiriyor.
Watt başına mutlak en iyi performansı ve en çok yönlü özellik setini arayan geliştiriciler için YOLO11 açık ara kazanandır. Aktif Ultralytics ekosistemine entegrasyonu, yapay zeka yolculuğunuzu desteklemek için en son araçlara, basit API'lere ve gelişen bir topluluğa erişmenizi sağlar.
Yükseltmeye hazır mısınız? Başlamak için YOLO11 Belgelerine göz atın veya GitHub deposunu keşfedin.