YOLO11 vs YOLOv5: Son Teknoloji Nesne Tespitinin Evrimi
Gerçek zamanlı nesne tespitinin evrimi, Ultralytics YOLO serisi tarafından önemli ölçüde şekillendirilmiştir. YOLOv52020 yılında piyasaya sürülen YOLO11, kullanım kolaylığı, hız ve güvenilirlik açısından küresel bir standart belirleyerek tarihte en çok kullanılan görsel yapay zeka modellerinden biri haline geldi. YOLO11en son yineleme, benzeri görülmemiş doğruluk, verimlilik ve çok yönlülük sunmak için bu efsanevi temele dayanmaktadır.
Bu kılavuz, bu iki güç merkezi arasında ayrıntılı bir teknik karşılaştırma sunarak geliştiricilerin ve araştırmacıların her biri için mimari değişimleri, performans kazanımlarını ve ideal kullanım durumlarını anlamalarına yardımcı olur.
Performans Analizi
YOLO11 ve YOLOv5 arasındaki performans farkı, sinir ağı tasarımındaki hızlı gelişmeleri vurgulamaktadır. YOLOv5 yetenekli bir model olmaya devam ederken, YOLO11 özellikle CPU çıkarım hızı ve tespit doğruluğu açısından tüm model ölçeklerinde sürekli olarak daha iyi performans göstermektedir.
Temel Performans Ölçütleri
Aşağıdaki tabloda COCO veri kümesi üzerinde bire bir karşılaştırma sunulmaktadır. Kritik bir gözlem, YOLOv5n'in 28,0 mAP değerini önemli ölçüde aşarak 39,5 mAP değerine ulaşan ve aynı zamanda CPU donanımında daha hızlı çalışan YOLO11n'in verimliliğidir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Doğruluk ve Verimlilik
YOLO11 , "verimlilik ve doğruluk" dengesinde bir paradigma değişimini temsil etmektedir.
- Küçük Nesne Algılama: YOLO11 , rafine edilmiş özellik çıkarma katmanları sayesinde küçük nesnelerin tespitini YOLOv5'e kıyasla önemli ölçüde geliştirir.
- Hesaplama Verimliliği: YOLO11l sadece 25,3M parametre ile 53,4 mAP elde eder. Buna karşılık, YOLOv5l 49.0'lık daha düşük bir mAP 'ye ulaşmak için 53.2M parametre gerektirir. Daha yüksek doğruluk için parametrelerdeki bu %50 azalma, daha düşük bellek kullanımı ve daha hızlı eğitim süreleri anlamına gelir.
Ankrajsız vs Ankraj Tabanlı
En önemli teknik farklılıklardan biri algılama başlığı mekanizmasıdır. YOLOv5 optimum performans elde etmek için belirli veri kümeleri için ayarlanması gereken önceden tanımlanmış bağlantı kutuları gerektiren çapa tabanlı bir yaklaşım kullanır.
YOLO11çapasız bir tasarım kullanmaktadır. Bu, manuel çapa kutusu hesaplama ihtiyacını ortadan kaldırır, eğitim hattını basitleştirir ve hiperparametre ayarı olmadan çeşitli veri kümelerinde genelleştirmeyi geliştirir.
Model Mimarisi ve Tasarımı
Bu iki model arasındaki mimari farklılıklar, bilgisayarla görme araştırmalarının birkaç yıl içindeki ilerlemesini yansıtmaktadır.
YOLOv5: Kanıtlanmış Standart
YOLOv5 nesne algılamayı kitleler için erişilebilir hale getiren kullanıcı dostu bir PyTorch uygulaması sundu.
- Backbone: Oldukça etkili olan ancak modern alternatiflere göre hesaplama açısından daha ağır olan değiştirilmiş bir CSPDarknet53 kullanır.
- Odaklanma: 2020'de piyasaya sürüldüğünde devrim niteliğinde olan hız ve doğruluk dengesine öncelik verildi.
- Eski: Kendine özgü giriş/çıkış formatlarıyla zaten derinlemesine entegre olmuş sistemler için "güvenli bir seçim" olmaya devam etmektedir.
YOLOv5 hakkında daha fazla bilgi edinin
YOLO11: Son Teknoloji
YOLO11 özelliklerin yeniden kullanımını en üst düzeye çıkarmak ve hesaplama yükünü en aza indirmek için en yeni derin öğrenme tekniklerini entegre eder.
- C3k2 Bloğu: CSP darboğazının bir evrimi olan bu blok, daha verimli gradyan akışı ve özellik füzyonu sağlar.
- C2PSA Modülü: Modelin daha iyi nesne lokalizasyonu için görüntünün kritik alanlarına odaklanmasını sağlayan uzamsal dikkat mekanizmalarını tanıtır.
- Çoklu Görev Başlığı: Farklı görevler için ayrı model çatalları gerektiren YOLOv5'in aksine, YOLO11 Nesne Algılama, Örnek Segmentasyonu, Poz Tahmini, Yönlendirilmiş Sınırlayıcı Kutular (OBB) ve Sınıflandırmayı birleşik bir çerçevede yerel olarak destekler.
YOLO11 hakkında daha fazla bilgi edinin
Karşılaştırma Tablosu: Teknik Özellikler
| Özellik | YOLOv5 | YOLO11 |
|---|---|---|
| Mimari | CSPDarknet Backbone | C3k2 & C2PSA ile Rafine Backbone |
| Tespit Başlığı | Çapa Tabanlı | Çapasız |
| Görevler | Algıla, Segmente Et, Sınıflandır | Algıla, Segmente Et, Sınıflandır, Poz, OBB, Takip Et |
| Lisans | AGPL-3.0 | AGPL-3.0 |
| Çıkış Tarihi | Haziran 2020 | Eylül 2024 |
| Kullanım Kolaylığı | Yüksek (Komut Satırı ve PyTorch Hub) | Çok Yüksek (Birleşik Python SDK & CLI) |
Eğitim ve Ekosistem
Her iki model de veri yönetimi, eğitim ve dağıtım için sorunsuz araçlar sağlayan sağlam Ultralytics ekosisteminden yararlanır.
Eğitim Verimliliği
YOLO11 , YOLOv5'e göre daha hızlı eğitmek ve daha hızlı yakınsamak için tasarlanmıştır.
- Akıllı Varsayılanlar: Ultralytics motoru, veri kümesine ve model boyutuna göre hiperparametreleri otomatik olarak yapılandırarak manuel hiperparametre ayarlama ihtiyacını azaltır.
- Bellek Kullanımı: Azaltılmış parametre sayısı sayesinde, YOLO11 modelleri eğitim sırasında genellikle daha az GPU VRAM tüketir ve tüketici donanımında daha büyük parti boyutlarına izin verir.
Kod Örneği: Eğitim YOLO11
YOLO11 'i eğitmek için ultralytics Python paketi. Aşağıdaki örnekte COCO8 veri kümesi üzerinde bir YOLO11n modelinin nasıl eğitileceği gösterilmektedir.
from ultralytics import YOLO
# Load a pre-trained YOLO11n model
model = YOLO("yolo11n.pt")
# Train the model
# The device argument can be 'cpu', 0 for GPU, or [0, 1] for multi-GPU
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)
Ekosistem Entegrasyonu
YOLOv5 , yaşı nedeniyle geniş bir üçüncü taraf öğretici koleksiyonuna sahipken, YOLO11 modern Ultralytics paketine yerel olarak entegre edilmiştir. Bu, gelişmiş özelliklere anında erişim sağlar:
- Tek Tıkla Dışa Aktarma: Dışa aktar ONNX, OpenVINO, TensorRT ve CoreML 'yi tek bir komutla kullanabilirsiniz.
- İzleme: Harici depolar olmadan nesne izleme (BoT-SORT, ByteTrack) için yerleşik destek.
- Explorer: SQL ve semantik arama kullanarak veri kümelerinizi görselleştirmek ve sorgulamak için Ultralytics Explorer API'sini kullanın.
İdeal Kullanım Senaryoları
Doğru modeli seçmek, projenizin özel kısıtlamalarına ve gereksinimlerine bağlıdır.
YOLO11 Ne Zaman Seçilmeli
YOLO11 , yeni projelerin %95'i için önerilen seçimdir.
- Yeni Gelişmeler: Sıfırdan başlıyorsanız, YOLO11 en iyi gelecek güvencesini, doğruluğu ve hızı sunar.
- CPU Dağıtımı: CPU üzerinde çalışan uç cihazlar (örneğin, Raspberry Pi, cep telefonları) için YOLO11n, YOLOv5n'den önemli ölçüde daha hızlı ve daha doğrudur.
- Karmaşık Görevler: Poz Tahmini veya OBB gerektiren projeler (örn. hava görüntüleri, belge analizi) YOLO11 tarafından yerel olarak desteklenmektedir.
- Bulut ve Sunucu: YOLO11 'in yüksek verimi, onu devasa video akışlarını gerçek zamanlı olarak işlemek için ideal hale getirir.
YOLOv5'e Ne Zaman Bağlı Kalınmalı
YOLOv5 , belirli eski senaryolar için uygulanabilir bir seçenek olmaya devam etmektedir.
- Eski Bakım: Belirli bir YOLOv5 kod tabanı veya çıktı formatı ile yoğun bir şekilde birleştirilmiş bir üretim sisteminiz varsa.
- Özel Donanım Ayarlama: Bazı eski gömülü hızlandırıcılar, YOLOv5 katmanları için özel olarak onaylanmış yüksek düzeyde optimize edilmiş donanım yazılımına sahip olabilir ( OpenVINO gibi çoğu modern çalışma zamanı artık daha yeni mimarileri tercih etse de).
- Akademik Temel: Tarihsel temellerle karşılaştırma yapan araştırmacılar, literatürde uzun süredir var olması nedeniyle genellikle YOLOv5 'e atıfta bulunurlar.
YOLO11'e geçiş
YOLOv5 'ten YOLO11 'e geçiş yapmak kolaydır. Veri kümesi formatıYOLO TXT) aynı kalır, yani mevcut açıklamalı veri kümelerinizi değişiklik yapmadan yeniden kullanabilirsiniz. Python API yapısı da çok benzerdir ve genellikle yalnızca model adı dizesinde bir değişiklik gerektirir (örn. yolov5su.pt için yolo11n.pt içinde ultralytics paketi).
Diğer Seçenekleri Keşfetmek
Ultralytics , sadece YOLO11 ve YOLOv5'in ötesinde çok çeşitli modelleri destekler. Özel ihtiyaçlarınıza bağlı olarak, düşünebilirsiniz:
- YOLOv8: YOLO11'in doğrudan selefi, harika bir özellik dengesi ve geniş bir endüstri benimsemesi sunuyor.
- YOLOv10: Belirli gerçek zamanlı uygulamalarda daha düşük gecikme süresi için NMS'siz eğitime odaklanan bir mimari.
- RT-DETR: Çıkarım hızının maksimum hassasiyetten daha az kritik olduğu durumlar için doğrulukta üstün olan transformatör tabanlı bir dedektör.
- YOLOv9: Zor tespit görevlerinde güçlü performans sunan Programlanabilir Gradyan Bilgisi (PGI) konseptiyle tanınır.
Sonuç
YOLOv5 'ten YOLO11 'e geçiş, bilgisayarla görme tarihinde önemli bir kilometre taşına işaret ediyor. YOLOv5 yapay zekayı demokratikleştirerek nesne algılamayı herkes için erişilebilir hale getirdi. YOLO11 daha hızlı, daha hafif ve daha doğru bir model sunarak bu vizyonu mükemmelleştiriyor.
Watt başına mutlak en iyi performansı ve en çok yönlü özellik setini arayan geliştiriciler için YOLO11 açık bir kazanandır. Aktif Ultralytics ekosistemine entegrasyonu, yapay zeka yolculuğunuzu desteklemek için en yeni araçlara, basit API'lere ve gelişen bir topluluğa erişmenizi sağlar.
Yükseltmeye hazır mısınız? Hemen başlamak için YOLO11 Dokümantasyonuna göz atın veya GitHub deposunu keşfedin.