YOLO11 - YOLOv6-3.0 karşılaştırması: Son Teknoloji Nesne Tespiti Karşılaştırması
Optimal bilgisayar görüşü modelini seçmek, yapay zeka uygulamalarının verimliliğini, doğruluğunu ve ölçeklenebilirliğini etkileyen çok önemli bir karardır. Bu kılavuz, Ultralytics YOLO11 ve YOLOv6-3.0'ı karşılaştıran kapsamlı bir teknik analiz sunmaktadır. Mimari yeniliklerini, performans kıyaslamalarını, eğitim metodolojilerini ve çeşitli gerçek dünya dağıtım senaryolarına uygunluğunu inceliyoruz. Her iki çerçeve de alana önemli katkılarda bulunmuş olsa da, YOLO11 verimlilik, çok yönlülük ve kullanıcı deneyimindeki en son evrimi temsil etmektedir.
Ultralytics YOLO11
Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş: Ultralytics
Tarih: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Belgeler: https://docs.ultralytics.com/models/yolo11/
YOLO11, Ultralytics tarafından 2024'ün sonlarında piyasaya sürülen YOLO (You Only Look Once) serisinin en son evrimidir. YOLOv8 gibi önceki modellerin başarısını temel alarak, hesaplama maliyetlerini en aza indirirken performansı en üst düzeye çıkarmak için tasarlanmış, geliştirilmiş bir mimari sunar. YOLO11, otomotivden sağlık hizmetlerine kadar çeşitli endüstriler için çok yönlü bir çözüm olarak konumlandırılarak, çok çeşitli bilgisayar görüsü görevlerini yerine getirmek için tasarlanmıştır.
Mimari ve Temel Özellikler
YOLO11'in mimarisi, özellik çıkarımını ve işleme verimliliğini artırmaya odaklanır. Gereksiz hesaplamaları azaltan geliştirilmiş bir backbone ve boyun tasarımı içerir ve hem uç cihazlarda hem de bulut sunucularında daha hızlı çıkarım hızlarına olanak tanır. Bir bağlantısız dedektör olarak YOLO11, manuel bağlantı kutusu yapılandırmasına olan ihtiyacı ortadan kaldırır, eğitim hattını basitleştirir ve çeşitli nesne şekillerine uyarlanabilirliği artırır.
Güçlü Yönler
- Rakipsiz Performans Dengesi: YOLO11, karşılaştırılabilir modellere göre önemli ölçüde daha az parametre ve FLOPs ile daha yüksek ortalama Ortalama Hassasiyet (mAP) sunar. Bu verimlilik, depolama gereksinimlerini azaltır ve işleme sürelerini hızlandırır.
- Kapsamlı Çok Yönlülük: Sınırlandırma kutularıyla sınırlı birçok dedektörün aksine, YOLO11 tek bir çerçeve içinde yerel olarak nesne tespiti, örnek segmentasyonu, görüntü sınıflandırması, poz tahmini ve yönlendirilmiş sınırlandırma kutularını (OBB) destekler.
- Akıcı Ekosistem: Kullanıcılar, kullanıcı dostu bir Python API, kodsuz eğitim için Ultralytics HUB ile sorunsuz entegrasyon ve kapsamlı topluluk desteği içeren güçlü Ultralytics ekosisteminden yararlanır.
- Eğitim Verimliliği: Model, daha hızlı yakınsama ve eğitim sırasında daha düşük bellek kullanımı için optimize edilmiştir. Bu, genellikle önemli miktarda GPU belleği gerektiren transformatör tabanlı mimarilere göre belirgin bir avantajdır.
Zayıflıklar
- Benimseme Eğrisi: Yakın zamanda piyasaya sürülen bir model olduğundan, üçüncü taraf eğitimlerinin ve harici kaynakların hacmi hızla artıyor, ancak şu anda YOLOv5 gibi eski, eski sürümlerden daha az olabilir.
- Küçük Nesne Zorlukları: Önemli ölçüde iyileştirilmiş olsa da, aşırı küçük nesnelerin tespiti, özel, ancak daha yavaş yaklaşımlara kıyasla tek aşamalı nesne dedektörleri için zorlu bir görev olmaya devam etmektedir.
İdeal Kullanım Senaryoları
YOLO11, yüksek verimlilik ve hassasiyet gerektiren senaryolarda mükemmeldir:
- Otonom Sistemler: Sürücüsüz arabalar ve dronlar için gerçek zamanlı nesne takibi.
- Akıllı Üretim: Eş zamanlı kusur tespiti ve segmentasyonu gerektiren kalite güvence görevleri.
- Healthcare: Kaynak kısıtlamalı dağıtımın genellikle gerekli olduğu tıbbi görüntüleme analizi.
- Perakende Analitiği: Poz tahmini ve izleme kullanarak müşteri davranış analizi ve envanter yönetimi.
YOLO11 hakkında daha fazla bilgi edinin
YOLOv6-3.0
Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Kuruluş: Meituan
Tarih: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
Belgeler: https://docs.ultralytics.com/models/yolov6/
YOLOv6-3.0, özellikle endüstriyel uygulamaları hedefleyen, Meituan tarafından geliştirilen bir nesne detect etme çerçevesidir. 2023'ün başlarında piyasaya sürülen bu sürüm, lojistik ve otomasyondaki gerçek zamanlı sistemlerin ihtiyaçlarını karşılamak üzere çıkarım hızı ve doğruluk arasında rekabetçi bir denge sunmak için tasarlanmıştır.
Mimari ve Temel Özellikler
YOLOv6-3.0 mimarisi, ağın "Tam Ölçekli Yeniden Yüklenmesini" sunar. Verimli bir yeniden parametrelendirilebilir omurga (EfficientRep) ve bir ayrıştırma başlığı yapısı kullanır. Temel yenilikler arasında, çıkarım maliyetlerini artırmadan doğruluğu artırmak için eğitim sırasında kendi kendine damıtma tekniklerinin kullanılması ve TensorRT dağıtımı için özel optimizasyonlar yer alır.
Güçlü Yönler
- Endüstriyel Odak: Model mimarisi, özellikle NVIDIA GPU'larda gecikmeyi optimize ederek endüstriyel donanım için uyarlanmıştır.
- Kuantalama Hazırlığı: YOLOv6, sınırlı hesaplama hassasiyetine sahip donanımlarda dağıtımı kolaylaştıran model kuantalaması için özel destek sağlar.
- Mobil Varyantlar: Çerçeve, mobil CPU'lar ve DSP mimarileri için optimize edilmiş YOLOv6-Lite sürümlerini içerir.
Zayıflıklar
- Kaynak Yoğunluğu: Performans verilerinde gösterildiği gibi, YOLOv6-3.0 genellikle YOLO11 gibi daha yeni modellere kıyasla benzer doğruluğu elde etmek için önemli ölçüde daha fazla parametre ve FLOP gerektirir.
- Sınırlı Görev Kapsamı: Öncelikli odak noktası nesne algılamadır. Birleşik Ultralytics çerçevesinde bulunan sorunsuz, yerel çoklu görev desteğine (segmentasyon, poz, sınıflandırma, OBB) sahip değildir.
- Ekosistem Parçalanması: Açık kaynak olmasına rağmen, ekosistem Ultralytics'inkinden daha az entegredir ve bu da veri kümesi yönetimi, track ve bulut eğitimi gibi görevler için daha fazla manuel çaba gerektirebilir.
İdeal Kullanım Senaryoları
YOLOv6-3.0 şunlar için uygundur:
- Eski Endüstriyel Sistemler: Özellikle YOLOv6 mimarisi için ayarlanmış ortamlar.
- Özel Algılama Görevleri: Yalnızca sınırlayıcı kutu algılamanın gerekli olduğu ve çoklu görev yeteneklerinin gereksiz olduğu uygulamalar.
- Belirli Donanım Dağıtımları: Meituan çerçevesi tarafından desteklenen belirli niceleme ardışık düzenlerinden yararlanan senaryolar.
YOLOv6 hakkında daha fazla bilgi edinin
Performans Metrikleri: Hız, Doğruluk ve Verimlilik
Aşağıdaki tablo, COCO veri kümesi üzerinde YOLO11 ve YOLOv6-3.0'ın ayrıntılı bir karşılaştırmasını sunmaktadır. Metrikler, YOLO11 mimarisi tarafından elde edilen verimlilikteki gelişmeleri vurgulamaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Veri Analizi
Karşılaştırma açık bir eğilimi ortaya koyuyor: YOLO11, önemli ölçüde azaltılmış hesaplama yükü ile sürekli olarak daha yüksek doğruluk (mAP) elde ediyor.
- Parametre Verimliliği: YOLO11m modeli, YOLOv6-3.0m'nin 50,0 mAP'sine kıyasla daha üstün bir 51,5 mAP elde eder, ancak 34,9M'ye karşı yalnızca 20,1M parametre kullanır. Bu, daha iyi performans için model boyutunda yaklaşık %42'lik bir azalmayı temsil eder.
- Hesaplama Maliyeti: Benzer şekilde, YOLO11l 53.4 mAP'ye ulaşmak için 86.9B FLOPs gerektirirken, YOLOv6-3.0l daha düşük bir 52.8 mAP için 150.7B FLOPs gerektirir. Daha düşük FLOPs, doğrudan daha düşük güç tüketimi ve azaltılmış ısı üretimi anlamına gelir; bu da gömülü sistemler için kritik faktörlerdir.
- Çıkarım Hızı: YOLOv6-3.0n biraz daha hızlı TensorRT hızları gösterse de, önemli doğruluk farkı (2.0 mAP) ve daha büyük model boyutu, YOLO11n'yi hassasiyetin çok önemli olduğu modern uygulamalar için daha dengeli bir seçim haline getirir.
Dağıtım Avantajı
YOLO11'in azaltılmış parametre sayısı yalnızca çıkarımı hızlandırmakla kalmaz, aynı zamanda bellek bant genişliği gereksinimlerini de düşürür. Bu, YOLO11'i bellek kaynaklarının genellikle darboğaz olduğu Raspberry Pi veya NVIDIA Jetson gibi uç cihazlarda özellikle etkili kılar.
Eğitim ve Kullanılabilirlik
Kullanım Kolaylığı ve Ekosistem
En önemli ayırt edici özelliklerden biri, modelleri çevreleyen ekosistemdir. Ultralytics YOLO11, tüm makine öğrenimi operasyonları (MLOps) yaşam döngüsünü basitleştiren kapsamlı bir platforma entegre edilmiştir.
- Basit API: Geliştiriciler, sadece birkaç satır Python koduyla YOLO11 ile yükleme, eğitim ve tahmin yapabilirler.
- Dokümantasyon: Kapsamlı ve aktif olarak güncellenen dokümantasyon, kullanıcıların veri açıklamasından model dışa aktarmaya kadar her konuda kolayca rehber bulabilmesini sağlar.
- Topluluk: GitHub ve Discord'da canlı bir topluluk, hızlı destek ve sürekli iyileştirmeler sağlar.
Aksine, YOLOv6 sağlam bir kod tabanı sağlarken, aynı düzeyde entegre araç ve topluluk odaklı kaynak kullanılabilirliğine sahip değildir, bu da yeni projeler için dağıtım süresini artırabilir.
Eğitim Verimliliği
YOLO11, eğitim sırasında oldukça verimli olacak şekilde tasarlanmıştır. Mimarisi daha hızlı yakınsamaya olanak tanır, yani kullanıcılar genellikle eski mimarilere kıyasla hedef doğruluklarına daha az epoch'ta ulaşabilirler. Ayrıca, eğitim sırasındaki bellek gereksinimleri optimize edilmiştir ve tüketici sınıfı GPU'larda daha büyük batch boyutlarına olanak tanır.
İşte bir YOLO11 modelini eğitmeye başlamanın ne kadar basit olduğuna dair bir örnek:
from ultralytics import YOLO
# Load a pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
Sonuç
YOLOv6.0, belirli endüstriyel algılama görevleri için yetenekli bir model olmaya devam ederken, Ultralytics YOLO11, yeni bilgisayarla görme projelerinin büyük çoğunluğu için üstün bir seçim olarak öne çıkıyor.
YOLO11, daha yüksek doğruluk, daha düşük kaynak tüketimi ve rakipsiz çok yönlülük kombinasyonunu sunar. Tek, kullanımı kolay bir çerçevede detect, segmentasyon, poz tahmini ve classify işlemlerini gerçekleştirme yeteneği, geliştirme iş akışlarını kolaylaştırır. Aktif olarak sürdürülen Ultralytics ekosistemi ve Ultralytics HUB gibi araçlarla desteklenen YOLO11, ölçeklenebilir, yüksek performanslı yapay zeka çözümleri oluşturmak için geleceğe dönük bir temel sağlar.
Performans, verimlilik ve kullanım kolaylığının en iyi dengesini arayan geliştiriciler için YOLO11, ileriye dönük önerilen yoldur.
Diğer Modelleri İnceleyin
Daha fazla karşılaştırma yapmak isterseniz, dokümantasyondaki bu ilgili sayfalara göz atın:
- YOLO11 - YOLOv8 Karşılaştırması
- YOLO11 - RT-DETR Karşılaştırması
- YOLOv6 -e karşı YOLOv8
- YOLO11 - YOLOv10
- YOLOv5 - YOLOv6