YOLOv5 ve YOLOv6-3.0: Gerçek Zamanlı Nesne Tespit Modelleri İçin Kapsamlı Bir Rehber
Bilgisayar görüşü alanı sürekli gelişmekte, yeni mimariler hız ve doğruluk sınırlarını zorlamaktadır. Bir sonraki görsel yapay zeka projeniz için bir model seçerken, geliştiriciler genellikle köklü, çok yönlü çerçevelerle yüksek düzeyde uzmanlaşmış endüstriyel dedektörleri karşılaştırırken bulurlar kendilerini. Bu derinlemesine inceleme, Ultralytics YOLOv5 ve Meituan'ın YOLOv6-3.0'ı arasındaki teknik nüansları araştırarak dağıtım ihtiyaçlarınız için en iyi aracı seçmenize yardımcı olacaktır.
Modellere Giriş
Ultralytics YOLOv5: Çok Yönlü Standart
2020'de piyasaya sürülen Ultralytics YOLOv5, erişilebilir, yüksek performanslı nesne tespiti için hızla altın standart haline geldi. İnanılmaz kullanım kolaylığı, sağlam eğitim hatları ve kapsamlı dağıtım entegrasyonları ile tanınır.
- Yazar: Glenn Jocher
- Kuruluş:Ultralytics
- Tarih: 2020-06-26
- GitHub:ultralytics/yolov5
YOLOv5, PyTorch ekosistemi içinde sorunsuz bir geliştirici deneyimi sunmak üzere sıfırdan tasarlandı. Kenar cihazlardan bulut sunucularına kadar çeşitli gerçek dünya dağıtım senaryolarına uygun yüksek çıkarım hızlarını korurken, mükemmel ortalama hassasiyet (mAP) elde ederek avantajlı bir performans dengesi sunar.
YOLOv5 hakkında daha fazla bilgi edinin.
YOLOv6-3.0: Endüstriyel Verim
Meituan'daki Vision AI Departmanı tarafından geliştirilen YOLOv6-3.0, endüstriyel uygulamalar için özel olarak tasarlanmış olup, özel donanım hızlandırıcılarında ham verimi yüksek öncelikli tutar.
- Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, ve diğerleri.
- Kuruluş: Meituan
- Tarih: 2023-01-13
- Arxiv:2301.05586
- GitHub:meituan/YOLOv6
YOLOv6, NVIDIA T4 gibi GPU'larda işlem hızını en üst düzeye çıkarmayı hedefler. Performansını elde etmek için özel niceleme yöntemleri ve özelleştirilmiş backbone'lar kullanır, bu da onu toplu çıkarımın yoğun olarak kullanıldığı arka uç sunucu işlemleri için güçlü bir aday yapar.
YOLOv6 hakkında daha fazla bilgi edinin.
Mimari Farklılıklar
Bu modellerin arkasındaki mimari seçimleri anlamak, ideal kullanım durumlarını belirlemek için çok önemlidir.
YOLOv5 Mimarisi
YOLOv5, yüksek düzeyde optimize edilmiş bir CSPDarknet backbone'unu bir Yol Toplama Ağı (PANet) boynu ile birleştirir. Bu yapı, eğitim ve çıkarım sırasında minimum bellek gereksinimlerini sağlamak için yoğun bir şekilde ince ayarlanmıştır. Büyük miktarda CUDA belleği ve uzun eğitim süreleri gerektiren büyük transformer modellerinin aksine, YOLOv5 standart tüketici donanımında verimli bir şekilde çalışır.
Bellek Verimliliği
Ultralytics modelleri, eğitim verimliliği için özel olarak tasarlanmıştır. Bir YOLOv5 modelini genellikle tek bir orta seviye GPU üzerinde eğitebilirsiniz, bu da onu hem araştırmacılar hem de startup'lar için oldukça erişilebilir kılar.
Dahası, YOLOv5 sadece bir nesne detectörü değildir. Mimarisi, görüntü segmentasyonu ve görüntü sınıflandırması için güçlü, kullanıma hazır destek sunarak diğer görevlere sorunsuz bir şekilde genişler.
YOLOv6-3.0 Mimarisi
YOLOv6-3.0, özellikle GPU yürütmesi için donanım dostu olacak şekilde tasarlanmış bir EfficientRep backbone'una sahiptir. Özellik füzyonunu geliştirmek için boynunda Çift Yönlü Birleştirme (BiC) modülü kullanır.
Eğitim sırasında YOLOv6, yakınsamayı stabilize etmek için Çapa Destekli Eğitim (AAT) stratejisi kullanır, ancak çıkarım sırasında çapasız bir detectör olarak kalır. Bu mimari GPU hızlandırmalı görevlerde üstün olsa da, yüksek düzeyde taşınabilir YOLOv5 çerçevesine kıyasla çeşitli kenar cihazlara uyarlamak bazen daha karmaşık olabilir.
Performans Analizi
Bu modelleri değerlendirirken, ham hız ve doğruluk metrikleri hayati öneme sahiptir. Aşağıda, COCO veri kümesi üzerindeki çeşitli model boyutlarının performansını vurgulayan karşılaştırmalı bir tablo bulunmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
YOLOv6-3.0 daha büyük varyantlarında daha yüksek mAP skorları elde ederken, YOLOv5 inanılmaz derecede hafif bir ayak izini korur. Örneğin, YOLOv5n, YOLOv6 muadilinden önemli ölçüde daha az parametre ve FLOP gerektirir, bu da onu mobil veya CPU sınırlı dağıtımlar için oldukça optimize hale getirir.
Ekosistem ve Kullanım Kolaylığı
Birçok mühendislik ekibi için gerçek belirleyici faktör, modeli çevreleyen ekosistemdir.
YOLOv6 etkileyici bir araştırma deposudur, ancak farklı formatlarda dağıtım için önemli miktarda şablon kodu gerektirir. Buna karşılık, Ultralytics, kolaylaştırılmış bir kullanıcı deneyimi ile karakterize edilen iyi yönetilen bir ekosistem sunar. Birleşik Python API'si ve sezgisel Ultralytics Platformu aracılığıyla geliştiriciler, sorunsuz veri kümesi yönetimine, tek tıklamayla eğitime ve ONNX ve TensorRT gibi formatlara doğrudan dışa aktarımlara erişim sağlar.
Kod Örneği: Birleşik Ultralytics API'si
Ultralytics ultralytics pip paketi, modelleri yalnızca birkaç satır kodla yüklemenize, eğitmenize ve dağıtmanıza olanak tanır.
from ultralytics import YOLO
# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")
# Train the model effortlessly on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run fast inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for edge deployment
model.export(format="onnx")
Kullanım Durumları ve Öneriler
YOLOv5 ve YOLOv6 arasında seçim yapmak, projenizin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerinize bağlıdır.
YOLOv5 Ne Zaman Tercih Edilmeli?
YOLOv5, aşağıdaki durumlar için güçlü bir seçenektir:
- Kanıtlanmış Üretim Sistemleri: YOLOv5'in uzun süreli istikrar geçmişinin, kapsamlı dokümantasyonunun ve büyük topluluk desteğinin değerli olduğu mevcut dağıtımlar.
- Kaynak Kısıtlı Eğitim: Sınırlı GPU kaynaklarına sahip ortamlarda, YOLOv5'in verimli eğitim hattının ve daha düşük bellek gereksinimlerinin avantaj sağladığı durumlar.
- Kapsamlı Dışa Aktarma Formatı Desteği: ONNX, TensorRT, CoreML ve TFLite dahil olmak üzere birçok formatta dağıtım gerektiren projeler.
YOLOv6 Ne Zaman Tercih Edilmeli?
YOLOv6 şunlar için önerilir:
- Endüstriyel Donanım Farkındalıklı Dağıtım: Modelin donanım farkındalıklı tasarımının ve verimli yeniden parametrelendirmesinin belirli hedef donanımlarda optimize edilmiş performans sağladığı senaryolar.
- Hızlı Tek Aşamalı Algılama: Kontrollü ortamlarda gerçek zamanlı video işleme için GPU üzerinde ham çıkarım hızına öncelik veren uygulamalar.
- Meituan Ekosistem Entegrasyonu: Halihazırda Meituan'ın teknoloji yığını ve dağıtım altyapısı içinde çalışan ekipler.
Ultralytics (YOLO26) Ne Zaman Seçilmeli
Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
İleriye Doğru: YOLO26 Avantajı
YOLOv5 güvenilir bir iş gücü olmaya devam ederken ve YOLOv6-3.0 güçlü endüstriyel GPU verimi sunarken, en son teknoloji gelişti. Bugün yeni projelere başlayan geliştiriciler için önerilen yol Ultralytics YOLO26'dır.
Ocak 2026'da piyasaya sürülen YOLO26, büyük bir ilerlemeyi temsil ediyor. Ultralytics ekosisteminin eşsiz çok yönlülüğünü miras alırken, çığır açan mimari iyileştirmeler sunuyor:
- Uçtan Uca NMS-Free Tasarım: YOLO26, Non-Maximum Suppression son işlemeyi ortadan kaldırarak gecikme varyansını önemli ölçüde azaltır ve dağıtım mantığını basitleştirir.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: DFL kaldırma ve optimize edilmiş bir başlık ile kenar ve düşük güçlü cihazlarda önceki nesilleri önemli ölçüde geride bırakır.
- MuSGD Optimize Edici: LLM eğitim yeniliklerinden yararlanan yeni MuSGD optimize edici, oldukça kararlı eğitim ve dikkat çekici derecede hızlı yakınsama sağlar.
- Gelişmiş Çok Yönlülük: YOLO26, eşsiz küçük nesne tanıma için ProgLoss ve STAL gibi özel görev kayıplarıyla Yönlendirilmiş Sınırlayıcı Kutu (OBB), Poz Tahmini ve Segmentasyonu sorunsuz bir şekilde ele alır.
Ultralytics ekosistemi içindeki diğer seçenekleri keşfediyorsanız, açık kelime dağarcığı detect görevleri için genel amaçlı YOLO11'i veya yenilikçi YOLO-World'ü de düşünebilirsiniz.
Sonuç
Hem YOLOv5 hem de YOLOv6-3.0, bilgisayar görüşü alanını önemli ölçüde etkilemiştir. YOLOv6-3.0, üst düzey sunucu donanımı için mükemmel verim sağlayarak, özel çevrimdışı analizler için uygun hale getirir. Ancak, YOLOv5, dünya standartlarında bir platform tarafından desteklenen sağlam, kullanımı kolay ve son derece çok yönlü bir modele ihtiyaç duyan geliştiriciler için üstün bir seçenek olmaya devam etmektedir.
Yeni nesil doğruluk, yerel NMS-free dağıtım ve sektörün en iyi geliştirici deneyiminin nihai dengesi için, Ultralytics Platformu aracılığıyla YOLO26'ya yükseltme, modern görüş AI çözümleri için kesin bir seçimdir.