YOLOv5 ve YOLOv6-3.0: Gerçek Zamanlı Nesne Algılama Modelleri İçin Kapsamlı Bir Rehber
Bilgisayarlı görü dünyası sürekli gelişiyor ve yeni mimariler hız ve doğruluk sınırlarını zorluyor. Bir sonraki görüntü tabanlı yapay zeka projen için bir model seçerken, geliştiriciler genellikle yerleşik ve çok yönlü çerçeveleri, yüksek düzeyde uzmanlaşmış endüstriyel dedektörlerle karşılaştırırken bulurlar kendilerini. Bu derinlemesine inceleme, Ultralytics YOLOv5 ile Meituan'ın YOLOv6-3.0 modeli arasındaki teknik nüansları keşfediyor ve dağıtım ihtiyaçların için en iyi aracı seçmene yardımcı oluyor.
Modellere Giriş
Ultralytics YOLOv5: Çok Yönlü Standart
2020'de piyasaya sürülen Ultralytics YOLOv5, erişilebilir ve yüksek performanslı nesne algılama için kısa sürede altın standart haline geldi. İnanılmaz kullanım kolaylığı, sağlam eğitim hatları ve kapsamlı dağıtım entegrasyonları ile tanınır.
- Yazar: Glenn Jocher
- Kuruluş: Ultralytics
- Tarih: 2020-06-26
- GitHub: ultralytics/yolov5
YOLOv5, PyTorch ekosistemi içinde sorunsuz bir geliştirici deneyimi sağlamak için sıfırdan tasarlandı. Uç cihazlardan bulut sunucularına kadar çeşitli gerçek dünya dağıtım senaryolarına uygun yüksek çıkarım hızlarını korurken, mükemmel bir ortalama kesinlik (mAP) elde ederek elverişli bir performans dengesi sunar.
YOLOv5 hakkında daha fazla bilgi edin
YOLOv6-3.0: Endüstriyel İş Hacmi
Meituan'daki Vision AI Departmanı tarafından geliştirilen YOLOv6-3.0, özel donanım hızlandırıcılarında ham işlem hacmine büyük ölçüde öncelik vererek, endüstriyel uygulamalar için özel olarak uyarlanmıştır.
- Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, ve diğerleri.
- Kuruluş: Meituan
- Tarih: 2023-01-13
- Arxiv: 2301.05586
- GitHub: meituan/YOLOv6
YOLOv6, NVIDIA T4 gibi GPU'larda işlem hızını en üst düzeye çıkarmayı hedefler. Performansını elde etmek için özel nicemleme yöntemleri ve uzmanlaşmış omurgalar kullanır, bu da onu toplu çıkarımın yoğun olarak kullanıldığı arka uç sunucu işlemleri için güçlü bir aday yapar.
YOLOv6 hakkında daha fazla bilgi edinin
Mimari Farklılıklar
Bu modellerin arkasındaki mimari seçimleri anlamak, ideal kullanım durumlarını belirlemek için çok önemlidir.
YOLOv5 Mimarisi
YOLOv5, bir Path Aggregation Network (PANet) boynu ile birleştirilmiş, yüksek düzeyde optimize edilmiş bir CSPDarknet omurgası kullanır. Bu yapı, eğitim ve çıkarım sırasında minimum bellek gereksinimlerini sağlamak için büyük ölçüde ince ayar yapılmıştır. Devasa miktarda CUDA belleği ve uzun eğitim süreleri gerektiren büyük Transformer modellerinin aksine, YOLOv5 standart tüketici donanımında verimli bir şekilde çalışır.
Ultralytics modelleri, eğitim verimliliği için özel olarak tasarlanmıştır. Genellikle tek bir orta seviye GPU üzerinde bir YOLOv5 modeli eğitebilirsin, bu da onu hem araştırmacılar hem de girişimler için son derece erişilebilir kılar.
Dahası, YOLOv5 sadece bir nesne dedektörü değildir. Mimarisi, görüntü segmentasyonu ve görüntü sınıflandırma için kutudan çıktığı gibi sağlam destek sunarak diğer görevlere sorunsuz bir şekilde genişler.
YOLOv6-3.0 Mimarisi
YOLOv6-3.0, özellikle GPU yürütme için donanım dostu olacak şekilde tasarlanmış bir EfficientRep omurgasına sahiptir. Özellik füzyonunu geliştirmek için boynunda bir Bi-directional Concatenation (BiC) modülü kullanır.
Eğitim sırasında YOLOv6, yakınsamayı stabilize etmek için bir Anchor-Aided Training (AAT) stratejisi kullanır, ancak çıkarım sırasında anchor-free (çapasız) bir dedektör olarak kalır. Bu mimari GPU hızlandırmalı görevlerde mükemmel olsa da, son derece taşınabilir YOLOv5 çerçevesine kıyasla çeşitli uç cihazlara uyarlanması bazen daha karmaşık olabilir.
Performans Analizi
Bu modelleri değerlendirirken ham hız ve doğruluk metrikleri hayati öneme sahiptir. Aşağıda, COCO dataset üzerindeki çeşitli model boyutlarının performansını vurgulayan karşılaştırmalı bir tablo bulunmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametre (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
YOLOv6-3.0 daha büyük varyantlarında daha yüksek mAP puanları elde etse de, YOLOv5 inanılmaz derecede hafif bir ayak izi korur. Örneğin, YOLOv5n, YOLOv6 muadiline göre önemli ölçüde daha az parametre ve FLOP gerektirir, bu da onu mobil veya CPU tabanlı dağıtımlar için oldukça optimal hale getirir.
Ekosistem ve Kullanım Kolaylığı
Pek çok mühendislik ekibi için gerçek belirleyici faktör, modelin etrafındaki ekosistemdir.
YOLOv6 etkileyici bir araştırma deposudur, ancak farklı formatlarda dağıtmak için önemli miktarda standart kod (boilerplate code) gerektirir. Buna karşılık Ultralytics, akıcı bir kullanıcı deneyimi ile karakterize edilen, iyi yönetilen bir ekosistem sunar. Birleşik Python API ve sezgisel Ultralytics Platform aracılığıyla geliştiriciler; sorunsuz veri seti yönetimi, tek tıklamayla eğitim ve ONNX ve TensorRT gibi formatlara doğrudan dışa aktarma erişimi kazanır.
Kod Örneği: Birleşik Ultralytics API
Ultralytics ultralytics pip paketi, modelleri sadece birkaç satır kodla yüklemeni, eğitmeni ve dağıtmanı sağlar.
from ultralytics import YOLO
# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")
# Train the model effortlessly on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run fast inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for edge deployment
model.export(format="onnx")Kullanım Durumları ve Öneriler
YOLOv5 ile YOLOv6 arasında seçim yapmak; özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
Ne Zaman YOLOv5 Seçilmeli
YOLOv5 şunlar için güçlü bir seçimdir:
- Kanıtlanmış Üretim Sistemleri: YOLOv5'in uzun istikrar geçmişine, kapsamlı dokümantasyonuna ve devasa topluluk desteğine değer verilen mevcut dağıtımlar.
- Kaynak Kısıtlı Eğitim: YOLOv5'in verimli eğitim hattının ve daha düşük bellek gereksinimlerinin avantajlı olduğu, sınırlı GPU kaynağına sahip ortamlar.
- Kapsamlı Dışa Aktarma Formatı Desteği: ONNX, TensorRT, CoreML ve TFLite dahil olmak üzere birçok formatta dağıtım gerektiren projeler.
YOLOv6 Ne Zaman Seçilmeli?
YOLOv6 şunlar için önerilir:
- Endüstriyel Donanım Odaklı Dağıtım: Modelin donanım odaklı tasarımının ve verimli yeniden parametrelendirmenin belirli hedef donanımlarda optimize edilmiş performans sağladığı senaryolar.
- Hızlı Tek Aşamalı Algılama: Kontrollü ortamlarda gerçek zamanlı video işleme için GPU'da ham çıkarım hızına öncelik veren uygulamalar.
- Meituan Ekosistem Entegrasyonu: Hali hazırda Meituan'ın teknoloji yığını ve dağıtım altyapısı içinde çalışan ekipler.
Ne Zaman Ultralytics (YOLO26) Seçilmeli
Çoğu yeni proje için Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
İleriye Bakış: YOLO26 Avantajı
YOLOv5 güvenilir bir iş gücü olarak kalmaya devam ederken ve YOLOv6-3.0 güçlü endüstriyel GPU çıktısı sunarken, teknoloji gelişti. Bugün yeni projelere başlayan geliştiriciler için önerilen yol Ultralytics YOLO26'dır.
Ocak 2026'da piyasaya sürülen YOLO26, büyük bir ileri sıçramayı temsil eder. Ultralytics ekosisteminin benzersiz çok yönlülüğünü miras alırken çığır açan mimari iyileştirmeler sunar:
- Uçtan Uca NMS-Free Tasarım: YOLO26, Non-Maximum Suppression (NMS) sonrası işlemeyi ortadan kaldırarak gecikme varyansını önemli ölçüde azaltır ve dağıtım mantığını basitleştirir.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: DFL kaldırma ve optimize edilmiş bir baş (head) ile uç ve düşük güçlü cihazlarda önceki nesillerden çok daha üstün performans gösterir.
- MuSGD Optimizer: LLM eğitim yeniliklerinden yararlanan yeni MuSGD optimize edici, son derece istikrarlı eğitim ve oldukça hızlı yakınsama sağlar.
- Gelişmiş Çok Yönlülük: YOLO26, Oriented Bounding Box (OBB), Pose Estimation ve benzersiz küçük nesne tanıma için ProgLoss ve STAL gibi özel görev kayıplarıyla Segmentasyon işlemlerini sorunsuz bir şekilde yürütür.
Ultralytics ekosistemindeki diğer seçenekleri araştırıyorsan, genel amaçlı YOLO11 veya açık kelime dağarcıklı algılama görevleri için yenilikçi YOLO-World modelini de değerlendirebilirsin.
Sonuç
Hem YOLOv5 hem de YOLOv6-3.0, bilgisayarlı görü alanını önemli ölçüde etkiledi. YOLOv6-3.0, üst düzey sunucu donanımı için mükemmel çıktı sağlar ve bu da onu özel çevrimdışı analizler için uygun hale getirir. Ancak YOLOv5, dünya standartlarında bir platform tarafından desteklenen, sağlam, kullanımı kolay ve son derece çok yönlü bir modele ihtiyaç duyan geliştiriciler için üstün seçenek olmaya devam etmektedir.
Yeni nesil doğruluk, yerel NMS-free dağıtım ve sektörün en iyi geliştirici deneyiminin nihai dengesi için Ultralytics Platform aracılığıyla YOLO26'ya yükseltme yapmak, modern yapay zeka vizyon çözümleri için kesin tercihtir.