Link to this sectionYOLOv5 ve RTDETRv2#
Bilgisayarlı görü alanı son birkaç yıl içinde önemli ölçüde genişledi ve geliştiricilere karmaşık görsel görevleri çözmeleri için çok çeşitli mimariler sundu. En popüler paradigmalar arasında Evrişimli Sinir Ağları (CNN'ler) ve Algılama Transformer'ları (DETR'ler) yer alıyor.
Bu kılavuz, bu kategorilerdeki iki temel model arasında derinlemesine bir teknik karşılaştırma sunar: Oldukça verimli ve yaygın olarak benimsenen CNN tabanlı bir model olan Ultralytics YOLOv5 ve son teknoloji ürünü, transformer tabanlı bir gerçek zamanlı nesne algılayıcısı olan RTDETRv2.
Link to this sectionUltralytics YOLOv5: Verimlilikte Endüstri Standardı#
Yayınlandığından bu yana Ultralytics YOLOv5, dünya çapında binlerce ticari uygulamaya ve araştırma projesine güç vererek yapay zeka topluluğunun temel taşı haline geldi. Tamamen PyTorch çerçevesi üzerine inşa edilmiştir ve gerçek zamanlı performanstan ödün vermeden sezgisel bir geliştirici deneyimini önceliklendirir.
Temel Özellikler:
- Yazar: Glenn Jocher
- Kuruluş: Ultralytics
- Tarih: 2020-06-26
- Bağlantılar: GitHub Deposu
Link to this sectionMimari ve Güçlü Yönler#
YOLOv5, son derece düşük bir bellek ayak izini korurken özellik çıkarımı verimliliğini en üst düzeye çıkarmak için tasarlanmış modern bir CNN mimarisi kullanır. Çok ölçekli özellik füzyonu için güçlü bir kombinasyon oluşturan bir CSPDarknet omurgası ve bir PANet boyun yapısı kullanır.
One of the primary advantages of YOLOv5 is its Performance Balance. It strikes an exceptional trade-off between speed and accuracy, making it an ideal choice for model deployment on resource-constrained hardware like NVIDIA Jetson devices and smartphones.
Dahası, YOLOv5 benzersiz bir Çok Yönlülüğe sahiptir. Sadece sınırlayıcı kutu tahminleriyle sınırlı modellerin aksine, YOLOv5 yerel olarak görüntü sınıflandırmayı ve örnek bölümlemeyi destekleyerek çeşitli görsel görevler için birleşik bir çerçeve sunar. Eğitim verimliliği de dikkat çekicidir ve transformer tabanlı mimarilere kıyasla eğitim sırasında önemli ölçüde daha az CUDA belleği gerektirir.
Link to this sectionZayıf Yönler#
Daha eski bir CNN çerçevesine dayandığı için YOLOv5, kopya sınırlayıcı kutuları elemek amacıyla son işleme sırasında doğal olarak Maksimum Olmayan Baskılama'ya (NMS) bağımlıdır. Ultralytics çerçevesi içinde son derece optimize edilmiş olsa da, NMS bazen özel uç birim NPU'larında gecikme darboğazlarına yol açabilir.
YOLOv5 hakkında daha fazla bilgi edin
Link to this sectionRTDETRv2: Baidu'dan Gerçek Zamanlı Transformer'lar#
RTDETRv2 (Gerçek Zamanlı Algılama Transformer'ı v2), transformer mimarilerini gerçek zamanlı nesne algılamaya uygulamada önemli bir sıçramayı temsil eder ve tarihsel olarak standart DETR'leri rahatsız eden hesaplama verimsizliklerini ele alır.
Temel Özellikler:
- Yazarlar: Wenyu Lv, Yian Zhao, Qinyao Chang, Kui Huang, Guanzhong Wang ve Yi Liu
- Organizasyon: Baidu
- Tarih: 2024-07-24
- Bağlantılar: Arxiv Makalesi, GitHub Deposu
Link to this sectionMimari ve Güçlü Yönler#
RTDETRv2, görüntüleri işlemek için hibrit bir kodlayıcı ve esnek bir kod çözücü tasarımı kullanarak selefi üzerine inşa edilir. Transformer'ın öz-dikkat mekanizması, modele görüntü bağlamının küresel bir anlayışını sağlar ve ciddi nesne tıkanıklıkları olan karmaşık sahnelerde son derece iyi performans göstermesine olanak tanır.
A defining feature of RTDETRv2 is its end-to-end, NMS-free design. By predicting object queries directly without requiring anchor boxes or NMS post-processing, it simplifies the inference pipeline. This architecture achieves an impressive mAP (mean Average Precision) on benchmark datasets like COCO.
Link to this sectionZayıf Yönler#
Gerçek zamanlı yeteneklerine rağmen, RTDETRv2 YOLO modellerine kıyasla gözle görülür şekilde daha yüksek bellek gereksinimlerine sahiptir. Transformer'lardaki dikkat mekanizmaları dizi uzunluğu ile karesel olarak ölçeklenir, bu da devasa GPU kümeleri kullanılmadığı sürece yüksek çözünürlüklü eğitim sırasında bellek dışı hatalara yol açabilir. Ek olarak, Ultralytics ekosisteminin kullanıma hazır çok yönlülüğünden yoksundur ve öncelikli olarak bölümleme veya poz tahmini için yerel destek olmaksızın yalnızca 2D nesne algılamaya odaklanır.
RTDETR hakkında daha fazla bilgi edinin
Link to this sectionPerformans Karşılaştırma Tablosu#
Bu mimarileri objektif olarak değerlendirmek için performans ölçümlerini derledik. Kalın harflerle vurgulanan değerler, test edilen ölçeklerdeki en verimli veya en yüksek performanslı ölçümleri temsil eder.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| RTDETRv2-s | 640 | 48.1 | - | 5.03 | 20 | 60 |
| RTDETRv2-m | 640 | 51.9 | - | 7.51 | 36 | 100 |
| RTDETRv2-l | 640 | 53.4 | - | 9.76 | 42 | 136 |
| RTDETRv2-x | 640 | 54.3 | - | 15.03 | 76 | 259 |
RTDETRv2-x en yüksek mutlak mAP'yi elde etse de, YOLOv5n'in neredeyse 30 katı kadar parametre gerektirir. Sınırlı donanımda çalışan yüksek hızlı uygulamalar için Ultralytics modelleri sürekli olarak en iyi hesaplama verimliliğini sunar.
Link to this sectionUltralytics Ekosistemi Avantajı#
Bir modeli araştırma not defterinden üretim ortamına taşırken, modeli çevreleyen yazılım sinir ağı mimarisi kadar önemlidir. Ultralytics tarafından sağlanan İyi Bakımlı Ekosistem, geliştirme yaşam döngüsünü önemli ölçüde hızlandırır.
Link to this sectionBenzersiz Kullanım Kolaylığı#
Ultralytics modelleri, inanılmaz derecede modernleştirilmiş bir kullanıcı deneyimini önceliklendirir. İster özel bir model eğitmek, ister doğrulama çalıştırmak veya TensorRT ya da ONNX gibi donanıma özel formatlara dışa aktarmak isteyin, Ultralytics Python API bunu sadece birkaç satır kodla başarılabilir kılar.
İşte bir Ultralytics modeliyle eğitim yapmanın ve çıkarım çalıştırmanın ne kadar basit olduğunu gösteren pratik bir kod örneği:
from ultralytics import YOLO
# Initialize the model (automatically downloads the weights)
model = YOLO("yolov5s.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device="cpu")
# Perform inference on an online image
inference_results = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the resulting image with bounding boxes
inference_results[0].show()This simple, unified API natively supports experiment tracking integrations with tools like Weights & Biases and Comet, allowing developers to log metrics seamlessly without writing complex boilerplate code.
Link to this sectionKullanım Durumları ve Öneriler#
YOLOv5 ve RT-DETR arasında seçim yapmak, projenin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
Link to this sectionYOLOv5 Ne Zaman Seçilmeli#
YOLOv5 şunlar için güçlü bir tercihtir:
- Kanıtlanmış Üretim Sistemleri: YOLOv5'in uzun istikrar geçmişinin, kapsamlı belgelerinin ve devasa topluluk desteğinin değerli olduğu mevcut dağıtımlar.
- Kaynak Kısıtlı Eğitim: YOLOv5'in verimli eğitim hattının ve düşük bellek gereksinimlerinin avantajlı olduğu, sınırlı GPU kaynaklarına sahip ortamlar.
- Kapsamlı Dışa Aktarma Formatı Desteği: ONNX, TensorRT, CoreML ve TFLite dahil olmak üzere birçok formatta dağıtım gerektiren projeler.
Link to this sectionRT-DETR Ne Zaman Seçilmeli#
RT-DETR şunlar için önerilir:
- Transformer Tabanlı Algılama Araştırması: NMS olmadan uçtan uca nesne algılama için dikkat mekanizmalarını ve transformer mimarilerini keşfeden projeler.
- Esnek Gecikmeli Yüksek Doğruluklu Senaryolar: Algılama doğruluğunun en önemli öncelik olduğu ve biraz daha yüksek çıkarım gecikmesinin kabul edilebilir olduğu uygulamalar.
- Büyük Nesne Algılama: Transformer'ların küresel dikkat mekanizmasının doğal bir avantaj sağladığı, ağırlıklı olarak orta-büyük nesnelerin olduğu sahneler.
Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#
Çoğu yeni proje için, Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Link to this sectionİleriye Bakış: YOLO11 ve YOLO26#
Bugün yeni bir görü projesine başlıyorsan, en son nesil Ultralytics modellerini keşfetmen şiddetle önerilir.
YOLOv5 inanılmaz derecede güvenilir olmaya devam ederken, YOLO11 iyileştirilmiş doğruluk ve Yönelimli Sınırlayıcı Kutu (OBB) algılama dahil olmak üzere genişletilmiş bir görev seti sunar.
Daha da önemlisi, son teknoloji YOLO26 her iki dünyanın en iyisini birleştirir. Bir CNN'in verimliliğini korurken son işleme yükünü ortadan kaldıran (ilk kez YOLOv10 içinde öncülük edilen) bir Uçtan Uca NMS'siz Tasarım uygular. YOLO26 ayrıca, LLM eğitimi yeniliklerinden ilham alan, daha hızlı yakınsama için MuSGD Optimize Ediciyi de tanıtır. DFL Kaldırma (basitleştirilmiş dışa aktarma ve daha iyi uç/düşük güç cihazı uyumluluğu için Dağılımsal Odak Kaybı kaldırıldı) ile YOLO26, %43'e kadar Daha Hızlı CPU Çıkarımı sağlayarak onu uç yapay zeka için kesinlikle en iyi seçenek haline getirir. Ek olarak, ProgLoss + STAL, IoT, robotik ve hava görüntüleri için kritik öneme sahip küçük nesne tanımada kayda değer iyileştirmelerle gelişmiş kayıp fonksiyonları sağlar.
Link to this sectionSonuç#
YOLOv5 ve RTDETRv2 arasında seçim yapmak büyük ölçüde dağıtım kısıtlamalarına bağlıdır. RTDETRv2, güçlü transformer dikkat mekanizmalarını kullanarak mAP'nin sınırlarını zorlar ancak bellek ve hesaplama yükü açısından ağır bir bedeli vardır.
Buna karşılık Ultralytics YOLOv5, bulut sunucularından mikrodenetleyicilere kadar her yerde sorunsuz çalışan kanıtlanmış, yüksek düzeyde optimize edilmiş ve çok yönlü bir çözüm sunar. Kesintisiz dağıtım araçlarıyla birlikte mümkün olan en yüksek doğruluğu arayan ekipler için, Ultralytics ekosistemi içinde YOLO26'ya yükseltme yapmak, modern görü yapay zekası uygulamaları için kesin, en son teknoloji çözümü sağlar.