Link to this sectionYOLOv10 ve YOLOv9#
Gerçek zamanlı bilgisayarlı görü dünyasının evrimi, hız, doğruluk ve mimari verimlilikteki sürekli çığır açan gelişmelerle şekillenmiştir. Bir sonraki dağıtımın için modern çözümleri değerlendirirken, YOLOv10 ve YOLOv9 karşılaştırması, derin öğrenme darboğazlarını çözmeye yönelik iki farklı yaklaşıma büyüleyici bir bakış sunar. YOLOv9 eğitim sırasında gradyan bilgi akışını en üst düzeye çıkarmaya odaklanırken, YOLOv10 geleneksel son işleme engellerini tamamen ortadan kaldıran yerel uçtan uca bir tasarımı öncülük eder.
Bu kapsamlı rehber, geliştiricilerin ve araştırmacıların belirli bilgisayarlı görü görevleri için en uygun modeli seçmelerine yardımcı olmak amacıyla mimari yeniliklerini, performans metriklerini ve ideal kullanım durumlarını analiz eder.
Link to this sectionYOLOv10: NMS-Free Uçtan Uca Öncü#
Geleneksel nesne dedektörlerinin gecikme darboğazlarını çözmek için geliştirilen YOLOv10, Non-Maximum Suppression (NMS) ihtiyacını yerel olarak ortadan kaldıran devrim niteliğinde uçtan uca bir mimari sunar.
Teknik Detaylar & Köken:
- Yazarlar: Ao Wang, Hui Chen, Lihao Liu ve diğerleri.
- Organizasyon: Tsinghua Üniversitesi
- Tarih: 23 Mayıs 2024
- Bağlantılar: Arxiv Yayını, GitHub Deposu, Ultralytics Dokümanları
YOLOv10 hakkında daha fazla bilgi edin
Link to this sectionMimari ve Güçlü Yönler#
YOLOv10'un alana en önemli katkısı, NMS içermeyen eğitim için tutarlı çift atama stratejisidir. NMS'yi ortadan kaldırarak, özellikle son işlemenin tüm işlem hattını yavaşlatabileceği uç cihazlarda, model çıkarım gecikmesini önemli ölçüde azaltır. Çeşitli bileşenleri hem verimlilik hem de doğruluk perspektifinden optimize ederek, hız ve parametreler arasında dikkat çekici bir denge sunan bir model ortaya koyar. Örneğin, YOLOv10-S varyantı son derece hızlıdır ve bu da onu yüksek hızlı video analitiği ve gerçek zamanlı robotik navigasyon için oldukça uygun hale getirir.
Link to this sectionZayıf Yönler#
NMS içermeyen tasarım bounding box tespiti için çığır açıcı olsa da, YOLOv10 öncelikle saf bir nesne dedektörü olarak optimize edilmiştir. Örnek Segmentasyonu veya Pose Tahmini gibi görevleri yerel olarak destekleyen daha yeni ekosistemlerin kutudan çıktığı andaki çok yönlülüğüne sahip değildir. Ayrıca, ilk uygulamalar, cv2 gibi işlemlerin çıkarım grafiğinden tamamen optimize edildiğinden emin olmak için dikkatli dışa aktarma yönetimi gerektiriyordu.
YOLOv10'u üretime hazırlarken, modeli her zaman TensorRT veya ONNX gibi optimize edilmiş formatlara dışa aktardığından emin ol. Ham PyTorch ağırlıklarını dağıtımda çalıştırmak, optimize edilmemiş grafik işlemleri nedeniyle beklenenden daha yavaş çıkarımla sonuçlanabilir.
Link to this sectionYOLOv9: Programlanabilir Gradyan Bilgisi#
YOLOv10'dan önce YOLOv9, derin sinir ağlarında doğuştan gelen bilgi darboğazı sorununu çözmek için yeni mimari kavramlar ortaya koyarak, parametrelerin son derece verimli kullanılmasını sağladı.
Teknik Detaylar & Köken:
- Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
- Kuruluş: Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
- Tarih: 21 Şubat 2024
- Bağlantılar: Arxiv Yayını, GitHub Deposu, Ultralytics Dokümanları
YOLOv9 hakkında daha fazla bilgi edin
Link to this sectionMimari ve Güçlü Yönler#
YOLOv9 introduces Programmable Gradient Information (PGI) alongside the Generalized Efficient Layer Aggregation Network (GELAN). PGI ensures that crucial target information is not lost as data passes through the network's deep layers, generating reliable gradients for weight updates. GELAN maximizes the efficiency of the network's parameters. Together, these innovations allow YOLOv9 to achieve incredibly high mean Average Precision (mAP) on the MS COCO dataset, often outperforming heavier models while using fewer FLOPs. It is an exceptional model for researchers focused on maximizing theoretical accuracy metrics.
Link to this sectionZayıf Yönler#
Yüksek doğruluğuna rağmen, YOLOv9 hala standart NMS son işlemeye dayanır. Bu, sinir ağı işlemleri hızlı olsa da, son bounding box filtrelemesinin sahnedeki nesne yoğunluğuna bağlı olarak değişken gecikme süresi getirebileceği anlamına gelir. Ayrıca, eğitim süreci daha sonraki modellere kıyasla oldukça yoğun bellek gerektirebilir ve özel veri kümesi ince ayarı için daha güçlü GPU kaynakları gerektirir.
Link to this sectionPerformans Karşılaştırması#
Aşağıdaki tablo, her iki modelin temel metriklerini göstermektedir. YOLOv10'un genellikle TensorRT aracılığıyla daha düşük gecikme süresi elde ettiğine, YOLOv9'un ise en büyük yapılandırmasında doğruluğun üst sınırlarını zorladığına dikkat et.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Link to this sectionYeni Nesil: Neden YOLO26 Nihai Öneridir#
YOLOv9 ve YOLOv10 etkileyici dönüm noktaları olsa da, makine öğrenimi dünyası hızla değişmektedir. Modern üretim ortamları için geliştiriciler giderek Ultralytics Platform'un entegre ve iyi bakılan ekosistemine güvenmektedir. 2026 itibarıyla, hem araştırma hem de kurumsal kullanım için net öneri yeni piyasaya sürülen YOLO26'dır.
YOLO26, öncüllerinin temel kavramlarını alır ve bunları modern bir kullanıcı deneyimi, basit API ve hantal transformer tabanlı mimarilere kıyasla eğitim sırasında son derece düşük bellek gereksinimleri ile bir üst seviyeye taşır.
Link to this sectionYOLO26'daki Temel Yenilikler#
- Uçtan Uca NMS-Free Tasarım: YOLOv10'un çığır açan özelliklerini temel alan YOLO26, yerel olarak uçtan uca çalışır ve daha basit bir dağıtım ile son derece belirleyici gecikme profilleri için NMS son işlemesini tamamen ortadan kaldırır.
- %43'e kadar Daha Hızlı CPU Çıkarımı: Edge AI için kutudan çıktığı anda optimize edilmiştir, bu da onu özel GPU'lardan yoksun gömülü sistemler için mükemmel bir seçim haline getirir.
- MuSGD Optimize Edici: (büyük dil modeli optimizasyonlarından esinlenen) SGD ve Muon'un çığır açan bir hibritidir, son derece kararlı eğitim süreçleri ve inanılmaz derecede hızlı yakınsama süreleri sağlar.
- DFL Kaldırma: Distribution Focal Loss'u kaldırarak, YOLO26 model dışa aktarma sürecini basitleştirir, düşük güç tüketen cihazlar ve çeşitli uç dağıtım çerçeveleriyle uyumluluğu önemli ölçüde artırır.
- Göreve Özel İyileştirmeler: Özel tek görevli dedektörlerin aksine, YOLO26 çok yönlü bir güç merkezidir. Rafine piksel seviyesinde doğruluk için Semantik segmentasyon kaybını, kusursuz Pose tahmini için Residual Log-Likelihood Estimation (RLE) ve OBB (Oriented Bounding Box) sınır sorunlarını çözmek için özel bir açı kaybını kullanır.
Link to this sectionPratik Uygulama#
Bu modelleri eğitmek ve dağıtmak, Python SDK kullanılarak oldukça basittir. Aşağıdaki örnek, hiperparametre zamanlamasını ve optimum bellek tahsisini otomatik olarak yöneten Ultralytics ekosisteminin son derece verimli eğitim süreçlerinden nasıl yararlanılacağını gösterir.
from ultralytics import YOLO
# Load the recommended state-of-the-art model
model = YOLO("yolo26n.pt") # Also compatible with 'yolov10n.pt' or 'yolov9c.pt'
# Train the model efficiently on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0, batch=16)
# Run ultra-fast inference
predictions = model.predict("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for simplified edge deployment
model.export(format="onnx")Link to this sectionKullanım Durumları ve Öneriler#
YOLOv10 ve YOLOv9 arasında seçim yapmak, proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
Link to this sectionNe Zaman YOLOv10 Seçilmeli#
YOLOv10 şunlar için güçlü bir seçimdir:
- NMS'siz Gerçek Zamanlı Tespit: Non-Maximum Suppression (NMS) olmadan uçtan uca tespitten yararlanan ve dağıtım karmaşıklığını azaltan uygulamalar.
- Dengeli Hız-Doğruluk Takasları: Çeşitli model ölçeklerinde çıkarım hızı ile tespit doğruluğu arasında güçlü bir denge gerektiren projeler.
- Tutarlı Gecikme Süreli Uygulamalar: robotik veya otonom sistemler gibi öngörülebilir çıkarım sürelerinin kritik olduğu dağıtım senaryoları.
Link to this sectionNe Zaman YOLOv9 Seçilmeli#
YOLOv9 şunlar için önerilir:
- Bilgi Darboğazı Araştırması: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN) mimarilerini inceleyen akademik projeler.
- Gradyan Akışı Optimizasyonu Çalışmaları: Eğitim sırasında derin ağ katmanlarındaki bilgi kaybını anlamaya ve azaltmaya odaklanan araştırmalar.
- Yüksek Doğrulukta Algılama Kıyaslaması: YOLOv9'un güçlü COCO karşılaştırma performansının mimari karşılaştırmalar için referans noktası olarak gerektiği senaryolar.
Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#
Çoğu yeni proje için, Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Link to this sectionSonuç#
Hem YOLOv9 hem de YOLOv10 benzersiz avantajlar sunar. YOLOv9, ağ parametresi verimliliğini ve teorik gradyan akışını en üst düzeye çıkarmanın bir kanıtıdır ve sonuç olarak üst düzey doğruluk sağlar. Bu arada, YOLOv10, NMS gecikme cezası olmadan uçtan uca bounding box tespiti yapan akademik bir öncü olarak hizmet eder.
Ancak performans, çok yönlülük ve kullanım kolaylığı arasında mükemmel dengeyi arayan geliştiriciler için en yeni modellere yükseltme yapmak çok önemlidir. Gelişmiş MuSGD optimize edicisi, üstün küçük nesne tespiti için ProgLoss + STAL işlevselliği ve kapsamlı çoklu görev desteği ile YOLO26, gerçek dünyadaki her türlü bilgisayarlı görü zorluğu için kesin, son teknoloji ürünü çözümü temsil eder.