YOLOv10 YOLOv7: Mimari Evrimine Derinlemesine Bir Bakış

Nesne algılama alanı son birkaç yılda önemli ölçüde değişmiştir ve YOLO You Only Look Once) ailesi gerçek zamanlı performans konusunda sürekli olarak lider konumdadır. Bu serideki iki önemli dönüm noktası şunlardır YOLOv10ve YOLOv7'dir. Her iki model de hız ve doğruluk arasındaki dengeyi en üst düzeye çıkarmayı amaçlasa da, bu hedefe ulaşmak için temelde farklı stratejiler kullanmaktadır.

Bu kılavuz, geliştiricilerin, araştırmacıların ve mühendislerin bilgisayar görme uygulamaları için doğru mimariyi seçmelerine yardımcı olmak amacıyla kapsamlı bir teknik karşılaştırma sunmaktadır. Mimari yapılarını, performans ölçütlerini ve dağıtım iş akışlarını analiz ederek, Ultralytics tarafından desteklenen modern yinelemelerin ( YOLO11 ve çığır açan YOLO26dahil olmak üzere Ultralytics ekosistemi tarafından desteklenen modern yinelemelerin üretim AI için en sağlam yolu sunmasının nedenlerini vurgulamaktayız.

YOLOv10: NMS'siz Devrim

YOLOv10 , yerel uçtan uca eğitim özelliğini sunarak gerçek zamanlı algılamada bir paradigma değişikliğini temsil eder. Sezgisel son işlemelere dayanan önceki sürümlerin aksine, YOLOv10 Non-Maximum Suppression (NMS) ihtiyacını YOLOv10 , çıkarım gecikmesini önemli ölçüde azaltır ve dağıtım sürecini basitleştirir.

Önemli Teknik Detaylar

Yazarlar: Ao Wang, Hui Chen, Lihao Liu, ve diğerleri.
Kuruluş:Tsinghua Üniversitesi
Tarih: 2024-05-23
Bağlantılar:ArXiv Makalesi | GitHub Deposu

YOLOv10 , eğitim sırasında zengin denetim için bire birden çok etiket atamalarını verimli çıkarım için bire bir eşleştirmeyle birleştiren bir strateji olan Tutarlı Çift Atamalar sayesinde performansını YOLOv10 . Bu, modelin tahmin NMS hesaplama yükü olmadan geleneksel YOLO'ların yüksek geri çağırma oranından yararlanmasını sağlar. Ek olarak, bütünsel bir verimlilik-doğruluk odaklı tasarım kullanır ve backbone ve algılama başlığı gibi çeşitli bileşenleri optimize ederek parametre sayısını ve FLOP'ları (saniye başına kayan nokta işlemleri) azaltır.

YOLOv10 hakkında daha fazla bilgi edinin.

İdeal Kullanım Senaryoları

Yüksek Frekanslı Ticaret ve Spor Analitiği: Her milisaniyenin önemli olduğu durumlarda, NMS tasarım kritik bir hız avantajı sağlar.
Gömülü Sistemler: Azaltılmış genel giderler, Raspberry Pi veya NVIDIA modülleri gibi sınırlı hesaplama bütçesine sahip cihazlar için uygun hale getirir.
Karmaşık Kalabalık Sahneler: NMS kaldırmak, yoğun ortamlarda geçerli çakışan algılamaların bastırılması gibi yaygın bir sorunu önlemeye NMS .

Uyarı: NMS Mimarilerin Verimliliği

Non-Maximum Suppression (NMS) özelliğini kaldırmak, sadece çıkarım hızını artırmakla kalmaz. Modelin uçtan uca farklılaşabilir olmasını sağlar ve eğitim sırasında daha iyi optimizasyon imkanı sunar. Ancak bu, modelin dahili olarak yinelenen kutuları bastırmayı öğrenmesi gerektiği anlamına da gelir. Bu da YOLOv10 YOLO26'da olduğu gibi sofistike atama stratejileri gerektirir.

YOLOv7: "Ücretsiz Avantajlar Paketi" Güç Merkezi

Temmuz 2022'de piyasaya sürülen YOLOv7 , "eğitilebilir bag-of-freebies" kavramını tanıtarak önemli bir adım attı. Bu yaklaşım, çıkarım maliyetini artırmadan doğruluğu artırmak için eğitim sürecini ve mimariyi optimize etmeye odaklandı.

Önemli Teknik Detaylar

Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş: Bilgi Bilimi Enstitüsü, Academia Sinica, Tayvan
Tarih: 2022-07-06
Bağlantılar:ArXiv Makalesi | GitHub Deposu

YOLOv7 , gradyan yol uzunluklarını kontrol ederek ağın daha çeşitli özellikleri öğrenmesini sağlayan Genişletilmiş Verimli Katman Toplama Ağı (E-ELAN) özelliğini YOLOv7 . Model yeniden parametreleştirme (RepConv) gibi teknikleri etkili bir şekilde kullanarak karmaşık eğitim zamanı modüllerini basit çıkarım zamanı yapılarına birleştirir. YOLOv7 , son derece etkili olmasına rağmen, NMS gerektiren çapa tabanlı bir dedektör YOLOv7 . Bu, yeni çapa içermeyen veya uçtan uca modellere kıyasla ultra düşük gecikme senaryolarında bir darboğaz oluşturabilir.

YOLOv7 hakkında daha fazla bilgi edinin.

İdeal Kullanım Senaryoları

Genel Amaçlı Algılama: Aşırı optimizasyonun kritik olmadığı, ancak güvenilirliğin önemli olduğu standart görevler için mükemmeldir.
Araştırma Temelleri: Mimari iyileştirmeleri karşılaştıran akademik makaleler için popüler bir referans noktası olmaya devam ediyor.
Eski Dağıtımlar: Darknet veya eski PyTorch üzerine kurulmuş sistemler için, YOLOv7 ye yükseltme yapmak, tamamen yeni bir paradigmaya geçmekten YOLOv7 olabilir.

Performans Karşılaştırması

Bu iki devi karşılaştırdığımızda, avantaj ve dezavantajları net bir şekilde ortaya çıkıyor. YOLOv10 , NMS kaldırılması sayesinde YOLOv10 üstün parametre verimliliği ve daha düşük gecikme süresi sunarken, YOLOv7 ise zamanının en gelişmiş teknolojisini temsil eden sağlam bir doğruluk oranı YOLOv7 .

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

Metrik Analizi

Doğruluk ve Boyut: YOLOv10 karşılaştırılabilir veya daha iyi mAP (ortalama hassasiyet) elde eder. Örneğin, YOLOv10L, YOLOv7L'den yaklaşık %20 daha az parametreye sahip olmasına rağmen doğruluk açısından onu geride bırakır.
Çıkarım Hızı: YOLOv10 NMS tasarımı, gerçek dünya süreçlerinde genellikle gizli bir darboğaz olan sonrasındaki işlemlerin daha hızlı yapılmasını YOLOv10 .
Bellek Verimliliği: YOLOv10 dahil olmak üzere Ultralytics , eski uygulamalara veya RT-DETR gibi dönüştürücü ağırlıklı mimarilere kıyasla, eğitim sırasında genellikle daha az CUDA gerektirir. RT-DETR.

Ultralytics'in Avantajı

Ultralytics aracılığıyla bu modelleri kullanmanın en ikna edici nedenlerinden biri, sağlanan sorunsuz entegrasyon ve destektir. YOLOv7, YOLOv10 veya en yeni YOLO26'yı kullanıyor olsanız da, deneyim aynıdır.

Kullanım Kolaylığı: Basit bir Python , geliştiricilerin minimum kodla modelleri eğitmelerine, doğrulamalarına ve dağıtmalarına olanak tanır. Komut dosyanızdaki tek bir dizeyi YOLOv7 YOLOv10 YOLOv7 arasında geçiş yapabilirsiniz.
Ultralytics : Kullanıcılar, veri kümelerini yönetmek, eğitim çalıştırmalarını görselleştirmek ve tek tıklamayla modelleri aşağıdaki formatlara aktarmak için Ultralytics kullanabilirler ONNX ve TensorRTgibi formatlara tek tıklamayla model dışa aktarımları gerçekleştirmek için Ultralytics Platformunu
Çok yönlülük: Ekosistem, basit algılamanın ötesinde, örnek segmentasyonu, poz tahmini ve OBB (Oriented Bounding Box) gibi çok çeşitli görevleri destekler ve gereksinimleriniz değiştikçe projenizin büyümesini sağlar.
Eğitim Verimliliği: Ultralytics , modellerin daha hızlı yakınsamasına olanak tanıyarak değerli GPU tasarruf sağlar ve enerji maliyetlerini azaltır.

from ultralytics import YOLO

# Load a pretrained YOLOv10 model
model = YOLO("yolov10n.pt")

# Train on a custom dataset with just one line
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for deployment
model.export(format="onnx")

Gelecek: YOLO26 neden en iyi seçimdir?

YOLOv7 YOLOv10 mükemmel modeller YOLOv10 da, bu alan hızla gelişmektedir. 2026 yılında yeni projeler başlatan geliştiriciler için önerilen seçim YOLO26'dir.

2026 yılının Ocak ayında piyasaya sürülen YOLO26, YOLOv10 NMS çığır açan özelliğini temel alır, YOLOv10 daha da yüksek hız ve kararlılık için bu özelliği geliştirir.

Uçtan Uca NMS Tasarım: YOLOv10 gibi, YOLO26 de doğal olarak uçtan uca bir tasarımdır, ancak eğitimi stabilize eden geliştirilmiş kayıp fonksiyonlarına sahiptir.
%43'e kadar daha hızlı CPU : Dağıtım Odak Kaybı (DFL) kaldırarak ve mimariyi optimize ederek, YOLO26 özellikle uç bilgi işlem ve güçlü GPU'lara sahip olmayan cihazlar için ayarlandı.
MuSGD Optimizer: SGD Muon'un bir karışımı olan bu optimizer, LLM eğitiminden bilgisayar görüşüne yenilikler getirerek daha hızlı yakınsama sağlar.
ProgLoss + STAL: Gelişmiş kayıp fonksiyonları, tarım ve hava görüntüleme gibi sektörler için kritik öneme sahip olan küçük nesne tanıma konusunda önemli iyileştirmeler sağlar.

Uygulamalarını geleceğe hazır hale getirmek isteyenler için, YOLO26'ya geçiş, en son araştırmalar ile pratik, üretime hazır güvenilirlik arasında en iyi dengeyi sunar.

Sonuç

Her ikisi de YOLOv10 ve YOLOv7 , bilgisayar görme tarihinde yerlerini sağlamlaştırmıştır. YOLOv7 , genel algılama için sağlam ve güvenilir bir seçenek YOLOv7 , YOLOv10 uçtan uca mimarilerin verimliliğine bir bakış YOLOv10 . Ancak, mutlak en iyi performans, kullanım kolaylığı ve uzun vadeli destek için Ultralytics , modern AI geliştirme için üstün bir seçenek olarak öne çıkmaktadır.

YOLOv10 YOLOv7: Mimari Evrimine Derinlemesine Bir Bakış

YOLOv10: NMS'siz Devrim

Önemli Teknik Detaylar

İdeal Kullanım Senaryoları

YOLOv7: "Ücretsiz Avantajlar Paketi" Güç Merkezi

Önemli Teknik Detaylar

İdeal Kullanım Senaryoları

Performans Karşılaştırması

Metrik Analizi

Ultralytics'in Avantajı

Gelecek: YOLO26 neden en iyi seçimdir?

Sonuç

Daha Fazla Okuma

Yorumlar