─░├žeri─če ge├ž

YOLOv10: Ger├žek Zamanl─▒ U├žtan Uca Nesne Alg─▒lama

YOLOv10, ┼ču temeller ├╝zerine in┼ča edilmi┼čtir UltralyticsPython Tsinghua ├ťniversitesi'ndeki ara┼čt─▒rmac─▒lar taraf─▒ndan geli┼čtirilen paket, ger├žek zamanl─▒ nesne tespitine yeni bir yakla┼č─▒m getirerek ├Ânceki YOLO s├╝r├╝mlerinde bulunan hem i┼člem sonras─▒ hem de model mimarisi eksikliklerini gideriyor. Maksimum olmayan bast─▒rmay─▒ (NMS) ortadan kald─▒rarak ve ├že┼čitli model bile┼čenlerini optimize ederek, YOLOv10 ├Ânemli ├Âl├ž├╝de azalt─▒lm─▒┼č hesaplama ek y├╝k├╝ ile en son teknolojiye sahip performansa ula┼č─▒r. Kapsaml─▒ deneyler, ├žoklu model ├Âl├žeklerinde ├╝st├╝n do─čruluk-gecikme ├Âd├╝nle┼čimlerini g├Âstermektedir.

NMS'siz e─čitim i├žin YOLOv10 tutarl─▒ ikili atama

Genel Bak─▒┼č

Ger├žek zamanl─▒ nesne tespiti, g├Âr├╝nt├╝lerdeki nesne kategorilerini ve konumlar─▒n─▒ d├╝┼č├╝k gecikme s├╝resiyle do─čru bir ┼čekilde tahmin etmeyi ama├žlamaktad─▒r. YOLO serisi, performans ve verimlilik aras─▒ndaki dengesi nedeniyle bu ara┼čt─▒rman─▒n ├Ân saflar─▒nda yer alm─▒┼čt─▒r. Ancak, NMS'ye olan ba─č─▒ml─▒l─▒k ve mimari yetersizlikler optimum performans─▒ engellemi┼čtir. YOLOv10, NMS'siz e─čitim i├žin tutarl─▒ ikili atamalar ve b├╝t├╝nsel bir verimlilik-do─čruluk odakl─▒ model tasar─▒m stratejisi sunarak bu sorunlar─▒ ele almaktad─▒r.

Mimarl─▒k

YOLOv10'un mimarisi, ├Ânceki YOLO modellerinin g├╝├žl├╝ y├Ânlerini temel al─▒rken birka├ž ├Ânemli yenili─či de beraberinde getirmektedir. Model mimarisi a┼ča─č─▒daki bile┼čenlerden olu┼čmaktad─▒r:

  1. Omurga: ├ľzellik ├ž─▒karma i┼čleminden sorumlu olan YOLOv10'daki omurga, gradyan ak─▒┼č─▒n─▒ iyile┼čtirmek ve hesaplama fazlal─▒─č─▒n─▒ azaltmak i├žin CSPNet'in (Cross Stage Partial Network) geli┼čtirilmi┼č bir versiyonunu kullan─▒r.
  2. Neck: The neck is designed to aggregate features from different scales and passes them to the head. It includes PAN (Path Aggregation Network) layers for effective multi-scale feature fusion.
  3. Birden ├çok Kafaya: Zengin denetleyici sinyaller sa─člamak ve ├Â─črenme do─črulu─čunu art─▒rmak i├žin e─čitim s─▒ras─▒nda nesne ba┼č─▒na birden ├žok tahmin ├╝retir.
  4. Bire Bir Kafa: NMS ihtiyac─▒n─▒ ortadan kald─▒rmak i├žin ├ž─▒kar─▒m s─▒ras─▒nda nesne ba┼č─▒na tek bir en iyi tahmin ├╝retir, b├Âylece gecikmeyi azalt─▒r ve verimlili─či art─▒r─▒r.

Temel ├ľzellikler

  1. NMS'siz E─čitim: NMS ihtiyac─▒n─▒ ortadan kald─▒rmak i├žin tutarl─▒ ikili atamalar─▒ kullan─▒r ve ├ž─▒kar─▒m gecikmesini azalt─▒r.
  2. B├╝t├╝nsel Model Tasar─▒m─▒: Hafif s─▒n─▒fland─▒rma ba┼čl─▒klar─▒, uzamsal kanal ayr─▒┼čt─▒rmal─▒ a┼ča─č─▒ ├Ârnekleme ve s─▒ralama k─▒lavuzlu blok tasar─▒m─▒ dahil olmak ├╝zere ├že┼čitli bile┼čenlerin hem verimlilik hem de do─čruluk perspektiflerinden kapsaml─▒ optimizasyonu.
  3. Geli┼čtirilmi┼č Model Yetenekleri: ├ľnemli bir hesaplama maliyeti olmadan performans─▒ art─▒rmak i├žin b├╝y├╝k ├žekirdekli konvol├╝syonlar ve k─▒smi ├Âz dikkat mod├╝lleri i├žerir.

Model Varyantlar─▒

YOLOv10, farkl─▒ uygulama ihtiya├žlar─▒n─▒ kar┼č─▒lamak i├žin ├že┼čitli model ├Âl├žeklerinde gelir:

  • YOLOv10-N: Son derece k─▒s─▒tl─▒ kaynaklara sahip ortamlar i├žin nano versiyon.
  • YOLOv10-S: H─▒z ve do─črulu─ču dengeleyen k├╝├ž├╝k versiyon.
  • YOLOv10-M: Genel ama├žl─▒ kullan─▒m i├žin orta versiyon.
  • YOLOv10-B: Daha y├╝ksek do─čruluk i├žin geni┼čli─či art─▒r─▒lm─▒┼č dengeli versiyon.
  • YOLOv10-L: Artan hesaplama kaynaklar─▒ pahas─▒na daha y├╝ksek do─čruluk i├žin b├╝y├╝k versiyon.
  • YOLOv10-X: Maksimum do─čruluk ve performans i├žin ekstra b├╝y├╝k versiyon.

Performans

YOLOv10, do─čruluk ve verimlilik a├ž─▒s─▒ndan ├Ânceki YOLO s├╝r├╝mlerinden ve di─čer son teknoloji modellerden daha iyi performans g├Âstermektedir. ├ľrne─čin, YOLOv10-S, COCO veri setinde benzer AP ile RT-DETR-R18'den 1,8 kat daha h─▒zl─▒d─▒r ve YOLOv10-B, ayn─▒ performansla YOLOv9-C'den %46 daha az gecikmeye ve %25 daha az parametreye sahiptir.

Model Giri┼č Boyutu APval FLOP'lar (G) Gecikme S├╝resi (ms)
YOLOv10-N 640 38.5 6.7 1.84
YOLOv10-S 640 46.3 21.6 2.49
YOLOv10-M 640 51.1 59.1 4.74
YOLOv10-B 640 52.5 92.0 5.74
YOLOv10-L 640 53.2 120.3 7.28
YOLOv10-X 640 54.4 160.4 10.70

T4 GPU ├╝zerinde TensorRT FP16 ile ├Âl├ž├╝len gecikme s├╝resi.

Metodoloji

NMS'siz E─čitim i├žin Tutarl─▒ ─░kili Atamalar

YOLOv10, zengin denetim ve verimli u├žtan uca da─č─▒t─▒m sa─člamak i├žin e─čitim s─▒ras─▒nda bire-├žok ve bire-bir stratejileri birle┼čtirerek ikili etiket atamalar─▒ kullan─▒r. Tutarl─▒ e┼čle┼čtirme metri─či, her iki strateji aras─▒ndaki denetimi hizalayarak ├ž─▒kar─▒m s─▒ras─▒nda tahminlerin kalitesini art─▒r─▒r.

B├╝t├╝nsel Verimlilik-Do─čruluk Odakl─▒ Model Tasar─▒m─▒

Verimlilik ─░yile┼čtirmeleri

  1. Hafif S─▒n─▒fland─▒rma Kafas─▒: Derinlik bazl─▒ ayr─▒labilir konvol├╝syonlar kullanarak s─▒n─▒fland─▒rma kafas─▒n─▒n hesaplama y├╝k├╝n├╝ azalt─▒r.
  2. Uzamsal-Kanal Ayr─▒┼čt─▒rmal─▒ A┼ča─č─▒ ├Ârnekleme: Bilgi kayb─▒n─▒ ve hesaplama maliyetini en aza indirmek i├žin uzamsal azaltma ve kanal mod├╝lasyonunu ay─▒r─▒r.
  3. S─▒ralama K─▒lavuzlu Blok Tasar─▒m─▒: Blok tasar─▒m─▒n─▒ i├žsel kademe fazlal─▒─č─▒na g├Âre uyarlayarak optimum parametre kullan─▒m─▒n─▒ sa─člar.

Do─čruluk Geli┼čtirmeleri

  1. B├╝y├╝k ├çekirdekli Evri┼čim: ├ľzellik ├ž─▒karma kapasitesini art─▒rmak i├žin al─▒c─▒ alan─▒ geni┼čletir.
  2. K─▒smi ├ľz Dikkat (PSA): Minimum ek y├╝k ile k├╝resel temsil ├Â─črenimini iyile┼čtirmek i├žin ├Âz dikkat mod├╝llerini i├žerir.

Deneyler ve Sonu├žlar

YOLOv10, COCO gibi standart ├Âl├ž├╝tler ├╝zerinde kapsaml─▒ bir ┼čekilde test edilmi┼č ve ├╝st├╝n performans ve verimlilik g├Âstermi┼čtir. Model, farkl─▒ varyantlarda son teknoloji ├╝r├╝n├╝ sonu├žlar elde ederek ├Ânceki s├╝r├╝mlere ve di─čer ├ža─čda┼č dedekt├Ârlere k─▒yasla gecikme ve do─črulukta ├Ânemli geli┼čmeler sergilemektedir.

Kar┼č─▒la┼čt─▒rmalar

YOLOv10 ile SOTA nesne dedekt├Ârlerinin kar┼č─▒la┼čt─▒r─▒lmas─▒

Di─čer son teknoloji dedekt├Ârlerle kar┼č─▒la┼čt─▒r─▒ld─▒─č─▒nda:

  • YOLOv10-S / X, benzer do─črulukla RT-DETR-R18 / R101'den 1,8 ├Ś / 1,3 ├Ś daha h─▒zl─▒d─▒r
  • YOLOv10-B, ayn─▒ do─črulukta YOLOv9-C'ye g├Âre %25 daha az parametreye ve %46 daha d├╝┼č├╝k gecikme s├╝resine sahiptir
  • YOLOv10-L / X, 1,8 ├Ś / 2,3 ├Ś daha az parametre ile YOLOv8-L / X'den 0,3 AP / 0,5 AP daha iyi performans g├Âsterir

─░┼čte YOLOv10 varyantlar─▒n─▒n di─čer son teknoloji modellerle ayr─▒nt─▒l─▒ bir kar┼č─▒la┼čt─▒rmas─▒:

Model Paramlar (M) FLOP'lar (G) APval (%) Gecikme S├╝resi (ms) Gecikme (─░leri) (ms)
YOLOv6-3.0-N 4.7 11.4 37.0 2.69 1.76
Alt─▒n-YOLO-N 5.6 12.1 39.6 2.92 1.82
YOLOv8-N 3.2 8.7 37.3 6.16 1.77
YOLOv10-N 2.3 6.7 39.5 1.84 1.79
YOLOv6-3.0-S 18.5 45.3 44.3 3.42 2.35
Alt─▒n-YOLO-S 21.5 46.0 45.4 3.82 2.73
YOLOv8-S 11.2 28.6 44.9 7.07 2.33
YOLOv10-S 7.2 21.6 46.8 2.49 2.39
RT-DETR-R18 20.0 60.0 46.5 4.58 4.49
YOLOv6-3.0-M 34.9 85.8 49.1 5.63 4.56
Alt─▒n-YOLO-M 41.3 87.5 49.8 6.38 5.45
YOLOv8-M 25.9 78.9 50.6 9.50 5.09
YOLOv10-M 15.4 59.1 51.3 4.74 4.63
YOLOv6-3.0-L 59.6 150.7 51.8 9.02 7.90
Alt─▒n-YOLO-L 75.1 151.7 51.8 10.65 9.78
YOLOv8-L 43.7 165.2 52.9 12.39 8.06
RT-DETR-R50 42.0 136.0 53.1 9.20 9.07
YOLOv10-L 24.4 120.3 53.4 7.28 7.21
YOLOv8-X 68.2 257.8 53.9 16.86 12.83
RT-DETR-R101 76.0 259.0 54.3 13.71 13.58
YOLOv10-X 29.5 160.4 54.4 10.70 10.60

Kullan─▒m ├ľrnekleri

YOLOv10 ile yeni g├Âr├╝nt├╝leri tahmin etmek i├žin:

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Perform object detection on an image
results = model("image.jpg")

# Display the results
results[0].show()

YOLOv10'u ├Âzel bir veri k├╝mesi ├╝zerinde e─čitmek i├žin:

from ultralytics import YOLO

# Load YOLOv10n model from scratch
model = YOLO("yolov10n.yaml")

# Train the model
model.train(data="coco8.yaml", epochs=100, imgsz=640)

Desteklenen G├Ârevler ve Modlar

The YOLOv10 models series offers a range of models, each optimized for high-performance Object Detection. These models cater to varying computational needs and accuracy requirements, making them versatile for a wide array of applications.

Model Dosya adlar─▒ G├Ârevler ├ç─▒kar─▒m Do─črulama E─čitim ─░hracat
YOLOv10 yolov10n.pt yolov10s.pt yolov10m.pt yolov10l.pt yolov10x.pt Nesne Alg─▒lama Ôťů Ôťů Ôťů Ôťů

Exporting YOLOv10

Due to the new operations introduced with YOLOv10, not all export formats provided by Ultralytics are currently supported. The following table outlines which formats have been successfully converted using Ultralytics for YOLOv10. Feel free to open a pull request if you're able to provide a contribution change for adding export support of additional formats for YOLOv10.

Export Format Supported
TorchScript Ôťů
ONNX Ôťů
OpenVINO Ôťů
TensorRT Ôťů
CoreML ÔŁî
TF SavedModel ÔŁî
TF GraphDef ÔŁî
TF Lite ÔŁî
TF Kenar TPU ÔŁî
TF.js ÔŁî
PaddlePaddle ÔŁî
NCNN ÔŁî

Sonu├ž

YOLOv10, ├Ânceki YOLO s├╝r├╝mlerinin eksikliklerini gidererek ve yenilik├ži tasar─▒m stratejilerini dahil ederek ger├žek zamanl─▒ nesne alg─▒lamada yeni bir standart belirliyor. D├╝┼č├╝k hesaplama maliyeti ile y├╝ksek do─čruluk sunma yetene─či, onu ├žok ├že┼čitli ger├žek d├╝nya uygulamalar─▒ i├žin ideal bir se├žim haline getirmektedir.

At─▒flar ve Te┼čekk├╝r

Tsinghua ├ťniversitesi 'nden YOLOv10 yazarlar─▒na kapsaml─▒ ara┼čt─▒rmalar─▒ ve bu ├žal─▒┼čmaya yapt─▒klar─▒ ├Ânemli katk─▒lar i├žin te┼čekk├╝r ederiz. Ultralytics ├žer├ževe:

@article{THU-MIGyolov10,
  title={YOLOv10: Real-Time End-to-End Object Detection},
  author={Ao Wang, Hui Chen, Lihao Liu, et al.},
  journal={arXiv preprint arXiv:2405.14458},
  year={2024},
  institution={Tsinghua University},
  license = {AGPL-3.0}
}

Ayr─▒nt─▒l─▒ uygulama, mimari yenilikler ve deneysel sonu├žlar i├žin l├╝tfen Tsinghua ├ťniversitesi ekibi taraf─▒ndan haz─▒rlanan YOLOv10 ara┼čt─▒rma makalesine ve GitHub deposuna bak─▒n.



Created 2024-05-25, Updated 2024-06-20
Authors: Burhan-Q (1), glenn-jocher (3), RizwanMunawar (2)

Yorumlar