─░├žeri─če ge├ž

Baidu'nun RT-DETR: G├Âr├╝┼č D├Ân├╝┼čt├╝r├╝c├╝s├╝ Tabanl─▒ Ger├žek Zamanl─▒ Nesne Alg─▒lay─▒c─▒s─▒

Genel Bak─▒┼č

Baidu taraf─▒ndan geli┼čtirilen Real-Time Detection Transformer (RT-DETR), y├╝ksek do─črulu─ču korurken ger├žek zamanl─▒ performans sa─člayan son teknoloji u├žtan uca bir nesne dedekt├Âr├╝d├╝r. DETR (NMS i├žermeyen ├žer├ževe) fikrine dayan─▒r, bu arada ger├žek zamanl─▒ h─▒z kazanmak i├žin conv tabanl─▒ omurga ve verimli bir hibrit kodlay─▒c─▒ sunar. RT-DETR , ├Âl├žek i├ži etkile┼čimi ve ├Âl├žekler aras─▒ f├╝zyonu ay─▒rarak ├žok ├Âl├žekli ├Âzellikleri verimli bir ┼čekilde i┼čler. Model son derece uyarlanabilirdir ve yeniden e─čitim olmadan farkl─▒ kod ├ž├Âz├╝c├╝ katmanlar─▒ kullanarak ├ž─▒kar─▒m h─▒z─▒n─▒n esnek bir ┼čekilde ayarlanmas─▒n─▒ destekler. RT-DETR , TensorRT ile CUDA gibi h─▒zland─▒r─▒lm─▒┼č arka u├žlarda ├╝st├╝nl├╝k sa─člar ve di─čer bir├žok ger├žek zamanl─▒ nesne dedekt├Âr├╝nden daha iyi performans g├Âsterir.



─░zle: Ger├žek Zamanl─▒ Alg─▒lama Transformat├Âr├╝ (RT-DETR)

├ľrnek model g├Âr├╝nt├╝s├╝ Baidu'ya Genel Bak─▒┼č RT-DETR. RT-DETR model mimari diyagram─▒, kodlay─▒c─▒ya girdi olarak omurgan─▒n son ├╝├ž a┼čamas─▒n─▒ {S3, S4, S5} g├Âstermektedir. Etkili hibrit kodlay─▒c─▒, ├Âl├žek i├ži ├Âzellik etkile┼čimi (AIFI) ve ├Âl├žekler aras─▒ ├Âzellik f├╝zyon mod├╝l├╝ (CCFM) arac─▒l─▒─č─▒yla ├žok ├Âl├žekli ├Âzellikleri bir dizi g├Âr├╝nt├╝ ├Âzelli─čine d├Ân├╝┼čt├╝r├╝r. IoU fark─▒ndal─▒ sorgu se├žimi, kod ├ž├Âz├╝c├╝ i├žin ilk nesne sorgular─▒ olarak hizmet edecek sabit say─▒da g├Âr├╝nt├╝ ├Âzelli─čini se├žmek i├žin kullan─▒l─▒r. Son olarak, yard─▒mc─▒ tahmin kafalar─▒na sahip kod ├ž├Âz├╝c├╝, kutular─▒ ve g├╝ven puanlar─▒n─▒ olu┼čturmak i├žin nesne sorgular─▒n─▒ yinelemeli olarak optimize eder (kaynak).

Temel ├ľzellikler

  • Verimli Hibrit Kodlay─▒c─▒: Baidu RT-DETR , ├Âl├žek i├ži etkile┼čimi ve ├Âl├žekler aras─▒ f├╝zyonu ayr─▒┼čt─▒rarak ├žok ├Âl├žekli ├Âzellikleri i┼čleyen verimli bir hibrit kodlay─▒c─▒ kullan─▒r. Bu benzersiz Vision Transformers tabanl─▒ tasar─▒m, hesaplama maliyetlerini azalt─▒r ve ger├žek zamanl─▒ nesne tespitine olanak tan─▒r.
  • IoU fark─▒ndal─▒ Sorgu Se├žimi: Baidu'nun RT-DETR adresi, IoU fark─▒ndal─▒ sorgu se├žimini kullanarak nesne sorgusu ba┼člatmay─▒ geli┼čtirir. Bu, modelin sahnedeki en alakal─▒ nesnelere odaklanmas─▒n─▒ sa─člayarak alg─▒lama do─črulu─čunu art─▒r─▒r.
  • Uyarlanabilir ├ç─▒kar─▒m H─▒z─▒: Baidu'nun RT-DETR adresi, yeniden e─čitime gerek kalmadan farkl─▒ kod ├ž├Âz├╝c├╝ katmanlar─▒ kullanarak ├ž─▒kar─▒m h─▒z─▒n─▒n esnek bir ┼čekilde ayarlanmas─▒n─▒ destekler. Bu uyarlanabilirlik, ├že┼čitli ger├žek zamanl─▒ nesne alg─▒lama senaryolar─▒nda pratik uygulamay─▒ kolayla┼čt─▒r─▒r.

├ľnceden E─čitilmi┼č Modeller

Ultralytics Python API, farkl─▒ ├Âl├žeklerde ├Ânceden e─čitilmi┼č PaddlePaddle RT-DETR modelleri sa─člar:

  • RT-DETR-L: COCO val2017 ├╝zerinde %53,0 AP, T4 GPU ├╝zerinde 114 FPS
  • RT-DETR-X: COCO val2017 ├╝zerinde %54,8 AP, T4 GPU ├╝zerinde 74 FPS

Kullan─▒m ├ľrnekleri

Bu ├Ârnek basit RT-DETR e─čitim ve ├ž─▒kar─▒m ├Ârnekleri sa─člar. Bu ve di─čer modlar hakk─▒nda tam dok├╝mantasyon i├žin Predict, Train, Val ve Export docs sayfalar─▒na bak─▒n.

├ľrnek

from ultralytics import RTDETR

# Load a COCO-pretrained RT-DETR-l model
model = RTDETR("rtdetr-l.pt")

# Display model information (optional)
model.info()

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the RT-DETR-l model on the 'bus.jpg' image
results = model("path/to/bus.jpg")
# Load a COCO-pretrained RT-DETR-l model and train it on the COCO8 example dataset for 100 epochs
yolo train model=rtdetr-l.pt data=coco8.yaml epochs=100 imgsz=640

# Load a COCO-pretrained RT-DETR-l model and run inference on the 'bus.jpg' image
yolo predict model=rtdetr-l.pt source=path/to/bus.jpg

Desteklenen G├Ârevler ve Modlar

Bu tabloda model t├╝rleri, ├Ânceden e─čitilmi┼č belirli a─č─▒rl─▒klar, her model taraf─▒ndan desteklenen g├Ârevler ve Ôťů emojileriyle g├Âsterilen desteklenen ├že┼čitli modlar(Train, Val, Predict, Export) sunulmaktad─▒r.

Model Tipi ├ľnceden E─čitilmi┼č A─č─▒rl─▒klar Desteklenen G├Ârevler ├ç─▒kar─▒m Do─črulama E─čitim ─░hracat
RT-DETR B├╝y├╝k rtdetr-l.pt Nesne Alg─▒lama Ôťů Ôťů Ôťů Ôťů
RT-DETR Ekstra B├╝y├╝k rtdetr-x.pt Nesne Alg─▒lama Ôťů Ôťů Ôťů Ôťů

At─▒flar ve Te┼čekk├╝r

Ara┼čt─▒rma veya geli┼čtirme ├žal─▒┼čmalar─▒n─▒zda Baidu'nun RT-DETR adresini kullan─▒rsan─▒z, l├╝tfen orijinal makaleye at─▒fta bulunun:

@misc{lv2023detrs,
      title={DETRs Beat YOLOs on Real-time Object Detection},
      author={Wenyu Lv and Shangliang Xu and Yian Zhao and Guanzhong Wang and Jinman Wei and Cheng Cui and Yuning Du and Qingqing Dang and Yi Liu},
      year={2023},
      eprint={2304.08069},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

Baidu'ya ve a┼ča─č─▒daki kurulu┼člara te┼čekk├╝r etmek isteriz PaddlePaddle ekibine bilgisayarla g├Ârme toplulu─ču i├žin bu de─čerli kayna─č─▒ olu┼čturduklar─▒ ve s├╝rd├╝rd├╝kleri i├žin te┼čekk├╝r ederiz. Vision Transformers tabanl─▒ ger├žek zamanl─▒ nesne dedekt├Âr├╝ RT-DETR'un geli┼čtirilmesiyle alana yapt─▒klar─▒ katk─▒ b├╝y├╝k takdir g├Ârmektedir.

Anahtar Kelimeler: RT-DETR, Transformer, ViT, Vision Transformers, Baidu RT-DETR, PaddlePaddle, Paddle Paddle RT-DETR, ger├žek zamanl─▒ nesne alg─▒lama, Vision Transformers tabanl─▒ nesne alg─▒lama, ├Ânceden e─čitilmi┼č PaddlePaddle RT-DETR modelleri, Baidu'nun RT-DETR kullan─▒m─▒, Ultralytics Python API



Created 2023-11-12, Updated 2024-06-10
Authors: glenn-jocher (13), RizwanMunawar (1)

Yorumlar