─░├žeri─če ge├ž

YOLOv9: Nesne Alg─▒lama Teknolojisinde ─░leriye Do─čru Bir At─▒l─▒m

YOLOv9, Programlanabilir Gradyan Bilgisi (PGI) ve Genelle┼čtirilmi┼č Verimli Katman Toplama A─č─▒ (GELAN) gibi ├ž─▒─č─▒r a├žan teknikler sunarak ger├žek zamanl─▒ nesne tespitinde ├Ânemli bir ilerlemeye i┼čaret etmektedir. Bu model, MS COCO veri setinde yeni ├Âl├ž├╝tler belirleyerek verimlilik, do─čruluk ve uyarlanabilirlikte kayda de─čer geli┼čmeler g├Âstermektedir. YOLOv9 projesi, ayr─▒ bir a├ž─▒k kaynak ekibi taraf─▒ndan geli┼čtirilmekle birlikte, ┼ču kurulu┼člar taraf─▒ndan sa─članan sa─člam kod taban─▒ ├╝zerine in┼ča edilmi┼čtir Ultralytics YOLOv5Yapay zeka ara┼čt─▒rma toplulu─čunun i┼čbirlik├ži ruhunu sergiliyor.



─░zle: Ultralytics | End├╝striyel Paket Veri K├╝mesi Kullan─▒larak ├ľzel Veriler ├ťzerinde YOLOv9 E─čitimi

YOLOv9 performans kar┼č─▒la┼čt─▒rmas─▒

YOLOv9'a Giri┼č

Optimum ger├žek zamanl─▒ nesne alg─▒lama aray─▒┼č─▒nda YOLOv9, derin sinir a─člar─▒n─▒n do─čas─▒nda bulunan bilgi kayb─▒ zorluklar─▒n─▒n ├╝stesinden gelmeye y├Ânelik yenilik├ži yakla┼č─▒m─▒yla ├Âne ├ž─▒k─▒yor. PGI ve ├žok y├Ânl├╝ GELAN mimarisini entegre eden YOLOv9, modelin ├Â─črenme kapasitesini art─▒rmakla kalm─▒yor, ayn─▒ zamanda alg─▒lama s├╝reci boyunca ├Ânemli bilgilerin korunmas─▒n─▒ sa─člayarak ola─čan├╝st├╝ do─čruluk ve performans elde ediyor.

YOLOv9'un Temel Yenilikleri

YOLOv9'un ilerlemeleri, derin sinir a─člar─▒ndaki bilgi kayb─▒n─▒n yaratt─▒─č─▒ zorluklar─▒ ele alma konusunda derin k├Âklere sahiptir. Bilgi Darbo─čaz─▒ ─░lkesi ve Tersinir ─░┼člevlerin yenilik├ži kullan─▒m─▒, tasar─▒m─▒n─▒n merkezinde yer al─▒r ve YOLOv9'un y├╝ksek verimlilik ve do─črulu─ču korumas─▒n─▒ sa─člar.

Bilgi Darbo─čaz─▒ ─░lkesi

Bilgi Darbo─čaz─▒ ─░lkesi, derin ├Â─črenmede temel bir zorlu─ču ortaya koymaktad─▒r: veriler bir a─č─▒n ard─▒┼č─▒k katmanlar─▒ndan ge├žtik├že, bilgi kayb─▒ potansiyeli artar. Bu olgu matematiksel olarak ┼ču ┼čekilde g├Âsterilir:

I(X, X) >= I(X, f_theta(X)) >= I(X, g_phi(f_theta(X)))

nerede I kar┼č─▒l─▒kl─▒ bilgiyi g├Âsterir ve f ve g parametreli d├Ân├╝┼č├╝m fonksiyonlar─▒n─▒ temsil eder theta ve phis─▒ras─▒yla. YOLOv9, a─č─▒n derinli─či boyunca temel verilerin korunmas─▒na yard─▒mc─▒ olan, daha g├╝venilir gradyan ├╝retimi ve sonu├ž olarak daha iyi model yak─▒nsamas─▒ ve performans─▒ sa─člayan Programlanabilir Gradyan Bilgisini (PGI) uygulayarak bu zorlu─ča kar┼č─▒ koymaktad─▒r.

Tersinir Fonksiyonlar

Tersine ├çevrilebilir Fonksiyonlar kavram─▒ YOLOv9'un tasar─▒m─▒n─▒n bir di─čer temel ta┼č─▒d─▒r. Bir fonksiyon, ┼ču ┼čekilde ifade edildi─či gibi herhangi bir bilgi kayb─▒ olmadan tersine ├ževrilebiliyorsa tersine ├ževrilebilir olarak kabul edilir:

X = v_zeta(r_psi(X))

ile psi ve zeta s─▒ras─▒yla tersine ├ževrilebilir ve ters fonksiyonu i├žin parametreler olarak. Bu ├Âzellik derin ├Â─črenme mimarileri i├žin ├žok ├Ânemlidir, ├ž├╝nk├╝ a─č─▒n eksiksiz bir bilgi ak─▒┼č─▒n─▒ korumas─▒na ve b├Âylece modelin parametrelerinde daha do─čru g├╝ncellemeler yap─▒lmas─▒na olanak tan─▒r. YOLOv9, ├Âzellikle daha derin katmanlarda bilgi bozulmas─▒ riskini azaltmak ve nesne alg─▒lama g├Ârevleri i├žin kritik verilerin korunmas─▒n─▒ sa─člamak i├žin mimarisine tersine ├ževrilebilir i┼člevler dahil eder.

Hafif Modeller ├ťzerindeki Etkisi

Bilgi kayb─▒n─▒n ele al─▒nmas─▒, genellikle yetersiz parametrelendirilmi┼č ve ileri besleme i┼člemi s─▒ras─▒nda ├Ânemli bilgileri kaybetmeye e─čilimli olan hafif modeller i├žin ├Âzellikle hayati ├Ânem ta┼č─▒maktad─▒r. YOLOv9'un mimarisi, PGI ve tersine ├ževrilebilir fonksiyonlar─▒n kullan─▒m─▒ sayesinde, basitle┼čtirilmi┼č bir modelde bile do─čru nesne tespiti i├žin gereken temel bilgilerin korunmas─▒n─▒ ve etkin bir ┼čekilde kullan─▒lmas─▒n─▒ sa─člar.

Programlanabilir Gradyan Bilgisi (PGI)

PGI, bilgi darbo─čaz─▒ sorunuyla m├╝cadele etmek i├žin YOLOv9'da tan─▒t─▒lan yeni bir kavramd─▒r ve derin a─č katmanlar─▒nda temel verilerin korunmas─▒n─▒ sa─člar. Bu, g├╝venilir gradyanlar─▒n olu┼čturulmas─▒na olanak tan─▒yarak do─čru model g├╝ncellemelerini kolayla┼čt─▒r─▒r ve genel alg─▒lama performans─▒n─▒ iyile┼čtirir.

Genelle┼čtirilmi┼č Verimli Katman Birle┼čtirme A─č─▒ (GELAN)

GELAN, YOLOv9'un ├╝st├╝n parametre kullan─▒m─▒ ve hesaplama verimlili─či elde etmesini sa─člayan stratejik bir mimari ilerlemeyi temsil etmektedir. Tasar─▒m─▒, ├že┼čitli hesaplama bloklar─▒n─▒n esnek entegrasyonuna izin vererek YOLOv9'u h─▒z veya do─čruluktan ├Âd├╝n vermeden geni┼č bir uygulama yelpazesine uyarlanabilir hale getirir.

YOLOv9 mimari kar┼č─▒la┼čt─▒rmas─▒

MS COCO Veri Seti ├ťzerindeki Performans

YOLOv9'un COCO veri k├╝mesindeki performans─▒, ├že┼čitli model boyutlar─▒nda yeni ├Âl├ž├╝tler belirleyerek ger├žek zamanl─▒ nesne alg─▒lamadaki ├Ânemli ilerlemelerini ├Ârneklemektedir. Tablo 1, YOLOv9'un ├╝st├╝n verimlili─čini ve do─črulu─čunu g├Âsteren, son teknoloji ├╝r├╝n├╝ ger├žek zamanl─▒ nesne dedekt├Ârlerinin kapsaml─▒ bir kar┼č─▒la┼čt─▒rmas─▒n─▒ sunmaktad─▒r.

Tablo 1. Son Teknoloji Ger├žek Zamanl─▒ Nesne Alg─▒lay─▒c─▒lar─▒n Kar┼č─▒la┼čt─▒r─▒lmas─▒

Di─čer model ├Âl├žekleri ne zaman sat─▒┼ča sunulacak?

A┼ča─č─▒daki tabloda ├že┼čitli model ├Âl├žekleri i├žin g├Âsterilen t├╝m metriklere ra─čmen, sadece i├žin konfig├╝rasyonlar YOLOv9c ve YOLOv9e yay─▒nlanm─▒┼čt─▒r. Ultralytics Ekibi, di─čer yap─▒land─▒rmalar─▒ kullan─▒labilir hale geldik├že eklemek i├žin h─▒zla ├žal─▒┼čacakt─▒r, bu nedenle g├╝ncellemeler i├žin buray─▒ d├╝zenli olarak kontrol etti─činizden emin olun.

Performans

Model boyut
(piksel)
mAPval
50-95
mAPval
50
params
(M)
FLOP'lar
(B)
YOLOv9t 640 38.3 53.1 2.0 7.7
YOLOv9s 640 46.8 63.4 7.2 26.7
YOLOv9m 640 51.4 68.1 20.1 76.8
YOLOv9c 640 53.0 70.2 25.5 102.8
YOLOv9e 640 55.6 72.8 58.1 192.5
Model boyut
(piksel)
mAPbox
50-95
mAPmask
50-95
params
(M)
FLOP'lar
(B)
YOLOv9c-seg 640 52.4 42.2 27.9 159.4
YOLOv9e-seg 640 55.1 44.3 60.5 248.4

YOLOv9'un yinelemeleri, k├╝├ž├╝kten t kapsaml─▒ bir varyant e modeli, sadece do─črulukta (mAP metrikleri) de─čil, ayn─▒ zamanda daha az say─▒da parametre ve hesaplama ihtiyac─▒ (FLOP) ile verimlilikte de geli┼čmeler g├Âstermektedir. Bu tablo, YOLOv9'un ├Ânceki s├╝r├╝mlere ve rakip modellere k─▒yasla hesaplama y├╝k├╝n├╝ korurken veya azalt─▒rken y├╝ksek hassasiyet sunma yetene─činin alt─▒n─▒ ├žizmektedir.

Kar┼č─▒la┼čt─▒rmal─▒ olarak, YOLOv9 dikkate de─čer kazan─▒mlar sergilemektedir:

  • Hafif Modeller: YOLOv9s, parametre verimlili─či ve hesaplama y├╝k├╝nde YOLO MS-S'yi geride b─▒rak─▒rken AP'de %0,4Ôł╝0,6'l─▒k bir iyile┼čme sa─člar.
  • Orta ila B├╝y├╝k Modeller: YOLOv9m ve YOLOv9e, model karma┼č─▒kl─▒─č─▒ ve tespit performans─▒ aras─▒ndaki dengeyi sa─člamada kayda de─čer ilerlemeler g├Âstererek, geli┼čmi┼č do─čruluk zemininde parametrelerde ve hesaplamalarda ├Ânemli azalmalar sunar.

├ľzellikle YOLOv9c modeli, mimarinin optimizasyonlar─▒n─▒n etkinli─čini vurgulamaktad─▒r. YOLOv7 AF'ye g├Âre %42 daha az parametre ve %21 daha az hesaplama ihtiyac─▒ ile ├žal─▒┼čmas─▒na ra─čmen kar┼č─▒la┼čt─▒r─▒labilir do─čruluk elde ederek YOLOv9'un ├Ânemli verimlilik iyile┼čtirmelerini ortaya koymaktad─▒r. Ayr─▒ca, YOLOv9e modeli, YOLOv9'a g├Âre %15 daha az parametre ve %25 daha az hesaplama ihtiyac─▒ ile b├╝y├╝k modeller i├žin yeni bir standart belirlemektedir. YOLOv8xBunun yan─▒ s─▒ra AP'de %1,7'lik bir art─▒┼č kaydedilmi┼čtir.

Bu sonu├žlar, YOLOv9'un model tasar─▒m─▒ndaki stratejik ilerlemelerini sergilemekte ve ger├žek zamanl─▒ nesne alg─▒lama g├Ârevleri i├žin gerekli hassasiyetten ├Âd├╝n vermeden geli┼čtirilmi┼č verimlili─čini vurgulamaktad─▒r. Model sadece performans ├Âl├ž├╝tlerinin s─▒n─▒rlar─▒n─▒ zorlamakla kalm─▒yor, ayn─▒ zamanda hesaplama verimlili─činin ├Ânemini vurgulayarak bilgisayarla g├Ârme alan─▒nda ├žok ├Ânemli bir geli┼čme sa─čl─▒yor.

Sonu├ž

YOLOv9, verimlilik, do─čruluk ve uyarlanabilirlik a├ž─▒s─▒ndan ├Ânemli iyile┼čtirmeler sunarak ger├žek zamanl─▒ nesne alg─▒lamada ├Ânemli bir geli┼čmeyi temsil etmektedir. PGI ve GELAN gibi yenilik├ži ├ž├Âz├╝mler arac─▒l─▒─č─▒yla kritik zorluklar─▒ ele alan YOLOv9, bu alanda gelecekteki ara┼čt─▒rma ve uygulamalar i├žin yeni bir emsal olu┼čturuyor. Yapay zeka toplulu─ču geli┼čmeye devam ederken, YOLOv9 teknolojik ilerlemeyi sa─člamada i┼čbirli─či ve inovasyonun g├╝c├╝n├╝n bir kan─▒t─▒ olarak duruyor.

Kullan─▒m ├ľrnekleri

Bu ├Ârnek basit YOLOv9 e─čitim ve ├ž─▒kar─▒m ├Ârnekleri sa─člar. Bu ve di─čer modlarla ilgili t├╝m belgeler i├žin Predict, Train, Val ve Export docs sayfalar─▒na bak─▒n.

├ľrnek

PyTorch ├Ân e─čitimli *.pt modellerin yan─▒ s─▒ra yap─▒land─▒rma *.yaml dosyalar ┼ču dosyalara aktar─▒labilir YOLO() s─▒n─▒f─▒nda bir model ├Ârne─či olu┼čturmak i├žin python:

from ultralytics import YOLO

# Build a YOLOv9c model from scratch
model = YOLO("yolov9c.yaml")

# Build a YOLOv9c model from pretrained weight
model = YOLO("yolov9c.pt")

# Display model information (optional)
model.info()

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLOv9c model on the 'bus.jpg' image
results = model("path/to/bus.jpg")

CLI komutlar─▒ modelleri do─črudan ├žal─▒┼čt─▒rmak i├žin kullan─▒labilir:

# Build a YOLOv9c model from scratch and train it on the COCO8 example dataset for 100 epochs
yolo train model=yolov9c.yaml data=coco8.yaml epochs=100 imgsz=640

# Build a YOLOv9c model from scratch and run inference on the 'bus.jpg' image
yolo predict model=yolov9c.yaml source=path/to/bus.jpg

Desteklenen G├Ârevler ve Modlar

YOLOv9 serisi, her biri y├╝ksek performansl─▒ Nesne Alg─▒lama i├žin optimize edilmi┼č bir dizi model sunar. Bu modeller, farkl─▒ hesaplama ihtiya├žlar─▒na ve do─čruluk gereksinimlerine cevap vererek onlar─▒ geni┼č bir uygulama yelpazesi i├žin ├žok y├Ânl├╝ hale getirir.

Model Dosya adlar─▒ G├Ârevler ├ç─▒kar─▒m Do─črulama E─čitim ─░hracat
YOLOv9 yolov9c.pt yolov9e.pt Nesne Alg─▒lama Ôťů Ôťů Ôťů Ôťů
YOLOv9-seg yolov9c-seg.pt yolov9e-seg.pt ├ľrnek Segmentasyonu Ôťů Ôťů Ôťů Ôťů

Bu tablo, YOLOv9 model varyantlar─▒na ayr─▒nt─▒l─▒ bir genel bak─▒┼č sunmakta, nesne alg─▒lama g├Ârevlerindeki yeteneklerini ve ├ç─▒kar─▒m, Do─črulama, E─čitim ve D─▒┼ča Aktarma gibi ├že┼čitli operasyonel modlarla uyumluluklar─▒n─▒ vurgulamaktad─▒r. Bu kapsaml─▒ destek, kullan─▒c─▒lar─▒n ├žok ├že┼čitli nesne alg─▒lama senaryolar─▒nda YOLOv9 modellerinin yeteneklerinden tam olarak yararlanabilmesini sa─člar.

Not

YOLOv9 modellerinin e─čitimi, e┼čde─čer b├╝y├╝kl├╝kteki YOLOv8 modeline g├Âre daha fazla kaynak gerektirecek ve daha uzun s├╝recektir.

At─▒flar ve Te┼čekk├╝r

YOLOv9 yazarlar─▒na ger├žek zamanl─▒ nesne alg─▒lama alan─▒ndaki ├Ânemli katk─▒lar─▒ndan dolay─▒ te┼čekk├╝r ederiz:

@article{wang2024yolov9,
  title={{YOLOv9}: Learning What You Want to Learn Using Programmable Gradient Information},
  author={Wang, Chien-Yao  and Liao, Hong-Yuan Mark},
  booktitle={arXiv preprint arXiv:2402.13616},
  year={2024}
}

Orijinal YOLOv9 makalesi arXiv'de bulunabilir. Yazarlar ├žal─▒┼čmalar─▒n─▒ kamuya a├ž─▒k hale getirmi┼člerdir ve kod taban─▒na GitHub ├╝zerinden eri┼čilebilir. Alan─▒ ilerletme ve ├žal─▒┼čmalar─▒n─▒ daha geni┼č bir topluluk i├žin eri┼čilebilir hale getirme ├žabalar─▒n─▒ takdir ediyoruz.



Created 2024-02-26, Updated 2024-06-10
Authors: glenn-jocher (7), RizwanMunawar (1), Burhan-Q (2), Laughing-q (1)

Yorumlar