κ°μ²΄ κ°μ§ λ°μ΄ν° μΈνΈ κ°μ
κ°λ ₯νκ³ μ νν κ°μ²΄ κ°μ§ λͺ¨λΈμ νλ ¨νλ €λ©΄ ν¬κ΄μ μΈ λ°μ΄ν° μΈνΈκ° νμν©λλ€. μ΄ κ°μ΄λμμλ Ultralytics YOLO λͺ¨λΈκ³Ό νΈνλλ λ€μν νμμ λ°μ΄ν°μ μ μκ°νκ³ κ·Έ ꡬ쑰, μ¬μ©λ², μλ‘ λ€λ₯Έ νμ κ° λ³ν λ°©λ²μ λν μΈμ¬μ΄νΈλ₯Ό μ 곡ν©λλ€.
μ§μλλ λ°μ΄ν° μΈνΈ νμ
Ultralytics YOLO νμ
Ultralytics YOLO νμμ λ°μ΄ν° μΈνΈ κ΅¬μ± νμμΌλ‘, λ°μ΄ν° μΈνΈ λ£¨νΈ λλ ν°λ¦¬, νΈλ μ΄λ/κ²μ¦/ν
μ€νΈ μ΄λ―Έμ§ λλ ν°λ¦¬μ μλ κ²½λ‘ λλ *.txt
νμΌκ³Ό μ΄λ―Έμ§ κ²½λ‘κ° ν¬ν¨λ ν΄λμ€ μ΄λ¦ μ¬μ μ΄ μμ΅λλ€. λ€μμ μμμ
λλ€:
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes (80 COCO classes)
names:
0: person
1: bicycle
2: car
# ...
77: teddy bear
78: hair drier
79: toothbrush
μ΄ νμμ λ μ΄λΈμ YOLO νμμΌλ‘ λ΄λ³΄λ΄μΌ ν©λλ€. *.txt
νμΌμ μΆκ°ν©λλ€. μ΄λ―Έμ§μ κ°μ²΄κ° μλ κ²½μ°μλ *.txt
νμΌμ΄ νμν©λλ€. νμΌμ *.txt
νμΌμ κ°μ²΄λΉ ν νμΌλ‘ ν¬λ§·ν΄μΌ ν©λλ€. class x_center y_center width height
νμμ΄μ΄μΌ ν©λλ€. μμ μ’νλ μ κ·νλ xywh νμ(0μμ 1κΉμ§)μ μ¬μ©ν΄μΌ ν©λλ€. μμκ° ν½μ
λ¨μμΈ κ²½μ° λ€μμ λλμ΄μΌ ν©λλ€. x_center
κ·Έλ¦¬κ³ width
λ₯Ό μ΄λ―Έμ§ λλΉλ‘, κ·Έλ¦¬κ³ y_center
κ·Έλ¦¬κ³ height
λ₯Ό μ΄λ―Έμ§ λμ΄λ³λ‘ μ λ ¬ν©λλ€. ν΄λμ€ λ²νΈλ 0μΌλ‘ μμνλ μ μΈλ±μ€μ¬μΌ ν©λλ€.
μ μ΄λ―Έμ§μ ν΄λΉνλ λΌλ²¨ νμΌμλ 2μΈ(ν΄λμ€ 0
) λ° λμ (ν΄λμ€ 27
):
Ultralytics YOLO νμμ μ¬μ©νλ κ²½μ° μλ COCO8 λ°μ΄ν° μΈνΈ μμμ κ°μ΄ νΈλ μ΄λ λ° μ ν¨μ± κ²μ¬ μ΄λ―Έμ§μ λ μ΄λΈμ ꡬμ±ν©λλ€.
μ¬μ©λ²
μ΄λ¬ν νμμ μ¬μ©νμ¬ λͺ¨λΈμ νλ ¨νλ λ°©λ²μ λ€μκ³Ό κ°μ΅λλ€:
μ
μ§μλλ λ°μ΄ν° μΈνΈ
λ€μμ μ§μλλ λ°μ΄ν° μΈνΈ λͺ©λ‘κ³Ό κ° λ°μ΄ν° μΈνΈμ λν κ°λ΅ν μ€λͺ μ λλ€:
- Argoverse: μμ¨μ£Όν μ°¨λμμ μμ§ν μΌμ λ°μ΄ν° λͺ¨μμ λλ€. μ¬κΈ°μλ μλμ°¨ κ°μ²΄μ λν 3D μΆμ μ£Όμμ΄ ν¬ν¨λμ΄ μμ΅λλ€.
- COCO: COCO(Common Objects in Context)λ 80κ°μ κ°μ²΄ λ²μ£Όλ‘ ꡬμ±λ λκ·λͺ¨ κ°μ²΄ κ°μ§, μΈλΆν λ° μΊ‘μ λ°μ΄ν° μΈνΈμ λλ€.
- LVIS: LVIS: 1203κ°μ κ°μ²΄ μΉ΄ν κ³ λ¦¬κ° μλ λκ·λͺ¨ κ°μ²΄ κ°μ§, λΆν λ° μΊ‘μ λ°μ΄ν° μΈνΈμ λλ€.
- COCO8: COCO λ°μ΄ν° μΈνΈμ λ μμ νμ μ§ν©μΈ COCO8μ λ κ°λ³κ³ λΉ λ₯΄κ² νμ΅ν μ μμ΅λλ€.
- κΈλ‘λ² λ°2020: κΈλ‘λ² λ° μ±λ¦°μ§ 2020μ λ° λ¨Έλ¦¬ μ΄λ―Έμ§κ° ν¬ν¨λ λ°μ΄ν° μΈνΈμ λλ€.
- μ€λΈμ νΈ365: 물체 κ°μ§ μ°κ΅¬λ₯Ό λ°μ μν€κΈ° μν΄ 365κ°μ 물체 μΉ΄ν κ³ λ¦¬μ 60λ§ κ°μ μ΄λ―Έμ§κ° ν¬ν¨λ λκ·λͺ¨ 물체 κ°μ§ λ°μ΄ν° μΈνΈμ λλ€.
- OpenImagesV7: 170λ§ κ°μ κΈ°μ°¨ μ΄λ―Έμ§μ 4λ§ 2μ² κ°μ μ ν¨μ± κ²μ¬ μ΄λ―Έμ§κ° ν¬ν¨λ Googleμ ν¬κ΄μ μΈ λ°μ΄ν° μΈνΈμ λλ€.
- SKU-110K: μ맀 νκ²½ κ°μ²΄ κ°μ§λ₯Ό μν λ°μ§λ μ맀 μ ν μ΄λ―Έμ§κ° ν¬ν¨λ λ°μ΄ν° μΈνΈμ λλ€.
- VisDrone: μλμ°¨, 보νμ, μμ κ±° νλ μ¬λ λ± λ€μν κ°μ²΄ μΉ΄ν κ³ λ¦¬λ₯Ό ν¬ν¨νλ λλ‘ κΈ°λ° μ΄λ―Έμ§μ μ΄μ μ λ§μΆ λ°μ΄ν° μΈνΈμ λλ€.
- VOC: μ°¨λ, λλ¬Ό, κ°κ΅¬ λ± 20κ°μ κ°μ²΄ μΉ΄ν κ³ λ¦¬λ₯Ό ν¬ν¨νλ μΈκΈ° μλ κ°μ²΄ κ°μ§ λ°μ΄ν° μΈνΈμ λλ€.
- xView: μ€λ²ν€λ λ·°μμ λ€μν κ°μ²΄ ν΄λμ€λ₯Ό κ°μ§νλλ‘ μ€κ³λ κ³ ν΄μλ μμ± μ΄λ―Έμ§κ° ν¬ν¨λ λ°μ΄ν° μΈνΈμ λλ€.
- λμ’ μ: μ΄ λ°μ΄ν° μΈνΈλ λμ’ μμ μ‘΄μ¬ μ¬λΆ, μμΉ λ° νΉμ§μ λν μ λ³΄κ° ν¬ν¨λ MRI λλ CT μ€μΊ μ΄λ―Έμ§λ‘ ꡬμ±λ©λλ€. μ’ μ μλ³μ μλννμ¬ μ‘°κΈ° μ§λ¨ λ° μΉλ£ κ³νμ μ©μ΄νκ² νλ μ»΄ν¨ν° λΉμ λͺ¨λΈμ νλ ¨νλ λ° μ€μν μν μ ν©λλ€.
- μν리카 μΌμλλ¬Ό: λ²νλ‘, μ½λΌλ¦¬, μ½λΏμ, μΌλ£©λ§ λ± μν리카 μΌμλλ¬Όμ μ΄λ―Έμ§κ° ν¬ν¨λ μ΄ λ°μ΄ν° μΈνΈλ μ»΄ν¨ν° λΉμ λͺ¨λΈμ νλ ¨νλ λ° μ€μν μν μ ν©λλ€. λ€μν μμμ§μμ λλ¬Όμ μλ³νλ λ° νμμ μ΄λ©° μΌμλλ¬Ό μ°κ΅¬ λ Έλ ₯μ ν¬κ² κΈ°μ¬ν©λλ€.
λλ§μ λ°μ΄ν° μ§ν© μΆκ°νκΈ°
μ체 λ°μ΄ν° μΈνΈκ° μκ³ μ΄λ₯Ό Ultralytics YOLO νμμΌλ‘ νμ§ λͺ¨λΈ νμ΅μ μ¬μ©νλ €λ κ²½μ°, μμ "Ultralytics YOLO νμ"μ μ§μ λ νμμ λ°λ₯΄λμ§ νμΈνμΈμ. μ΄λ Έν μ΄μ μ νμν νμμΌλ‘ λ³ννκ³ YAML κ΅¬μ± νμΌμ κ²½λ‘, ν΄λμ€ μ, ν΄λμ€ μ΄λ¦μ μ§μ νμΈμ.
λΌλ²¨ νμ ν¬νΈ λλ λ³ν
COCO λ°μ΄ν° μΈνΈ νμμ YOLO νμμΌλ‘ λ³ν
λ€μ μ½λ μ€λν«μ μ¬μ©νμ¬ λ리 μ¬μ©λλ COCO λ°μ΄ν° μΈνΈ νμμμ YOLO νμμΌλ‘ λΌλ²¨μ μ½κ² λ³νν μ μμ΅λλ€:
μ
μ΄ λ³ν λꡬλ COCO λ°μ΄ν° μΈνΈ λλ COCO νμμ λ°μ΄ν° μΈνΈλ₯Ό Ultralytics YOLO νμμΌλ‘ λ³ννλ λ° μ¬μ©ν μ μμ΅λλ€.
μ¬μ©νλ €λ λ°μ΄ν° μΈνΈκ° λͺ¨λΈκ³Ό νΈνλλμ§, νμν νμ κ·μΉμ λ°λ₯΄κ³ μλμ§ λ€μ ν λ² νμΈνλ κ²μ μμ§ λ§μΈμ. μ¬λ°λ₯Έ νμμ λ°μ΄ν° μΈνΈλ μ±κ³΅μ μΈ κ°μ²΄ κ°μ§ λͺ¨λΈμ νμ΅μν€λ λ° λ§€μ° μ€μν©λλ€.
2023-11-12 μμ±, 2024-04-18 μ λ°μ΄νΈλ¨
μμ±μ: glenn-jocher (7), IvorZhu331 (1), Laughing-q (1), RizwanMunawar (1)