COCO128-Seg 데이터셋

소개

Ultralytics COCO128-Seg는 COCO train 2017 세트의 첫 128개 이미지로 구성된 작지만 다재다능한 instance segmentation 데이터셋입니다. 이 데이터셋은 세그멘테이션 모델을 테스트 및 디버깅하거나 새로운 탐지 접근 방식을 실험하는 데 이상적입니다. 128개의 이미지로 구성되어 있어 관리가 쉽고, 더 큰 데이터셋을 학습하기 전에 학습 파이프라인의 오류를 테스트하고 정상 작동 여부를 확인(sanity check)할 수 있을 만큼 다양합니다.

데이터셋 구조

  • 이미지: 총 128개입니다. 기본 YAML은 학습 및 검증에 동일한 디렉토리를 재사용하므로 빠르게 반복할 수 있지만, 원하는 경우 분할을 복제하거나 사용자 지정할 수 있습니다.
  • 클래스: COCO와 동일한 80개의 객체 카테고리입니다.
  • 라벨: 각 이미지 옆의 labels/{train,val} 폴더에 저장된 YOLO 형식의 폴리곤입니다.

이 데이터셋은 Ultralytics PlatformYOLO26과 함께 사용하도록 의도되었습니다.

데이터셋 YAML

YAML(Yet Another Markup Language) 파일은 데이터셋 구성을 정의하는 데 사용됩니다. 이 파일에는 데이터셋 경로, 클래스 및 기타 관련 정보가 포함되어 있습니다. COCO128-Seg 데이터셋의 경우, coco128-seg.yaml 파일은 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco128-seg.yaml에서 관리됩니다.

ultralytics/cfg/datasets/coco128-seg.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO128-seg dataset https://www.kaggle.com/datasets/ultralytics/coco128 (first 128 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/segment/coco/
# Example usage: yolo train data=coco128-seg.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco128-seg ← downloads here (7 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco128-seg # dataset root dir
train: images/train2017 # train images (relative to 'path') 128 images
val: images/train2017 # val images (relative to 'path') 128 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco128-seg.zip

사용법

이미지 크기 640으로 100 epochs 동안 COCO128-Seg 데이터셋에서 YOLO26n-seg 모델을 학습하려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수에 대한 포괄적인 목록은 모델 Training 페이지를 참조하십시오.

학습 예제
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-seg.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco128-seg.yaml", epochs=100, imgsz=640)

샘플 이미지 및 주석

다음은 COCO128-Seg 데이터셋의 이미지 예시와 해당 주석입니다:

COCO128-seg instance segmentation dataset mosaic
  • 모자이크 이미지: 이 이미지는 모자이크 처리된 데이터셋 이미지들로 구성된 학습 배치를 보여줍니다. 모자이킹은 학습 중에 여러 이미지를 하나의 이미지로 결합하여 각 학습 배치 내의 객체와 장면의 다양성을 높이는 데 사용되는 기법입니다. 이는 모델이 다양한 객체 크기, 가로세로 비율 및 문맥으로 일반화하는 능력을 향상시키는 데 도움을 줍니다.

이 예시는 COCO128-Seg 데이터셋 이미지의 다양성과 복잡성, 그리고 학습 과정에서 모자이킹(mosaicing)을 사용할 때의 이점을 보여줍니다.

인용 및 감사의 글

연구 또는 개발 작업에 COCO 데이터셋을 사용하는 경우, 다음 논문을 인용해 주십시오:

인용
@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

We would like to acknowledge the COCO Consortium for creating and maintaining this valuable resource for the computer vision community. For more information about the COCO dataset and its creators, visit the COCO dataset website.

FAQ

COCO128-Seg 데이터셋이란 무엇이며, Ultralytics YOLO26에서 어떻게 사용됩니까?

COCO128-Seg 데이터셋은 Ultralytics에서 제공하는 소형 인스턴스 세그멘테이션 데이터셋으로, COCO train 2017 세트의 첫 128개 이미지로 구성됩니다. 이 데이터셋은 세그멘테이션 모델을 테스트 및 디버깅하거나 새로운 탐지 방법을 실험하는 데 최적화되어 있습니다. 특히 더 큰 데이터셋으로 확장하기 전, Ultralytics YOLO26Platform과 함께 사용하여 빠른 반복 학습 및 파이프라인 오류 검사에 매우 유용합니다. 자세한 사용법은 모델 Training 페이지를 참조하십시오.

COCO128-Seg 데이터셋을 사용하여 어떻게 YOLO26n-seg 모델을 학습할 수 있습니까?

이미지 크기 640으로 100 epoch 동안 COCO128-Seg 데이터셋에서 YOLO26n-seg 모델을 학습하려면 Python 또는 CLI 명령어를 사용할 수 있습니다. 간단한 예시는 다음과 같습니다:

학습 예제
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-seg.pt")  # Load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco128-seg.yaml", epochs=100, imgsz=640)

사용 가능한 인수 및 구성 옵션에 대한 자세한 설명은 학습 문서를 확인하십시오.

COCO128-Seg 데이터셋이 모델 개발 및 디버깅에 중요한 이유는 무엇입니까?

COCO128-Seg 데이터셋은 128개의 이미지로 관리 용이성과 다양성의 균형을 갖추고 있어, 세그멘테이션 모델을 빠르게 테스트 및 디버깅하거나 새로운 탐지 기술을 실험하는 데 완벽합니다. 적당한 크기 덕분에 빠른 학습 반복이 가능하면서도, 더 큰 데이터셋으로 확장하기 전에 학습 파이프라인을 검증할 수 있을 만큼 충분한 다양성을 제공합니다. 지원되는 데이터셋 형식에 대한 자세한 내용은 Ultralytics 세그멘테이션 데이터셋 가이드를 참조하십시오.

COCO128-Seg 데이터셋의 YAML 구성 파일은 어디에서 찾을 수 있습니까?

COCO128-Seg 데이터셋을 위한 YAML 구성 파일은 Ultralytics 저장소에서 확인할 수 있습니다. https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco128-seg.yaml에서 직접 파일에 액세스할 수 있습니다. 이 YAML 파일에는 모델 학습 및 검증에 필요한 데이터셋 경로, 클래스 및 구성 설정에 관한 필수 정보가 포함되어 있습니다.

COCO128-Seg 데이터셋으로 학습할 때 모자이킹을 사용하면 어떤 이점이 있습니까?

학습 중 **모자이킹(mosaicing)**을 사용하면 각 학습 배치 내 객체와 장면의 다양성을 높이는 데 도움이 됩니다. 이 기법은 여러 이미지를 하나의 합성 이미지로 결합하여, 장면 내 다양한 객체 크기, 가로세로 비율 및 컨텍스트에 대한 모델의 일반화 능력을 향상시킵니다. 모자이킹은 COCO128-Seg와 같이 적당한 크기의 데이터셋으로 작업할 때 모델의 견고성과 정확도를 향상시키는 데 유익합니다. 모자이킹된 이미지 예시는 샘플 이미지 및 주석 섹션을 참조하십시오.

댓글