COCO8-Seg 데이터셋

소개

Ultralytics COCO8-Seg는 COCO train 2017 세트의 첫 8개 이미지(학습용 4개, 검증용 4개)로 구성된 작지만 다재다능한 인스턴스 세그멘테이션 데이터셋입니다. 이 데이터셋은 세그멘테이션 모델을 테스트 및 디버깅하거나 새로운 탐지 접근 방식을 실험하는 데 이상적입니다. 8개의 이미지로 구성되어 관리가 쉽지만, 더 큰 데이터셋을 학습하기 전에 학습 파이프라인의 오류를 테스트하고 무결성 검사(sanity check)를 수행하기에 충분히 다양합니다.

데이터셋 구조

  • 이미지: 총 8개 (학습용 4개 / 검증용 4개).
  • 클래스: 80개의 COCO 카테고리.
  • 라벨: 각 이미지 파일과 일치하며 labels/{train,val} 아래에 저장된 YOLO 형식의 폴리곤.

이 데이터셋은 Ultralytics PlatformYOLO26과 함께 사용하도록 의도되었습니다.

데이터셋 YAML

YAML(Yet Another Markup Language) 파일은 데이터셋 구성을 정의하는 데 사용됩니다. 이 파일에는 데이터셋 경로, 클래스 및 기타 관련 정보가 포함되어 있습니다. COCO8-Seg 데이터셋의 경우 coco8-seg.yaml 파일이 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8-seg.yaml에 유지 관리됩니다.

ultralytics/cfg/datasets/coco8-seg.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8-seg dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/segment/coco8-seg/
# Example usage: yolo train data=coco8-seg.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8-seg ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-seg # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-seg.zip

사용법

COCO8-Seg 데이터셋에서 100 에포크 동안 이미지 크기 640으로 YOLO26n-seg 모델을 학습하려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수의 전체 목록은 모델 학습 페이지를 참조하십시오.

학습 예제
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-seg.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8-seg.yaml", epochs=100, imgsz=640)

샘플 이미지 및 주석

다음은 COCO8-Seg 데이터셋 이미지와 그에 해당하는 주석의 몇 가지 예시입니다:

COCO8-seg instance segmentation dataset mosaic
  • 모자이크 이미지: 이 이미지는 모자이크 처리된 데이터셋 이미지들로 구성된 학습 배치를 보여줍니다. 모자이킹은 학습 중에 여러 이미지를 하나의 이미지로 결합하여 각 학습 배치 내의 객체와 장면의 다양성을 높이는 데 사용되는 기법입니다. 이는 모델이 다양한 객체 크기, 가로세로 비율 및 문맥으로 일반화하는 능력을 향상시키는 데 도움을 줍니다.

이 예시는 COCO8-Seg 데이터셋 이미지의 다양성과 복잡성, 그리고 학습 과정에서 모자이크 처리를 사용하는 이점을 보여줍니다.

인용 및 감사의 글

연구 또는 개발 작업에 COCO 데이터셋을 사용하는 경우, 다음 논문을 인용해 주십시오:

인용
@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

We would like to acknowledge the COCO Consortium for creating and maintaining this valuable resource for the computer vision community. For more information about the COCO dataset and its creators, visit the COCO dataset website.

FAQ

COCO8-Seg 데이터셋이란 무엇이며, Ultralytics YOLO26에서는 어떻게 사용됩니까?

COCO8-Seg 데이터셋은 Ultralytics가 제공하는 컴팩트한 인스턴스 세그멘테이션 데이터셋으로, COCO train 2017 세트의 첫 8개 이미지(학습용 4개, 검증용 4개)로 구성됩니다. 이 데이터셋은 세그멘테이션 모델을 테스트 및 디버깅하거나 새로운 탐지 방식을 실험하는 데 최적화되어 있습니다. 특히 더 큰 데이터셋으로 확장하기 전의 빠른 반복 학습 및 파이프라인 오류 검사를 위해 Ultralytics YOLO26플랫폼과 함께 사용하면 유용합니다. 자세한 사용법은 모델 학습 페이지를 참조하십시오.

COCO8-Seg 데이터셋을 사용하여 YOLO26n-seg 모델을 학습하려면 어떻게 해야 합니까?

COCO8-Seg 데이터셋에서 100 에포크 동안 이미지 크기 640으로 YOLO26n-seg 모델을 학습하려면 Python 또는 CLI 명령어를 사용할 수 있습니다. 다음은 간단한 예시입니다:

학습 예제
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-seg.pt")  # Load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8-seg.yaml", epochs=100, imgsz=640)

사용 가능한 인수 및 구성 옵션에 대한 자세한 설명은 학습 문서를 확인하십시오.

모델 개발 및 디버깅에서 COCO8-Seg 데이터셋이 중요한 이유는 무엇입니까?

COCO8-Seg 데이터셋은 8개의 이미지로 구성된 작지만 다양한 세트를 제공하므로 세그멘테이션 모델을 빠르게 테스트 및 디버깅하거나 새로운 탐지 기술을 실험하는 데 완벽합니다. 작은 크기 덕분에 빠른 무결성 검사와 초기 파이프라인 검증이 가능하여 더 큰 데이터셋으로 확장하기 전에 문제를 식별하는 데 도움이 됩니다. Ultralytics 세그멘테이션 데이터셋 가이드에서 지원되는 데이터셋 형식에 대해 자세히 알아보십시오.

COCO8-Seg 데이터셋을 위한 YAML 구성 파일은 어디에서 찾을 수 있습니까?

COCO8-Seg 데이터셋을 위한 YAML 구성 파일은 Ultralytics 저장소에서 확인할 수 있습니다. https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8-seg.yaml에서 파일에 직접 액세스할 수 있습니다. YAML 파일에는 데이터셋 경로, 클래스 및 모델 학습과 검증에 필요한 구성 설정에 대한 필수 정보가 포함되어 있습니다.

COCO8-Seg 데이터셋으로 학습할 때 모자이크 처리를 사용하면 어떤 이점이 있습니까?

학습 중에 모자이크 처리를 사용하면 각 학습 배치 내의 객체와 장면의 다양성을 높이는 데 도움이 됩니다. 이 기술은 여러 이미지를 하나의 합성 이미지로 결합하여 다양한 객체 크기, 가로세로 비율 및 장면 내 맥락에 대응하는 모델의 일반화 능력을 향상시킵니다. 모자이크 처리는 특히 COCO8-Seg와 같은 작은 데이터셋으로 작업할 때 모델의 견고성과 정확도를 개선하는 데 유용합니다. 모자이크 처리된 이미지 예시는 샘플 이미지 및 주석 섹션을 참조하십시오.

댓글