Skip to content

COCO8 데이터 세트

소개

Ultralytics COCO8 데이터 세트는 COCO train 2017 세트의 처음 8개 이미지(학습용 4개, 유효성 검사용 4개)로 구성된 작지만 강력한 객체 탐지 데이터 세트입니다. 이 데이터 세트는 YOLO 모델 및 학습 파이프라인을 사용하여 빠른 테스트, 디버깅 및 실험을 위해 특별히 설계되었습니다. 작은 크기로 인해 관리가 매우 용이하며, 다양성으로 인해 더 큰 데이터 세트로 확장하기 전에 효과적인 건전성 검사 역할을 합니다.



참고: Ultralytics COCO 데이터 세트 개요

COCO8은 Ultralytics HUBYOLO11과 완벽하게 호환되므로 컴퓨터 비전 워크플로에 원활하게 통합할 수 있습니다.

데이터세트 YAML

COCO8 데이터 세트 구성은 YAML(Yet Another Markup Language) 파일에 정의되어 있으며, 여기에는 데이터 세트 경로, 클래스 이름 및 기타 필수 메타데이터가 지정되어 있습니다. 공식 파일을 검토할 수 있습니다. coco8.yaml 파일을 Ultralytics GitHub 저장소.

ultralytics/cfg/datasets/coco8.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8 ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip

사용법

이미지 크기가 640인 COCO8 데이터 세트에서 YOLO11n 모델을 100 에포크 동안 훈련하려면 다음 예제를 사용하세요. 전체 훈련 옵션 목록은 YOLO 훈련 문서를 참조하세요.

훈련 예제

from ultralytics import YOLO

# Load a pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on COCO8
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Train YOLO11n on COCO8 using the command line
yolo detect train data=coco8.yaml model=yolo11n.pt epochs=100 imgsz=640

샘플 이미지 및 주석

다음은 COCO8 데이터 세트에서 모자이크된 훈련 배치 예시입니다.

데이터 세트 샘플 이미지

  • 모자이크 이미지: 이 이미지는 모자이크 증강을 사용하여 여러 데이터 세트 이미지를 결합한 훈련 배치를 보여줍니다. 모자이크 증강은 각 배치 내에서 객체와 장면의 다양성을 증가시켜 모델이 다양한 객체 크기, 종횡비 및 배경에 더 잘 일반화되도록 돕습니다.

이 기술은 COCO8과 같은 작은 데이터 세트에서 특히 유용하며, 학습 중에 각 이미지의 가치를 극대화합니다.

인용 및 감사의 말씀

연구 또는 개발에 COCO 데이터 세트를 사용하는 경우 다음 논문을 인용해 주십시오.

@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

COCO 컨소시엄컴퓨터 비전 커뮤니티에 대한 지속적인 기여에 특별히 감사드립니다.

FAQ

Ultralytics COCO8 데이터 세트는 무엇에 사용됩니까?

Ultralytics COCO8 데이터 세트는 객체 감지 모델의 빠른 테스트 및 디버깅을 위해 설계되었습니다. 8개의 이미지(학습용 4개, 검증용 4개)만으로 구성되어 있어, 더 큰 데이터 세트로 확장하기 전에 YOLO 학습 파이프라인을 검증하고 모든 것이 예상대로 작동하는지 확인하는 데 이상적입니다. 자세한 내용은 COCO8 YAML 구성을 참조하십시오.

COCO8 데이터 세트를 사용하여 YOLO11 모델을 훈련하려면 어떻게 해야 합니까?

Python 또는 CLI를 사용하여 COCO8에서 YOLO11 모델을 훈련할 수 있습니다.

훈련 예제

from ultralytics import YOLO

# Load a pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on COCO8
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
yolo detect train data=coco8.yaml model=yolo11n.pt epochs=100 imgsz=640

추가 학습 옵션은 YOLO 학습 설명서를 참조하십시오.

COCO8 학습 관리를 위해 Ultralytics HUB를 사용해야 하는 이유는 무엇인가요?

Ultralytics HUB는 COCO8을 포함한 YOLO 모델의 데이터 세트 관리, 훈련 및 배포를 간소화합니다. 클라우드 훈련, 실시간 모니터링, 직관적인 데이터 세트 처리와 같은 기능을 통해 클릭 한 번으로 실험을 시작하고 수동 설정의 번거로움을 없앨 수 있습니다. Ultralytics HUB와 이것이 어떻게 컴퓨터 비전 프로젝트를 가속화할 수 있는지 자세히 알아보세요.

COCO8 데이터 세트로 학습할 때 모자이크 증강을 사용하면 어떤 이점이 있습니까?

COCO8 학습에 사용되는 모자이크 증강은 각 배치 동안 여러 이미지를 하나로 결합합니다. 이는 객체와 배경의 다양성을 증가시켜 YOLO 모델이 새로운 시나리오에 더 잘 일반화되도록 돕습니다. 모자이크 증강은 각 학습 단계에서 사용 가능한 정보를 최대화하므로 작은 데이터 세트에 특히 유용합니다. 자세한 내용은 학습 가이드를 참조하세요.

COCO8 데이터 세트에서 훈련된 YOLO11 모델의 유효성을 검사하려면 어떻게 해야 합니까?

COCO8에서 훈련한 후 YOLO11 모델의 유효성을 검사하려면 python 또는 CLI에서 모델의 유효성 검사 명령을 사용하세요. 이는 표준 메트릭을 사용하여 모델의 성능을 평가합니다. 단계별 지침은 YOLO 유효성 검사 문서를 참조하세요.



📅 1년 전에 생성됨 ✏️ 4개월 전에 업데이트됨

댓글