콘텐츠로 건너뛰기

COCO8 데이터 세트

소개

Ultralytics COCO8은 작지만 다용도로 사용할 수 있는 물체 감지 데이터 세트로, COCO train 2017 세트의 첫 8개 이미지 중 훈련용 4개와 검증용 4개로 구성되어 있습니다. 이 데이터 세트는 객체 감지 모델을 테스트하고 디버깅하거나 새로운 감지 접근 방식을 실험하는 데 이상적입니다. 8개 이미지로 구성되어 있어 관리하기 쉬우면서도 훈련 파이프라인의 오류를 테스트하고 더 큰 데이터 세트를 훈련하기 전에 건전성 검사 역할을 할 수 있을 만큼 충분히 다양합니다.



Watch: Ultralytics COCO 데이터 세트 개요

이 데이터 세트는 Ultralytics HUB 및 YOLO11.

데이터 세트 YAML

데이터 세트 구성을 정의하는 데는 YAML(또 다른 마크업 언어) 파일이 사용됩니다. 여기에는 데이터 세트의 경로, 클래스 및 기타 관련 정보에 대한 정보가 포함되어 있습니다. COCO8 데이터 세트의 경우, 데이터 세트의 coco8.yaml 파일은 다음 위치에서 유지됩니다. https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8.yaml.

ultralytics/cfg/datasets/coco8.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8  ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip

사용법

이미지 크기가 640인 COCO8 데이터 세트에서 100개의 에포크에 대해 YOLO11n 모델을 훈련하려면 다음 코드 조각을 사용할 수 있습니다. 사용 가능한 인수의 전체 목록은 모델 학습 페이지를 참조하세요.

열차 예시

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=coco8.yaml model=yolo11n.pt epochs=100 imgsz=640

샘플 이미지 및 주석

다음은 COCO8 데이터 세트의 이미지와 해당 주석의 몇 가지 예시입니다:

데이터 세트 샘플 이미지

  • 모자이크 이미지: 이 이미지는 모자이크된 데이터 세트 이미지로 구성된 훈련 배치의 예시입니다. 모자이크는 여러 이미지를 하나의 이미지로 결합하여 각 훈련 배치 내에서 다양한 개체와 장면을 늘리기 위해 훈련 중에 사용되는 기술입니다. 이를 통해 다양한 객체 크기, 종횡비 및 컨텍스트에 일반화하는 모델의 능력을 향상시킬 수 있습니다.

이 예는 COCO8 데이터 세트에 포함된 이미지의 다양성과 복잡성, 그리고 훈련 과정에서 모자이크 사용의 이점을 보여줍니다.

인용 및 감사

연구 또는 개발 작업에 COCO 데이터셋을 사용하는 경우 다음 논문을 인용해 주세요:

@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

컴퓨터 비전 커뮤니티를 위해 이 귀중한 리소스를 만들고 유지 관리해 주신 COCO 컨소시엄에 감사의 말씀을 드립니다. COCO 데이터 세트 및 제작자에 대한 자세한 내용은 COCO 데이터 세트 웹사이트를 참조하세요.

자주 묻는 질문

Ultralytics COCO8 데이터 세트는 어떤 용도로 사용되나요?

Ultralytics COCO8 데이터 세트는 COCO train 2017 세트의 첫 번째 8개 이미지로 구성된 작지만 다용도 물체 감지 데이터 세트로, 훈련용 이미지 4개와 검증용 이미지 4개로 구성되어 있습니다. 객체 감지 모델을 테스트 및 디버깅하고 새로운 감지 접근 방식을 실험하기 위해 설계되었습니다. 작은 크기에도 불구하고 COCO8은 대규모 데이터 세트를 배포하기 전에 훈련 파이프라인의 건전성 검사 역할을 하기에 충분한 다양성을 제공합니다. 자세한 내용은 COCO8 데이터 세트를 참조하세요.

COCO8 데이터 세트를 사용하여 YOLO11 모델을 훈련하려면 어떻게 하나요?

COCO8 데이터 세트를 사용하여 YOLO11 모델을 학습하려면 Python 또는 CLI 명령을 사용할 수 있습니다. 시작하는 방법은 다음과 같습니다:

열차 예시

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=coco8.yaml model=yolo11n.pt epochs=100 imgsz=640

사용 가능한 인수의 전체 목록은 모델 교육 페이지를 참조하세요.

COCO8 교육을 관리할 때 Ultralytics HUB를 사용해야 하는 이유는 무엇인가요?

Ultralytics HUB는 COCO8 데이터 세트의 Ultralytics YOLO11 모델을 포함하여 YOLO 모델의 교육 및 배포를 간소화하도록 설계된 올인원 웹 도구입니다. 클라우드 트레이닝, 실시간 추적, 원활한 데이터 세트 관리 기능을 제공합니다. HUB를 사용하면 클릭 한 번으로 훈련을 시작할 수 있으며 수동 설정의 복잡성을 피할 수 있습니다. Ultralytics HUB와 그 이점에 대해 자세히 알아보세요.

COCO8 데이터 세트로 훈련할 때 모자이크 증강을 사용하면 어떤 이점이 있나요?

COCO8 데이터 세트에서 시연된 모자이크 증강은 훈련 중에 여러 이미지를 하나의 이미지로 결합합니다. 이 기술은 각 훈련 배치에서 객체와 장면의 다양성을 증가시켜 다양한 객체 크기, 종횡비 및 컨텍스트에 걸쳐 일반화하는 모델의 능력을 향상시킵니다. 그 결과 더욱 강력한 객체 감지 모델이 생성됩니다. 자세한 내용은 학습 가이드를 참조하세요.

COCO8 데이터 세트에서 학습된 YOLO11 모델을 검증하려면 어떻게 해야 하나요?

COCO8 데이터 세트에 대해 학습된 YOLO11 모델의 유효성 검사는 모델의 유효성 검사 명령을 사용하여 수행할 수 있습니다. CLI 또는 Python 스크립트를 통해 유효성 검사 모드를 호출하여 정확한 메트릭을 사용하여 모델의 성능을 평가할 수 있습니다. 자세한 지침은 유효성 검사 페이지를 참조하세요.

📅1 년 전 생성됨 ✏️ 5개월 전 업데이트됨

댓글