COCO8 데이터 세트
소개
그리고 Ultralytics COCO8 데이터 세트는 작지만 강력한 물체 감지 데이터 세트로, COCO train 2017 세트의 첫 번째 8개 이미지(훈련용 4개, 검증용 4개)로 구성되어 있습니다. 이 데이터 세트는 신속한 테스트, 디버깅, 실험을 위해 특별히 설계되었습니다. YOLO 모델 및 트레이닝 파이프라인의 신속한 테스트 및 실험을 위해 특별히 설계되었습니다. 크기가 작아 관리가 용이하며, 다양성으로 인해 더 큰 데이터 세트로 확장하기 전에 효과적인 건전성 검사 역할을 할 수 있습니다.
Watch: Ultralytics COCO 데이터 세트 개요
COCO8은 Ultralytics 허브 및 YOLO11와 완벽하게 호환되므로 컴퓨터 비전 워크플로에 원활하게 통합할 수 있습니다.
데이터 세트 YAML
COCO8 데이터 세트 구성은 데이터 세트 경로, 클래스 이름 및 기타 필수 메타데이터를 지정하는 YAML(또 다른 마크업 언어) 파일에 정의되어 있습니다. 공식 coco8.yaml
파일에 있는 Ultralytics GitHub 리포지토리.
ultralytics/cfg/datasets/coco8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip
사용법
이미지 크기가 640인 COCO8 데이터 세트에서 100개의 에포크에 대해 YOLO11n 모델을 훈련하려면 다음 예제를 사용하세요. 훈련 옵션의 전체 목록은 YOLO 훈련 설명서를 참조하세요.
열차 예시
from ultralytics import YOLO
# Load a pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train the model on COCO8
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Train YOLO11n on COCO8 using the command line
yolo detect train data=coco8.yaml model=yolo11n.pt epochs=100 imgsz=640
샘플 이미지 및 주석
아래는 COCO8 데이터 세트에서 모자이크된 트레이닝 배치의 예시입니다:
- 모자이크 이미지: 이 이미지는 모자이크 증강을 사용하여 여러 데이터 세트 이미지를 결합한 훈련 배치의 예시입니다. 모자이크 증강은 각 배치 내에서 개체와 장면의 다양성을 증가시켜 모델이 다양한 개체 크기, 종횡비 및 배경에 더 잘 일반화할 수 있도록 도와줍니다.
이 기술은 학습 중에 각 이미지의 값을 최대화하기 때문에 COCO8과 같은 소규모 데이터 세트에 특히 유용합니다.
인용 및 감사
연구 또는 개발에 COCO 데이터셋을 사용하는 경우 다음 논문을 인용해 주세요:
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
컴퓨터 비전 커뮤니티에 지속적으로 기여해 주신 COCO 컨소시엄에 특별히 감사드립니다.
자주 묻는 질문
Ultralytics COCO8 데이터 세트는 어떤 용도로 사용되나요?
Ultralytics COCO8 데이터 세트는 물체 감지 모델의 신속한 테스트와 디버깅을 위해 설계되었습니다. 단 8개의 이미지(학습용 4개, 검증용 4개)로 구성되어 있어 YOLO 훈련 파이프라인을 검증하고 더 큰 데이터 세트로 확장하기 전에 모든 것이 예상대로 작동하는지 확인하는 데 이상적입니다. 자세한 내용은 COCO8 YAML 구성을 살펴보세요.
COCO8 데이터 세트를 사용하여 YOLO11 모델을 훈련하려면 어떻게 해야 하나요?
Python 또는 CLI 사용하여 COCO8에서 YOLO11 모델을 학습시킬 수 있습니다:
열차 예시
from ultralytics import YOLO
# Load a pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train the model on COCO8
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
yolo detect train data=coco8.yaml model=yolo11n.pt epochs=100 imgsz=640
추가 교육 옵션은 YOLO 교육 문서를 참조하세요.
COCO8 교육을 관리하기 위해 Ultralytics HUB를 사용해야 하는 이유는 무엇인가요?
다음을 위해 데이터 세트 관리, 교육 및 배포를 간소화하는 Ultralytics HUB YOLO 모델을 위한 데이터 세트 관리 및 배포를 간소화합니다. 클라우드 트레이닝, 실시간 모니터링, 직관적인 데이터 세트 처리와 같은 기능을 갖춘 HUB를 사용하면 클릭 한 번으로 실험을 시작할 수 있으며 수동 설정의 번거로움을 없앨 수 있습니다. Ultralytics HUB에 대해 자세히 알아보고 컴퓨터 비전 프로젝트를 가속화하는 방법을 알아보세요.
COCO8 데이터 세트로 훈련에 모자이크 증강을 사용하면 어떤 이점이 있나요?
COCO8 훈련에 사용되는 모자이크 증강은 각 배치에서 여러 이미지를 하나로 결합합니다. 이렇게 하면 물체와 배경의 다양성이 증가하여 YOLO 모델을 새로운 시나리오에 더 잘 일반화할 수 있습니다. 모자이크 증강은 각 학습 단계에서 사용할 수 있는 정보를 최대화하기 때문에 소규모 데이터 세트에 특히 유용합니다. 이에 대한 자세한 내용은 학습 가이드를 참조하세요.
COCO8 데이터셋에서 학습된 YOLO11 모델을 어떻게 검증할 수 있나요?
COCO8에서 학습한 후 YOLO11 모델의 유효성을 검사하려면 Python 또는 CLI 모델의 유효성 검사 명령을 사용합니다. 이 명령은 표준 지표를 사용하여 모델의 성능을 평가합니다. 단계별 지침은 YOLO 유효성 검사 설명서를 참조하세요.