COCO8-Seg 데이터셋
소개
Ultralytics COCO8-Seg는 COCO train 2017 세트의 첫 8개 이미지(학습용 4개, 검증용 4개)로 구성된 작지만 다재다능한 인스턴스 세그멘테이션 데이터셋입니다. 이 데이터셋은 세그멘테이션 모델을 테스트 및 디버깅하거나 새로운 탐지 접근 방식을 실험하는 데 이상적입니다. 8개의 이미지로 구성되어 관리가 쉽지만, 더 큰 데이터셋을 학습하기 전에 학습 파이프라인의 오류를 테스트하고 무결성 검사(sanity check)를 수행하기에 충분히 다양합니다.
데이터셋 구조
- 이미지: 총 8개 (학습용 4개 / 검증용 4개).
- 클래스: 80개의 COCO 카테고리.
- 라벨: 각 이미지 파일과 일치하며
labels/{train,val}아래에 저장된 YOLO 형식의 폴리곤.
이 데이터셋은 Ultralytics Platform 및 YOLO26과 함께 사용하도록 의도되었습니다.
데이터셋 YAML
YAML(Yet Another Markup Language) 파일은 데이터셋 구성을 정의하는 데 사용됩니다. 이 파일에는 데이터셋 경로, 클래스 및 기타 관련 정보가 포함되어 있습니다. COCO8-Seg 데이터셋의 경우 coco8-seg.yaml 파일이 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8-seg.yaml에 유지 관리됩니다.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8-seg dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/segment/coco8-seg/
# Example usage: yolo train data=coco8-seg.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8-seg ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-seg # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-seg.zip사용법
COCO8-Seg 데이터셋에서 100 에포크 동안 이미지 크기 640으로 YOLO26n-seg 모델을 학습하려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수의 전체 목록은 모델 학습 페이지를 참조하십시오.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-seg.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco8-seg.yaml", epochs=100, imgsz=640)샘플 이미지 및 주석
다음은 COCO8-Seg 데이터셋 이미지와 그에 해당하는 주석의 몇 가지 예시입니다:
- 모자이크 이미지: 이 이미지는 모자이크 처리된 데이터셋 이미지들로 구성된 학습 배치를 보여줍니다. 모자이킹은 학습 중에 여러 이미지를 하나의 이미지로 결합하여 각 학습 배치 내의 객체와 장면의 다양성을 높이는 데 사용되는 기법입니다. 이는 모델이 다양한 객체 크기, 가로세로 비율 및 문맥으로 일반화하는 능력을 향상시키는 데 도움을 줍니다.
이 예시는 COCO8-Seg 데이터셋 이미지의 다양성과 복잡성, 그리고 학습 과정에서 모자이크 처리를 사용하는 이점을 보여줍니다.
인용 및 감사의 글
연구 또는 개발 작업에 COCO 데이터셋을 사용하는 경우, 다음 논문을 인용해 주십시오:
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}We would like to acknowledge the COCO Consortium for creating and maintaining this valuable resource for the computer vision community. For more information about the COCO dataset and its creators, visit the COCO dataset website.
FAQ
COCO8-Seg 데이터셋이란 무엇이며, Ultralytics YOLO26에서는 어떻게 사용됩니까?
COCO8-Seg 데이터셋은 Ultralytics가 제공하는 컴팩트한 인스턴스 세그멘테이션 데이터셋으로, COCO train 2017 세트의 첫 8개 이미지(학습용 4개, 검증용 4개)로 구성됩니다. 이 데이터셋은 세그멘테이션 모델을 테스트 및 디버깅하거나 새로운 탐지 방식을 실험하는 데 최적화되어 있습니다. 특히 더 큰 데이터셋으로 확장하기 전의 빠른 반복 학습 및 파이프라인 오류 검사를 위해 Ultralytics YOLO26 및 플랫폼과 함께 사용하면 유용합니다. 자세한 사용법은 모델 학습 페이지를 참조하십시오.
COCO8-Seg 데이터셋을 사용하여 YOLO26n-seg 모델을 학습하려면 어떻게 해야 합니까?
COCO8-Seg 데이터셋에서 100 에포크 동안 이미지 크기 640으로 YOLO26n-seg 모델을 학습하려면 Python 또는 CLI 명령어를 사용할 수 있습니다. 다음은 간단한 예시입니다:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-seg.pt") # Load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco8-seg.yaml", epochs=100, imgsz=640)사용 가능한 인수 및 구성 옵션에 대한 자세한 설명은 학습 문서를 확인하십시오.
모델 개발 및 디버깅에서 COCO8-Seg 데이터셋이 중요한 이유는 무엇입니까?
COCO8-Seg 데이터셋은 8개의 이미지로 구성된 작지만 다양한 세트를 제공하므로 세그멘테이션 모델을 빠르게 테스트 및 디버깅하거나 새로운 탐지 기술을 실험하는 데 완벽합니다. 작은 크기 덕분에 빠른 무결성 검사와 초기 파이프라인 검증이 가능하여 더 큰 데이터셋으로 확장하기 전에 문제를 식별하는 데 도움이 됩니다. Ultralytics 세그멘테이션 데이터셋 가이드에서 지원되는 데이터셋 형식에 대해 자세히 알아보십시오.
COCO8-Seg 데이터셋을 위한 YAML 구성 파일은 어디에서 찾을 수 있습니까?
COCO8-Seg 데이터셋을 위한 YAML 구성 파일은 Ultralytics 저장소에서 확인할 수 있습니다. https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8-seg.yaml에서 파일에 직접 액세스할 수 있습니다. YAML 파일에는 데이터셋 경로, 클래스 및 모델 학습과 검증에 필요한 구성 설정에 대한 필수 정보가 포함되어 있습니다.
COCO8-Seg 데이터셋으로 학습할 때 모자이크 처리를 사용하면 어떤 이점이 있습니까?
학습 중에 모자이크 처리를 사용하면 각 학습 배치 내의 객체와 장면의 다양성을 높이는 데 도움이 됩니다. 이 기술은 여러 이미지를 하나의 합성 이미지로 결합하여 다양한 객체 크기, 가로세로 비율 및 장면 내 맥락에 대응하는 모델의 일반화 능력을 향상시킵니다. 모자이크 처리는 특히 COCO8-Seg와 같은 작은 데이터셋으로 작업할 때 모델의 견고성과 정확도를 개선하는 데 유용합니다. 모자이크 처리된 이미지 예시는 샘플 이미지 및 주석 섹션을 참조하십시오.