COCO128-Seg 데이터셋
소개
Ultralytics COCO128-Seg는 COCO train 2017 세트의 첫 128개 이미지로 구성된 작지만 다재다능한 instance segmentation 데이터셋입니다. 이 데이터셋은 세그멘테이션 모델을 테스트 및 디버깅하거나 새로운 탐지 접근 방식을 실험하는 데 이상적입니다. 128개의 이미지로 구성되어 있어 관리가 쉽고, 더 큰 데이터셋을 학습하기 전에 학습 파이프라인의 오류를 테스트하고 정상 작동 여부를 확인(sanity check)할 수 있을 만큼 다양합니다.
데이터셋 구조
- 이미지: 총 128개입니다. 기본 YAML은 학습 및 검증에 동일한 디렉토리를 재사용하므로 빠르게 반복할 수 있지만, 원하는 경우 분할을 복제하거나 사용자 지정할 수 있습니다.
- 클래스: COCO와 동일한 80개의 객체 카테고리입니다.
- 라벨: 각 이미지 옆의
labels/{train,val}폴더에 저장된 YOLO 형식의 폴리곤입니다.
이 데이터셋은 Ultralytics Platform 및 YOLO26과 함께 사용하도록 의도되었습니다.
데이터셋 YAML
YAML(Yet Another Markup Language) 파일은 데이터셋 구성을 정의하는 데 사용됩니다. 이 파일에는 데이터셋 경로, 클래스 및 기타 관련 정보가 포함되어 있습니다. COCO128-Seg 데이터셋의 경우, coco128-seg.yaml 파일은 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco128-seg.yaml에서 관리됩니다.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO128-seg dataset https://www.kaggle.com/datasets/ultralytics/coco128 (first 128 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/segment/coco/
# Example usage: yolo train data=coco128-seg.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco128-seg ← downloads here (7 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco128-seg # dataset root dir
train: images/train2017 # train images (relative to 'path') 128 images
val: images/train2017 # val images (relative to 'path') 128 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco128-seg.zip사용법
이미지 크기 640으로 100 epochs 동안 COCO128-Seg 데이터셋에서 YOLO26n-seg 모델을 학습하려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수에 대한 포괄적인 목록은 모델 Training 페이지를 참조하십시오.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-seg.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco128-seg.yaml", epochs=100, imgsz=640)샘플 이미지 및 주석
다음은 COCO128-Seg 데이터셋의 이미지 예시와 해당 주석입니다:
- 모자이크 이미지: 이 이미지는 모자이크 처리된 데이터셋 이미지들로 구성된 학습 배치를 보여줍니다. 모자이킹은 학습 중에 여러 이미지를 하나의 이미지로 결합하여 각 학습 배치 내의 객체와 장면의 다양성을 높이는 데 사용되는 기법입니다. 이는 모델이 다양한 객체 크기, 가로세로 비율 및 문맥으로 일반화하는 능력을 향상시키는 데 도움을 줍니다.
이 예시는 COCO128-Seg 데이터셋 이미지의 다양성과 복잡성, 그리고 학습 과정에서 모자이킹(mosaicing)을 사용할 때의 이점을 보여줍니다.
인용 및 감사의 글
연구 또는 개발 작업에 COCO 데이터셋을 사용하는 경우, 다음 논문을 인용해 주십시오:
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}We would like to acknowledge the COCO Consortium for creating and maintaining this valuable resource for the computer vision community. For more information about the COCO dataset and its creators, visit the COCO dataset website.
FAQ
COCO128-Seg 데이터셋이란 무엇이며, Ultralytics YOLO26에서 어떻게 사용됩니까?
COCO128-Seg 데이터셋은 Ultralytics에서 제공하는 소형 인스턴스 세그멘테이션 데이터셋으로, COCO train 2017 세트의 첫 128개 이미지로 구성됩니다. 이 데이터셋은 세그멘테이션 모델을 테스트 및 디버깅하거나 새로운 탐지 방법을 실험하는 데 최적화되어 있습니다. 특히 더 큰 데이터셋으로 확장하기 전, Ultralytics YOLO26 및 Platform과 함께 사용하여 빠른 반복 학습 및 파이프라인 오류 검사에 매우 유용합니다. 자세한 사용법은 모델 Training 페이지를 참조하십시오.
COCO128-Seg 데이터셋을 사용하여 어떻게 YOLO26n-seg 모델을 학습할 수 있습니까?
이미지 크기 640으로 100 epoch 동안 COCO128-Seg 데이터셋에서 YOLO26n-seg 모델을 학습하려면 Python 또는 CLI 명령어를 사용할 수 있습니다. 간단한 예시는 다음과 같습니다:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-seg.pt") # Load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco128-seg.yaml", epochs=100, imgsz=640)사용 가능한 인수 및 구성 옵션에 대한 자세한 설명은 학습 문서를 확인하십시오.
COCO128-Seg 데이터셋이 모델 개발 및 디버깅에 중요한 이유는 무엇입니까?
COCO128-Seg 데이터셋은 128개의 이미지로 관리 용이성과 다양성의 균형을 갖추고 있어, 세그멘테이션 모델을 빠르게 테스트 및 디버깅하거나 새로운 탐지 기술을 실험하는 데 완벽합니다. 적당한 크기 덕분에 빠른 학습 반복이 가능하면서도, 더 큰 데이터셋으로 확장하기 전에 학습 파이프라인을 검증할 수 있을 만큼 충분한 다양성을 제공합니다. 지원되는 데이터셋 형식에 대한 자세한 내용은 Ultralytics 세그멘테이션 데이터셋 가이드를 참조하십시오.
COCO128-Seg 데이터셋의 YAML 구성 파일은 어디에서 찾을 수 있습니까?
COCO128-Seg 데이터셋을 위한 YAML 구성 파일은 Ultralytics 저장소에서 확인할 수 있습니다. https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco128-seg.yaml에서 직접 파일에 액세스할 수 있습니다. 이 YAML 파일에는 모델 학습 및 검증에 필요한 데이터셋 경로, 클래스 및 구성 설정에 관한 필수 정보가 포함되어 있습니다.
COCO128-Seg 데이터셋으로 학습할 때 모자이킹을 사용하면 어떤 이점이 있습니까?
학습 중 **모자이킹(mosaicing)**을 사용하면 각 학습 배치 내 객체와 장면의 다양성을 높이는 데 도움이 됩니다. 이 기법은 여러 이미지를 하나의 합성 이미지로 결합하여, 장면 내 다양한 객체 크기, 가로세로 비율 및 컨텍스트에 대한 모델의 일반화 능력을 향상시킵니다. 모자이킹은 COCO128-Seg와 같이 적당한 크기의 데이터셋으로 작업할 때 모델의 견고성과 정확도를 향상시키는 데 유익합니다. 모자이킹된 이미지 예시는 샘플 이미지 및 주석 섹션을 참조하십시오.