Link to this sectionDataset COCO128-Seg#

Name: Conjunto de dados de segmentação COCO128
Creator: Ultralytics
License: https://cocodataset.org/#termsofuse
Keywords: COCO128-Seg, Ultralytics, conjunto de dados de segmentação, YOLO26, COCO 2017, treino de modelo, computer vision, configuração do conjunto de dados

Link to this sectionIntrodução#

O COCO128-Seg da Ultralytics é um dataset pequeno, mas versátil, de segmentação de instâncias, composto pelas primeiras 128 imagens do conjunto COCO train 2017. Este dataset é ideal para testar e depurar modelos de segmentação ou para experimentar novas abordagens de detecção. Com 128 imagens, é pequeno o suficiente para ser facilmente gerenciável, porém diverso o suficiente para testar pipelines de treinamento em busca de erros e atuar como uma verificação de integridade antes de treinar datasets maiores.

Link to this sectionEstrutura do Dataset#

Imagens: 128 no total, com divisão de train e val idêntica (veja a nota abaixo).
Classes: As mesmas 80 categorias de objetos do COCO.
Rótulos: Polígonos no formato YOLO armazenados em labels/train2017 para o diretório compartilhado de imagens de train e val.
Tamanho do download: ~7 MB.

Nota

O YAML padrão aponta train e val para as mesmas 128 imagens, portanto, as métricas de validação medem o ajuste no conjunto de treinamento em vez da generalização em dados mantidos fora do treino. Duplique ou personalize a divisão se precisar de um conjunto de teste real.

Este conjunto de dados destina-se a ser utilizado com a Ultralytics Platform e YOLO26.

Link to this sectionYAML do Dataset#

Um arquivo YAML é usado para definir a configuração do dataset. Ele contém informações sobre os caminhos do dataset, classes e outras informações relevantes. No caso do dataset COCO128-Seg, o arquivo coco128-seg.yaml é mantido em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco128-seg.yaml.

ultralytics/cfg/datasets/coco128-seg.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO128-seg dataset https://www.kaggle.com/datasets/ultralytics/coco128 (first 128 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/segment/coco128-seg
# Example usage: yolo train data=coco128-seg.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco128-seg ← downloads here (7 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco128-seg # dataset root dir
train: images/train2017 # train images (relative to 'path') 128 images
val: images/train2017 # val images (relative to 'path') 128 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco128-seg.zip

Link to this sectionUso#

Para treinar um modelo YOLO26n-seg no dataset COCO128-Seg por 100 épocas com um tamanho de imagem de 640, podes usar os seguintes trechos de código. Para uma lista abrangente de argumentos disponíveis, consulta a página de Treinamento do modelo.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-seg.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco128-seg.yaml", epochs=100, imgsz=640)

Link to this sectionExemplos de Imagens e Anotações#

Aqui estão alguns exemplos de imagens do dataset COCO128-Seg, juntamente com as suas respectivas anotações:

COCO128-seg instance segmentation dataset mosaic

Imagem em Mosaico: Esta imagem demonstra um lote de treino composto por imagens do conjunto de dados em mosaico. A mosaicação é uma técnica usada durante o treino que combina múltiplas imagens numa única imagem para aumentar a variedade de objetos e cenas dentro de cada lote de treino. Isto ajuda a melhorar a capacidade do modelo de generalizar para diferentes tamanhos de objeto, proporções e contextos.

Link to this sectionCitações e Agradecimentos#

Se você utilizar o dataset COCO em seu trabalho de pesquisa ou desenvolvimento, por favor, cite o seguinte artigo:

Citação

@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

Gostaríamos de agradecer ao COCO Consortium por criar e manter este recurso valioso para a comunidade de visão computacional. Para mais informações sobre o dataset COCO e seus criadores, visite o site do dataset COCO.

Link to this sectionFAQ#

Link to this sectionO que é o dataset COCO128-Seg e como ele é usado no Ultralytics YOLO26?#

O dataset COCO128-Seg é um dataset compacto de segmentação de instâncias da Ultralytics, consistindo nas primeiras 128 imagens do conjunto COCO train 2017. Este dataset é adaptado para testar e depurar modelos de segmentação ou experimentar novos métodos de detecção. É particularmente útil com o Ultralytics YOLO26 e Platform para iteração rápida e verificação de erros no pipeline antes de escalar para datasets maiores. Para uso detalhado, consulta a página de Treinamento do modelo.

Link to this sectionComo posso treinar um modelo YOLO26n-seg usando o dataset COCO128-Seg?#

Para treinar um modelo YOLO26n-seg no dataset COCO128-Seg por 100 épocas com um tamanho de imagem de 640, podes usar comandos Python ou CLI. Aqui está um exemplo rápido:

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-seg.pt")  # Load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco128-seg.yaml", epochs=100, imgsz=640)

Para uma explicação completa dos argumentos disponíveis e opções de configuração, você pode verificar a documentação de Treinamento.

Link to this sectionPor que o dataset COCO128-Seg é importante para o desenvolvimento e depuração de modelos?#

Como o loop de download e train/val é muito menor que o COCO completo, o COCO128-Seg permite que você execute uma verificação rápida de 1 época em um novo pipeline — verificando se o modelo treina, valida e salva checkpoints corretamente — antes de escalar para o conjunto de dados COCO-Seg completo. Saiba mais sobre os formatos de conjunto de dados suportados no guia de conjuntos de dados de segmentação da Ultralytics.

Link to this sectionOnde posso encontrar o arquivo de configuração YAML para o dataset COCO128-Seg?#

O arquivo de configuração YAML para o dataset COCO128-Seg está disponível no repositório da Ultralytics. Podes acessar o arquivo diretamente em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco128-seg.yaml. O arquivo YAML inclui informações essenciais sobre os caminhos do dataset, classes e configurações necessárias para o treinamento e validação do modelo.

Link to this sectionComo o COCO128-Seg se compara ao COCO8-Seg e ao conjunto de dados COCO-Seg completo?#

O COCO128-Seg (128 imagens) situa-se entre o COCO8-Seg (8 imagens) e o conjunto de dados COCO-Seg completo (118.287 imagens de treinamento) em termos de tamanho:

COCO8-Seg: 8 imagens (4 de train, 4 de val) — ideal para verificações rápidas e depuração.
COCO128-Seg: 128 imagens — equilibrado entre tamanho e diversidade, com treino e val a partilharem o mesmo diretório.
COCO-Seg completo: 118.287 imagens de treino — abrangente mas intensivo em termos de recursos, exigindo ~27 GB no primeiro download.

O COCO128-Seg oferece mais diversidade do que o COCO8-Seg, mantendo-se muito mais gerenciável do que o conjunto de dados COCO-Seg completo para experimentação e desenvolvimento inicial do modelo.

Contribuidores

GLglenn-jocher⁶ RAraimbekovm³ FCfcakyon¹

Criado 9 de set. de 2025Atualizado anteontem