Conjunto de dados COCO8
Introdução
Ultralytics O COCO8 é um conjunto de dados de deteção de objectos pequeno, mas versátil, composto pelas primeiras 8 imagens do conjunto COCO train 2017, 4 para treino e 4 para validação. Este conjunto de dados é ideal para testar e depurar modelos de deteção de objectos, ou para experimentar novas abordagens de deteção. Com 8 imagens, é suficientemente pequeno para ser facilmente gerível, mas suficientemente diversificado para testar os pipelines de treino em busca de erros e atuar como uma verificação de sanidade antes de treinar conjuntos de dados maiores.
Ver: Ultralytics Resumo do conjunto de dados COCO
Este conjunto de dados destina-se a ser utilizado com Ultralytics HUB e YOLO11.
Conjunto de dados YAML
Um ficheiro YAML (Yet Another Markup Language) é utilizado para definir a configuração do conjunto de dados. Ele contém informações sobre os caminhos do conjunto de dados, classes e outras informações relevantes. No caso do conjunto de dados COCO8, o ficheiro coco8.yaml
é mantido em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8.yaml.
ultralytics/cfg/datasets/coco8.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip
Utilização
Para treinar um modelo YOLO11n no conjunto de dados COCO8 para 100 épocas com um tamanho de imagem de 640, pode utilizar os seguintes fragmentos de código. Para obter uma lista completa dos argumentos disponíveis, consulte a página Treinamento do modelo.
Exemplo de comboio
Exemplos de imagens e anotações
Aqui estão alguns exemplos de imagens do conjunto de dados COCO8, juntamente com as anotações correspondentes:
- Imagem em mosaico: Esta imagem demonstra um lote de treino composto por imagens de conjuntos de dados em mosaico. O mosaico é uma técnica utilizada durante a formação que combina várias imagens numa única imagem para aumentar a variedade de objectos e cenas em cada lote de formação. Isto ajuda a melhorar a capacidade de generalização do modelo para diferentes tamanhos de objectos, proporções e contextos.
O exemplo mostra a variedade e complexidade das imagens no conjunto de dados COCO8 e os benefícios da utilização de mosaicos durante o processo de formação.
Citações e agradecimentos
Se utilizar o conjunto de dados COCO no seu trabalho de investigação ou desenvolvimento, cite o seguinte documento:
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
Gostaríamos de agradecer ao Consórcio COCO pela criação e manutenção deste valioso recurso para a comunidade da visão computacional. Para mais informações sobre o conjunto de dados COCO e os seus criadores, visite o sítio Web do conjunto de dados COCO.
FAQ
Para que é utilizado o conjunto de dados Ultralytics COCO8?
O conjunto de dados Ultralytics COCO8 é um conjunto de dados de deteção de objectos compacto mas versátil que consiste nas primeiras 8 imagens do conjunto COCO train 2017, com 4 imagens para treino e 4 para validação. Foi concebido para testar e depurar modelos de deteção de objectos e experimentar novas abordagens de deteção. Apesar do seu pequeno tamanho, o COCO8 oferece diversidade suficiente para atuar como uma verificação de sanidade para os seus pipelines de treino antes de implementar conjuntos de dados maiores. Para mais pormenores, consulte o conjunto de dados COCO8.
Como posso treinar um modelo YOLO11 utilizando o conjunto de dados COCO8?
Para treinar um modelo YOLO11 utilizando o conjunto de dados COCO8, pode utilizar os comandos Python ou CLI . Veja como começar:
Exemplo de comboio
Para obter uma lista completa dos argumentos disponíveis, consulte a página de formação do modelo.
Por que razão devo utilizar o Ultralytics HUB para gerir a minha formação COCO8?
Ultralytics O HUB é uma ferramenta Web tudo-em-um concebida para simplificar a formação e a implementação de modelos YOLO , incluindo os modelos Ultralytics YOLO11 no conjunto de dados COCO8. Oferece formação na nuvem, acompanhamento em tempo real e gestão de conjuntos de dados sem falhas. O HUB permite-lhe iniciar a formação com um único clique e evita as complexidades das configurações manuais. Saiba mais sobre o Ultralytics HUB e as suas vantagens.
Quais são as vantagens de utilizar o aumento do mosaico na formação com o conjunto de dados COCO8?
O aumento do mosaico, demonstrado no conjunto de dados COCO8, combina várias imagens numa única imagem durante o treino. Esta técnica aumenta a variedade de objectos e cenas em cada lote de treino, melhorando a capacidade do modelo para generalizar através de diferentes tamanhos de objectos, proporções e contextos. Isto resulta num modelo de deteção de objectos mais robusto. Para obter mais detalhes, consulte o guia de treinamento.
Como posso validar o meu modelo YOLO11 treinado no conjunto de dados COCO8?
A validação do seu modelo YOLO11 treinado no conjunto de dados COCO8 pode ser efectuada utilizando os comandos de validação do modelo. Pode invocar o modo de validação através do script CLI ou Python para avaliar o desempenho do modelo utilizando métricas precisas. Para obter instruções detalhadas, visite a página Validação.