Salta para o conte√ļdo

Visão geral dos conjuntos de dados de classificação de imagens

Formato do conjunto de dados

A estrutura de pastas para conjuntos de dados de classificação no torchvision segue normalmente um formato padrão:

root/
|-- class1/
|   |-- img1.jpg
|   |-- img2.jpg
|   |-- ...
|
|-- class2/
|   |-- img1.jpg
|   |-- img2.jpg
|   |-- ...
|
|-- class3/
|   |-- img1.jpg
|   |-- img2.jpg
|   |-- ...
|
|-- ...

Nessa estrutura de pastas, o root cont√©m uma subdiretoria para cada classe no conjunto de dados. Cada subdiret√≥rio tem o nome da classe correspondente e cont√©m todas as imagens para essa classe. Cada ficheiro de imagem tem um nome √ļnico e est√° normalmente num formato de ficheiro de imagem comum, como JPEG ou PNG.

** Exemplo

Por exemplo, no conjunto de dados CIFAR10, a estrutura de pastas teria o seguinte aspeto:

cifar-10-/
|
|-- train/
|   |-- airplane/
|   |   |-- 10008_airplane.png
|   |   |-- 10009_airplane.png
|   |   |-- ...
|   |
|   |-- automobile/
|   |   |-- 1000_automobile.png
|   |   |-- 1001_automobile.png
|   |   |-- ...
|   |
|   |-- bird/
|   |   |-- 10014_bird.png
|   |   |-- 10015_bird.png
|   |   |-- ...
|   |
|   |-- ...
|
|-- test/
|   |-- airplane/
|   |   |-- 10_airplane.png
|   |   |-- 11_airplane.png
|   |   |-- ...
|   |
|   |-- automobile/
|   |   |-- 100_automobile.png
|   |   |-- 101_automobile.png
|   |   |-- ...
|   |
|   |-- bird/
|   |   |-- 1000_bird.png
|   |   |-- 1001_bird.png
|   |   |-- ...
|   |
|   |-- ...

Neste exemplo, o train contém subdirectórios para cada classe no conjunto de dados, e cada subdiretório de classe contém todas as imagens para essa classe. O diretório test tem uma estrutura semelhante. O diretório root também contém outros ficheiros que fazem parte do conjunto de dados CIFAR10.

Utilização

Exemplo

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='path/to/dataset', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=path/to/data model=yolov8n-cls.pt epochs=100 imgsz=640

Conjuntos de dados suportados

Ultralytics suporta os seguintes conjuntos de dados com transferência automática:

  • Caltech 101: Um conjunto de dados que cont√©m imagens de 101 categorias de objectos para tarefas de classifica√ß√£o de imagens.
  • Caltech 256: Uma vers√£o alargada do Caltech 101 com 256 categorias de objectos e imagens mais desafiantes.
  • CIFAR-10: Um conjunto de dados de 60K imagens a cores 32x32 em 10 classes, com 6K imagens por classe.
  • CIFAR-100: Uma vers√£o alargada do CIFAR-10 com 100 categorias de objectos e 600 imagens por classe.
  • Moda-MNIST: Um conjunto de dados constitu√≠do por 70.000 imagens em escala de cinzentos de 10 categorias de moda para tarefas de classifica√ß√£o de imagens.
  • ImageNet: Um conjunto de dados em grande escala para dete√ß√£o de objectos e classifica√ß√£o de imagens com mais de 14 milh√Ķes de imagens e 20.000 categorias.
  • ImageNet-10: Um subconjunto mais pequeno do ImageNet com 10 categorias para uma experimenta√ß√£o e testes mais r√°pidos.
  • Imagenette: Um subconjunto mais pequeno do ImageNet que cont√©m 10 classes facilmente distingu√≠veis para um treino e teste mais r√°pidos.
  • Imagewoof: Um subconjunto mais exigente do ImageNet que cont√©m 10 categorias de ra√ßas de c√£es para tarefas de classifica√ß√£o de imagens.
  • MNIST: Um conjunto de dados de 70.000 imagens em tons de cinzento de d√≠gitos manuscritos para tarefas de classifica√ß√£o de imagens.

Adicionar o teu próprio conjunto de dados

Se tiveres o teu próprio conjunto de dados e quiseres utilizá-lo para treinar modelos de classificação com Ultralytics, certifica-te de que segue o formato especificado acima em "Formato do conjunto de dados" e, em seguida, aponta o teu data para o diretório do conjunto de dados.



Criado em 2023-11-12, Atualizado em 2024-01-07
Autores: glenn-jocher (4), GreatV (1)

Coment√°rios