Salta para o conteúdo

Conjunto de dados Fashion-MNIST

O conjunto de dados Fashion-MNIST é uma base de dados de imagens de artigos da Zalando - constituída por um conjunto de treino de 60 000 exemplos e um conjunto de teste de 10 000 exemplos. Cada exemplo é uma imagem em escala de cinzentos de 28x28, associada a uma etiqueta de 10 classes. O Fashion-MNIST destina-se a servir de substituto direto do conjunto de dados MNIST original para a avaliação comparativa de algoritmos de aprendizagem automática.



Observa: Como efetuar a classificação de imagens no conjunto de dados MNIST da moda utilizando Ultralytics YOLOv8

Características principais

  • O Fashion-MNIST contém 60.000 imagens de treino e 10.000 imagens de teste de imagens de artigos da Zalando.
  • O conjunto de dados inclui imagens em escala de cinzentos de tamanho 28x28 pixéis.
  • Cada pixel tem um único valor de pixel associado, que indica a claridade ou escuridão desse pixel, sendo que os números mais altos significam mais escuro. Este valor de pixel é um número inteiro entre 0 e 255.
  • O Fashion-MNIST é amplamente utilizado para treino e teste no domínio da aprendizagem automática, especialmente para tarefas de classificação de imagens.

Estrutura do conjunto de dados

O conjunto de dados Fashion-MNIST está dividido em dois subconjuntos:

  1. Conjunto de treino: Este subconjunto contém 60.000 imagens utilizadas para treinar modelos de aprendizagem automática.
  2. Conjunto de teste: Este subconjunto consiste em 10.000 imagens utilizadas para testar e avaliar os modelos treinados.

Etiquetas

Cada exemplo de treino e teste é atribuído a uma das seguintes etiquetas:

  1. T-shirt/top
  2. Calças
  3. Pulôver
  4. Vestido
  5. Casaco
  6. Sandália
  7. Camisa
  8. Ténis
  9. Saco
  10. Bota de tornozelo

Aplicações

O conjunto de dados Fashion-MNIST é amplamente utilizado para treinar e avaliar modelos de aprendizagem profunda em tarefas de classificação de imagens, como Redes Neurais Convolucionais (CNNs), Máquinas de Vectores de Suporte (SVMs) e vários outros algoritmos de aprendizagem automática. O formato simples e bem estruturado do conjunto de dados torna-o um recurso essencial para investigadores e profissionais no domínio da aprendizagem automática e da visão computacional.

Utilização

Para treinar um modelo CNN no conjunto de dados Fashion-MNIST para 100 épocas com um tamanho de imagem de 28x28, podes utilizar os seguintes snippets de código. Para obter uma lista abrangente dos argumentos disponíveis, consulta a página Treino do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo detect train data=fashion-mnist model=yolov8n-cls.pt epochs=100 imgsz=28

Exemplos de imagens e anotações

O conjunto de dados Fashion-MNIST contém imagens em escala de cinzentos de imagens de artigos da Zalando, fornecendo um conjunto de dados bem estruturado para tarefas de classificação de imagens. Aqui tens alguns exemplos de imagens do conjunto de dados:

Imagem de amostra do conjunto de dados

O exemplo mostra a variedade e complexidade das imagens no conjunto de dados Fashion-MNIST, realçando a importância de um conjunto de dados diversificado para treinar modelos de classificação de imagens robustos.

Agradecimentos

Se utilizares o conjunto de dados Fashion-MNIST no teu trabalho de investigação ou desenvolvimento, agradecemos que reconheças o conjunto de dados através de uma ligação ao repositório GitHub. Este conjunto de dados foi disponibilizado pela Zalando Research.

FAQ

O que é o conjunto de dados Fashion-MNIST e qual é a sua diferença em relação ao MNIST?

O conjunto de dados Fashion-MNIST é uma coleção de 70.000 imagens em escala de cinzentos de imagens de artigos da Zalando, que pretende ser um substituto moderno do conjunto de dados MNIST original. Serve de referência para modelos de aprendizagem automática no contexto de tarefas de classificação de imagens. Ao contrário do MNIST, que contém dígitos manuscritos, o Fashion-MNIST consiste em imagens de 28x28 pixels categorizadas em 10 classes relacionadas com a moda, como T-shirt/top, calças e botins.

Como posso treinar um modelo YOLO no conjunto de dados Fashion-MNIST?

Para treinar um modelo Ultralytics YOLO no conjunto de dados Fashion-MNIST, podes usar os comandos Python e CLI . Aqui está um exemplo rápido para que possas começar:

Exemplo de comboio

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolov8n-cls.pt")

# Train the model on Fashion-MNIST
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
yolo detect train data=fashion-mnist model=yolov8n-cls.pt epochs=100 imgsz=28

Para obteres parâmetros de formação mais detalhados, consulta a página Formação.

Por que razão devo utilizar o conjunto de dados Fashion-MNIST para avaliar os meus modelos de aprendizagem automática?

O conjunto de dados Fashion-MNIST é amplamente reconhecido na comunidade de aprendizagem profunda como uma alternativa robusta ao MNIST. Oferece um conjunto de imagens mais complexo e variado, o que o torna uma excelente escolha para modelos de classificação de imagens de benchmarking. A estrutura do conjunto de dados, que inclui 60.000 imagens de treinamento e 10.000 imagens de teste, cada uma rotulada com uma das 10 classes, torna-o ideal para avaliar o desempenho de diferentes algoritmos de aprendizado de máquina em um contexto mais desafiador.

Posso utilizar Ultralytics YOLO para tarefas de classificação de imagens como Fashion-MNIST?

Sim, os modelos Ultralytics YOLO podem ser utilizados para tarefas de classificação de imagens, incluindo as que envolvem o conjunto de dados Fashion-MNIST. YOLOv8 O modelo de classificação de imagens do Microsoft® , por exemplo, suporta várias tarefas de visão, como deteção, segmentação e classificação. Para começar a trabalhar com tarefas de classificação de imagens, consulta a página Classificação.

Quais são as principais características e a estrutura do conjunto de dados Fashion-MNIST?

O conjunto de dados Fashion-MNIST está dividido em dois subconjuntos principais: 60.000 imagens de treino e 10.000 imagens de teste. Cada imagem é uma imagem em escala de cinzentos de 28x28 pixels que representa uma das 10 classes relacionadas com a moda. A simplicidade e o formato bem estruturado tornam-no ideal para treinar e avaliar modelos em tarefas de aprendizagem automática e visão computacional. Para mais detalhes sobre a estrutura do conjunto de dados, consulta a secção Estrutura do conjunto de dados.

Como posso reconhecer a utilização do conjunto de dados Fashion-MNIST na minha investigação?

Se utilizares o conjunto de dados Fashion-MNIST nos teus projectos de investigação ou desenvolvimento, é importante reconhecê-lo através de uma ligação ao repositório GitHub. Isto ajuda-te a atribuir os dados à Zalando Research, que disponibilizou o conjunto de dados para utilização pública.



Criado em 2023-11-12, Atualizado em 2024-07-04
Autores: glenn-jocher (5), RizwanMunawar (1)

Comentários