Conjunto de dados Fashion-MNIST

O conjunto de dados Fashion-MNIST é uma base de dados de imagens de artigos da Zalando - constituída por um conjunto de treino de 60 000 exemplos e um conjunto de teste de 10 000 exemplos. Cada exemplo é uma imagem em escala de cinzentos de 28x28, associada a uma etiqueta de 10 classes. O Fashion-MNIST destina-se a servir de substituto direto do conjunto de dados MNIST original para a avaliação comparativa de algoritmos de aprendizagem automática.

Ver: Como fazer Classificação de imagens no conjunto de dados MNIST da moda utilizando Ultralytics YOLO11

Caraterísticas principais

O Fashion-MNIST contém 60.000 imagens de treino e 10.000 imagens de teste de imagens de artigos da Zalando.
O conjunto de dados inclui imagens em escala de cinzentos de 28x28 pixéis.
Cada pixel tem um único valor de pixel associado, indicando a claridade ou escuridão desse pixel, sendo que os números mais elevados significam mais escuros. Este valor de píxel é um número inteiro entre 0 e 255.
O Fashion-MNIST é amplamente utilizado para treino e teste no domínio da aprendizagem automática, especialmente para tarefas de classificação de imagens.

Estrutura do conjunto de dados

O conjunto de dados Fashion-MNIST está dividido em dois subconjuntos:

Conjunto de treino: Este subconjunto contém 60.000 imagens utilizadas para treinar modelos de aprendizagem automática.
Conjunto de teste: Este subconjunto é constituído por 10 000 imagens utilizadas para testar e aferir os modelos treinados.

Etiquetas

Cada exemplo de treino e teste é atribuído a uma das seguintes etiquetas:

T-shirt/camisola
Calças
Pulôver
Vestido
Casaco
Sandália
Camisa
Ténis
Saco
Bota de tornozelo

Aplicações

O conjunto de dados Fashion-MNIST é amplamente utilizado para treinar e avaliar modelos de aprendizagem profunda em tarefas de classificação de imagens, tais como Redes Neuronais Convolucionais (CNN), Máquinas de Vectores de Suporte (SVM) e vários outros algoritmos de aprendizagem automática. O formato simples e bem estruturado do conjunto de dados torna-o um recurso essencial para investigadores e profissionais no domínio da aprendizagem automática e da visão computacional.

Utilização

Para treinar um modelo CNN no conjunto de dados Fashion-MNIST para 100 épocas com um tamanho de imagem de 28x28, pode utilizar os seguintes snippets de código. Para obter uma lista completa dos argumentos disponíveis, consulte a página Treinamento do modelo.

Exemplo de comboio

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)

# Start training from a pretrained *.pt model
yolo classify train data=fashion-mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Exemplos de imagens e anotações

O conjunto de dados Fashion-MNIST contém imagens em escala de cinzentos de imagens de artigos da Zalando, fornecendo um conjunto de dados bem estruturado para tarefas de classificação de imagens. Aqui estão alguns exemplos de imagens do conjunto de dados:

Imagem de amostra do conjunto de dados

O exemplo mostra a variedade e a complexidade das imagens no conjunto de dados Fashion-MNIST, realçando a importância de um conjunto de dados diversificado para o treino de modelos robustos de classificação de imagens.

Agradecimentos

Se utilizar o conjunto de dados Fashion-MNIST no seu trabalho de investigação ou desenvolvimento, deve reconhecer o conjunto de dados através de uma ligação ao repositório GitHub. Este conjunto de dados foi disponibilizado pela Zalando Research.

FAQ

O que é o conjunto de dados Fashion-MNIST e qual é a sua diferença em relação ao MNIST?

O conjunto de dados Fashion-MNIST é uma coleção de 70 000 imagens em escala de cinzentos de imagens de artigos da Zalando, destinada a substituir modernamente o conjunto de dados MNIST original. Serve de referência para modelos de aprendizagem automática no contexto de tarefas de classificação de imagens. Ao contrário do MNIST, que contém dígitos manuscritos, o Fashion-MNIST é composto por imagens de 28x28 pixels categorizadas em 10 classes relacionadas com a moda, como T-shirt/top, calças e botins.

Como é que posso treinar um modelo YOLO no conjunto de dados Fashion-MNIST?

Para treinar um modelo Ultralytics YOLO no conjunto de dados Fashion-MNIST, é possível usar os comandos Python e CLI . Aqui está um exemplo rápido para começar:

Exemplo de comboio

PythonCLI

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n-cls.pt")

# Train the model on Fashion-MNIST
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)

yolo classify train data=fashion-mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Para obter parâmetros de formação mais pormenorizados, consulte a página Formação.

Por que razão devo utilizar o conjunto de dados Fashion-MNIST para aferir os meus modelos de aprendizagem automática?

O conjunto de dados Fashion-MNIST é amplamente reconhecido na comunidade de aprendizagem profunda como uma alternativa robusta ao MNIST. Ele oferece um conjunto de imagens mais complexo e variado, o que o torna uma excelente escolha para modelos de classificação de imagens de benchmarking. A estrutura do conjunto de dados, que inclui 60.000 imagens de treino e 10.000 imagens de teste, cada uma rotulada com uma de 10 classes, torna-o ideal para avaliar o desempenho de diferentes algoritmos de aprendizagem automática num contexto mais desafiante.

Posso utilizar Ultralytics YOLO para tarefas de classificação de imagens como Fashion-MNIST?

Sim, os modelos Ultralytics YOLO podem ser utilizados para tarefas de classificação de imagens, incluindo as que envolvem o conjunto de dados Fashion-MNIST. YOLO11 O modelo de classificação de imagens do Microsoft® , por exemplo, suporta várias tarefas de visão, como deteção, segmentação e classificação. Para começar a trabalhar com tarefas de classificação de imagens, consulte a página Classificação.

Quais são as principais caraterísticas e a estrutura do conjunto de dados Fashion-MNIST?

O conjunto de dados Fashion-MNIST está dividido em dois subconjuntos principais: 60.000 imagens de treino e 10.000 imagens de teste. Cada imagem é uma fotografia em escala de cinzentos de 28x28 píxeis que representa uma das 10 classes relacionadas com a moda. A simplicidade e o formato bem estruturado tornam-no ideal para treinar e avaliar modelos em tarefas de aprendizagem automática e visão computacional. Para mais detalhes sobre a estrutura do conjunto de dados, consulte a secção Estrutura do conjunto de dados.

Como é que posso reconhecer a utilização do conjunto de dados Fashion-MNIST na minha investigação?

Se utilizar o conjunto de dados Fashion-MNIST nos seus projectos de investigação ou desenvolvimento, é importante reconhecê-lo através de uma ligação ao repositório GitHub. Isto ajuda a atribuir os dados à Zalando Research, que disponibilizou o conjunto de dados para utilização pública.

📅C riado há 1 ano ✏️ Atualizado há 2 meses