Conjunto de dados Fashion-MNIST

O conjunto de dados Fashion-MNIST é uma base de dados de imagens de artigos da Zalando — consistindo em um conjunto de treinamento de 60.000 exemplos e um conjunto de teste de 10.000 exemplos. Cada exemplo é uma imagem em escala de cinza de 28x28, associada a um rótulo de 10 classes. O Fashion-MNIST destina-se a servir como um substituto direto para o conjunto de dados MNIST original para benchmarking de algoritmos de machine learning.



Watch: How to do Image Classification on Fashion MNIST Dataset using Ultralytics YOLO26

Principais recursos

  • O Fashion-MNIST contém 60.000 imagens de treinamento e 10.000 imagens de teste de imagens de artigos da Zalando.
  • O conjunto de dados compreende imagens em escala de cinza com tamanho de 28x28 pixels.
  • Cada pixel tem um único valor de pixel associado a ele, indicando a clareza ou escuridão desse pixel, sendo que números maiores significam mais escuro. Este valor de pixel é um número inteiro entre 0 e 255.
  • O Fashion-MNIST é amplamente utilizado para treinamento e teste no campo de machine learning, especialmente para tarefas de classificação de imagens.

Estrutura do Dataset

O conjunto de dados Fashion-MNIST é dividido em dois subconjuntos:

  1. Conjunto de Treinamento: Este subconjunto contém 60.000 imagens usadas para treinar modelos de machine learning.
  2. Conjunto de Testes: Este subconjunto consiste em 10.000 imagens usadas para testar e avaliar os modelos treinados.

Rótulos

Cada exemplo de treinamento e teste é atribuído a um dos seguintes rótulos:

0. T-shirt/top
1. Trouser
2. Pullover
3. Dress
4. Coat
5. Sandal
6. Shirt
7. Sneaker
8. Bag
9. Ankle boot

Aplicações

O conjunto de dados Fashion-MNIST é amplamente utilizado para treinar e avaliar modelos de deep learning em tarefas de classificação de imagens, como Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) e vários outros algoritmos de machine learning. O formato simples e bem estruturado do conjunto de dados torna-o um recurso essencial para pesquisadores e profissionais na área de machine learning e computer vision.

Utilização

Para treinar um modelo CNN no conjunto de dados Fashion-MNIST por 100 epochs com um tamanho de imagem de 28x28, você pode usar os seguintes trechos de código. Para uma lista abrangente de argumentos disponíveis, consulte a página de Training do modelo.

Exemplo de Treino
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)

Amostra de Imagens e Anotações

O conjunto de dados Fashion-MNIST contém imagens em escala de cinza de imagens de artigos da Zalando, fornecendo um conjunto de dados bem estruturado para tarefas de classificação de imagens. Aqui estão alguns exemplos de imagens do conjunto de dados:

Amostras do conjunto de dados de classificação de vestuário Fashion-MNIST

O exemplo demonstra a variedade e complexidade das imagens no conjunto de dados Fashion-MNIST, destacando a importância de um conjunto de dados diversificado para treinar modelos robustos de classificação de imagens.

Agradecimentos

Se você usar o conjunto de dados Fashion-MNIST em seu trabalho de pesquisa ou desenvolvimento, por favor, reconheça o conjunto de dados fazendo um link para o GitHub repository. Este conjunto de dados foi disponibilizado pela Zalando Research.

FAQ

O que é o conjunto de dados Fashion-MNIST e como ele é diferente do MNIST?

O conjunto de dados Fashion-MNIST é uma coleção de 70.000 imagens em escala de cinza de imagens de artigos da Zalando, pretendido como um substituto moderno para o conjunto de dados MNIST original. Ele serve como um benchmark para modelos de machine learning no contexto de tarefas de classificação de imagens. Ao contrário do MNIST, que contém dígitos manuscritos, o Fashion-MNIST consiste em imagens de 28x28 pixels categorizadas em 10 classes relacionadas à moda, como camiseta/top, calça e bota de tornozelo.

Como posso treinar um modelo YOLO no conjunto de dados Fashion-MNIST?

Para treinar um modelo Ultralytics YOLO no conjunto de dados Fashion-MNIST, você pode usar comandos de Python e CLI. Aqui está um exemplo rápido para você começar:

Exemplo de Treino
from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n-cls.pt")

# Train the model on Fashion-MNIST
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)

Para parâmetros de treinamento mais detalhados, consulte a Training page.

Por que devo usar o conjunto de dados Fashion-MNIST para fazer benchmark dos meus modelos de machine learning?

O conjunto de dados Fashion-MNIST é amplamente reconhecido na comunidade de deep learning como uma alternativa robusta ao MNIST. Ele oferece um conjunto de imagens mais complexo e variado, tornando-o uma excelente escolha para fazer benchmark de modelos de classificação de imagens. A estrutura do conjunto de dados, compreendendo 60.000 imagens de treinamento e 10.000 imagens de teste, cada uma rotulada com uma das 10 classes, torna-o ideal para avaliar o desempenho de diferentes algoritmos de machine learning em um contexto mais desafiador.

Posso usar o Ultralytics YOLO para tarefas de classificação de imagens como o Fashion-MNIST?

Sim, os modelos Ultralytics YOLO podem ser usados para tarefas de classificação de imagens, incluindo aquelas envolvendo o conjunto de dados Fashion-MNIST. O YOLO26, por exemplo, suporta várias tarefas de visão como detecção, segmentação e classificação. Para começar com tarefas de classificação de imagens, consulte a Classification page.

Quais são as principais características e estrutura do conjunto de dados Fashion-MNIST?

O conjunto de dados Fashion-MNIST é dividido em dois subconjuntos principais: 60.000 imagens de treinamento e 10.000 imagens de teste. Cada imagem é uma foto em escala de cinza de 28x28 pixels representando uma das 10 classes relacionadas à moda. A simplicidade e o formato bem estruturado tornam-no ideal para treinar e avaliar modelos em tarefas de machine learning e computer vision. Para mais detalhes sobre a estrutura do conjunto de dados, veja a seção Dataset Structure section.

Como posso reconhecer o uso do conjunto de dados Fashion-MNIST em minha pesquisa?

Se você utilizar o conjunto de dados Fashion-MNIST em seus projetos de pesquisa ou desenvolvimento, é importante reconhecê-lo fazendo um link para o GitHub repository. Isso ajuda a atribuir os dados à Zalando Research, que disponibilizou o conjunto de dados para uso público.

Comentários