Link to this sectionConjunto de dados Fashion-MNIST#

Name: Dataset de Classificação de Imagens Fashion-MNIST
Creator: Zalando Research
License: https://github.com/zalandoresearch/fashion-mnist/blob/master/LICENSE
Keywords: Fashion-MNIST, classificação de imagens, Conjunto de dados Zalando, aprendizado de máquina, deep learning, CNN, YOLO, computer vision, visão geral do conjunto de dados

O dataset Fashion-MNIST é um benchmark de classificação de imagens composto por 70.000 imagens em escala de cinza de 28x28 de artigos de vestuário da Zalando, divididas uniformemente em 10 classes: camiseta/top, calça, pulôver, vestido, casaco, sandália, camisa, tênis, bolsa e bota de cano curto. Ele vem com uma divisão predefinida de 60.000 imagens de treino e 10.000 de teste (7.000 por classe) e serve como um substituto imediato para o dataset MNIST original para benchmarking de algoritmos de aprendizado de máquina. Para o equivalente em imagens coloridas, veja o dataset CIFAR-10 relacionado.

Watch: How to do Image Classification on Fashion-MNIST using Ultralytics YOLO

Link to this sectionPrincipais recursos#

O Fashion-MNIST contém 70.000 imagens em escala de cinza de 28x28 pixels, divididas uniformemente em 10 classes.
Cada classe possui exatamente 7.000 imagens — 6.000 para treinamento e 1.000 para teste — portanto, o dataset é perfeitamente equilibrado.
Ele é um substituto imediato para o MNIST: tamanho de imagem, formato e estrutura de divisão idênticos, mas com categorias de vestuário mais difíceis em vez de dígitos escritos à mão.
O conjunto de dados vem com uma divisão de treino/teste predefinida, portanto não é necessária nenhuma divisão manual ou automática.
O Fashion-MNIST é um benchmark padrão para pesquisa em classificação de imagens e aprendizado profundo.

Link to this sectionEstrutura do Dataset#

O Fashion-MNIST vem com uma divisão oficial e predefinida, portanto, não é necessária nenhuma partição automática ou manual:

Classes: 10 (camiseta/top, calça, pulôver, vestido, casaco, sandália, camisa, tênis, bolsa, bota de cano curto)
Total de imagens: 70.000 (28x28 em escala de cinza)
Conjunto de treinamento: 60.000 imagens (6.000 por classe)
Conjunto de teste: 10.000 imagens (1.000 por classe)

Divisão de validação

O Fashion-MNIST não possui uma pasta de validação separada, então a Ultralytics usa o conjunto de teste de 10.000 imagens como a divisão de validação durante o treinamento, por padrão.

Link to this sectionAplicações#

O Fashion-MNIST é amplamente utilizado para treinar e avaliar modelos de classificação de imagens, desde as clássicas Redes Neurais Convolucionais (CNNs) e Máquinas de Vetores de Suporte (SVMs) até arquiteturas profundas modernas. Suas pequenas imagens em escala de cinza e 10 categorias de vestuário o tornam um benchmark rápido e reprodutível para comparação de algoritmos e experimentação em visão computacional, sendo mais desafiador do que os dígitos escritos à mão do MNIST.

Link to this sectionUso#

Treine um modelo YOLO no Fashion-MNIST por 100 épocas com um tamanho de imagem de 28. Para a lista completa de argumentos disponíveis, veja a página de Treinamento e o guia da tarefa de classificação de imagens.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)

Link to this sectionExemplos de Imagens e Anotações#

Exemplos de imagens do dataset Fashion-MNIST:

Amostras do conjunto de dados de classificação de vestuário Fashion-MNIST

As amostras mostram a variedade de categorias de vestuário no dataset Fashion-MNIST, destacando o valor de um dataset diversificado para treinar modelos de classificação de imagens robustos.

Link to this sectionCitações e Agradecimentos#

Se você usar o dataset Fashion-MNIST em sua pesquisa ou trabalho de desenvolvimento, por favor, cite o seguinte artigo:

Citação

@article{xiao2017fashion,
         title={Fashion-MNIST: a Novel Image Dataset for Benchmarking Machine Learning Algorithms},
         author={Han Xiao and Kashif Rasul and Roland Vollgraf},
         year={2017},
         eprint={1708.07747},
         archivePrefix={arXiv},
         primaryClass={cs.LG}
}

Gostaríamos de agradecer à Zalando Research pela criação e manutenção do dataset Fashion-MNIST como um recurso valioso para a comunidade de pesquisa em aprendizado de máquina e visão computacional. Para mais informações sobre o dataset Fashion-MNIST e seus criadores, visite o repositório GitHub do Fashion-MNIST.

Link to this sectionFAQ#

Link to this sectionO que é o conjunto de dados Fashion-MNIST e como difere do MNIST?#

O dataset Fashion-MNIST é um benchmark de 70.000 imagens em escala de cinza de 28x28 de artigos de vestuário da Zalando em 10 classes, criado como um substituto imediato para o dataset MNIST original. Ele compartilha o tamanho exato da imagem, formato e divisão de 60.000/10.000 de treino/teste do MNIST, mas substitui os dígitos escritos à mão por categorias de moda mais difíceis — como camiseta/top, calça e bota de cano curto — tornando-o um benchmark mais exigente para modelos de classificação de imagens.

Link to this sectionComo posso treinar um modelo Ultralytics YOLO no dataset Fashion-MNIST?#

Para treinar um modelo Ultralytics YOLO no Fashion-MNIST, use os trechos de código abaixo. O dataset é baixado automaticamente no primeiro uso. Para uma lista completa de argumentos, consulte a página de Treinamento do modelo.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)

Link to this sectionQuantas classes o dataset Fashion-MNIST possui?#

O Fashion-MNIST possui 10 classes — camiseta/top, calça, pulôver, vestido, casaco, sandália, camisa, tênis, bolsa e bota de cano curto — com exatamente 7.000 imagens cada, totalizando 70.000 imagens. Cada imagem é uma foto em escala de cinza de 28x28 de um único artigo de vestuário da Zalando, e as classes são perfeitamente equilibradas.

Link to this sectionComo o dataset Fashion-MNIST é dividido em conjuntos de treinamento e teste?#

O Fashion-MNIST vem com uma divisão predefinida de 60.000 imagens de treino e 10.000 imagens de teste, com exatamente 6.000 imagens de treino e 1.000 de teste por classe. Ao contrário dos datasets de classificação baseados em pastas que a Ultralytics divide automaticamente, a partição oficial do Fashion-MNIST é usada como está, e o conjunto de teste serve como a divisão de validação durante o treinamento, por padrão.

Link to this sectionPosso usar a Ultralytics Platform para treinar modelos no dataset Fashion-MNIST?#

Sim. A Ultralytics Platform permite gerenciar datasets, treinar modelos de classificação de imagens e implantá-los sem codificação extensiva. É uma maneira conveniente de executar experimentos com o Fashion-MNIST na nuvem, e você pode explorar mais opções em nossa visão geral de datasets de classificação.

Contribuidores

GLglenn-jocher¹⁴ RIRizwanMunawar³ RAraimbekovm² MAMatthewNoyce¹ JKjk4e¹

Criado 12 de nov. de 2023Atualizado há 3 dias