Salta para o conte√ļdo

Conjunto de dados MNIST

O conjunto de dados MNIST (Modified National Institute of Standards and Technology) é uma grande base de dados de dígitos manuscritos que é normalmente utilizada para treinar vários sistemas de processamento de imagem e modelos de aprendizagem automática. Foi criado através da "re-mistura" das amostras dos conjuntos de dados originais do NIST e tornou-se uma referência para avaliar o desempenho dos algoritmos de classificação de imagens.

Características principais

  • A MNIST cont√©m 60.000 imagens de treino e 10.000 imagens de teste de d√≠gitos manuscritos.
  • O conjunto de dados inclui imagens em escala de cinzentos de tamanho 28x28 pix√©is.
  • As imagens s√£o normalizadas para caberem numa caixa delimitadora de 28x28 pix√©is e anti-aliased, introduzindo n√≠veis de escala de cinzentos.
  • A MNIST √© amplamente utilizada para treino e teste no dom√≠nio da aprendizagem autom√°tica, especialmente para tarefas de classifica√ß√£o de imagens.

Estrutura do conjunto de dados

O conjunto de dados MNIST est√° dividido em dois subconjuntos:

  1. Conjunto de treino: Este subconjunto contém 60.000 imagens de dígitos manuscritos utilizados para treinar modelos de aprendizagem automática.
  2. Conjunto de teste: Este subconjunto consiste em 10.000 imagens utilizadas para testar e avaliar os modelos treinados.

MNIST alargada (EMNIST)

O MNIST alargado (EMNIST) √© um novo conjunto de dados desenvolvido e publicado pelo NIST para suceder ao MNIST. Enquanto o MNIST inclu√≠a apenas imagens de d√≠gitos manuscritos, o EMNIST inclui todas as imagens da Base de Dados Especial 19 do NIST, que √© uma grande base de dados de letras mai√ļsculas e min√ļsculas manuscritas, bem como de d√≠gitos. As imagens da EMNIST foram convertidas para o mesmo formato de 28x28 p√≠xeis, pelo mesmo processo, que as imagens da MNIST. Por conseguinte, as ferramentas que funcionam com o conjunto de dados MNIST mais antigo e mais pequeno funcionar√£o provavelmente sem modifica√ß√Ķes com o EMNIST.

Aplica√ß√Ķes

O conjunto de dados MNIST é amplamente utilizado para treinar e avaliar modelos de aprendizagem profunda em tarefas de classificação de imagens, como Redes Neurais Convolucionais (CNNs), Máquinas de Vectores de Suporte (SVMs) e vários outros algoritmos de aprendizagem automática. O formato simples e bem estruturado do conjunto de dados torna-o um recurso essencial para investigadores e profissionais no domínio da aprendizagem automática e da visão computacional.

Utilização

Para treinar um modelo CNN no conjunto de dados MNIST para 100 épocas com um tamanho de imagem de 32x32, podes utilizar os seguintes snippets de código. Para obter uma lista abrangente dos argumentos disponíveis, consulta a página Treino do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='mnist', epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
cnn detect train data=mnist model=yolov8n-cls.pt epochs=100 imgsz=28

Exemplos de imagens e anota√ß√Ķes

O conjunto de dados MNIST contém imagens em escala de cinzentos de dígitos manuscritos, proporcionando um conjunto de dados bem estruturado para tarefas de classificação de imagens. Aqui estão alguns exemplos de imagens do conjunto de dados:

Imagem de amostra do conjunto de dados

O exemplo mostra a variedade e complexidade dos d√≠gitos manuscritos no conjunto de dados MNIST, real√ßando a import√Ęncia de um conjunto de dados diversificado para treinar modelos robustos de classifica√ß√£o de imagens.

Cita√ß√Ķes e agradecimentos

Se utilizares o conjunto de dados MNIST no teu

trabalho de investigação ou desenvolvimento, por favor cita o seguinte artigo:

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

Gostar√≠amos de agradecer a Yann LeCun, Corinna Cortes e Christopher J.C. Burges pela cria√ß√£o e manuten√ß√£o do conjunto de dados MNIST como um recurso valioso para a comunidade de investiga√ß√£o em aprendizagem autom√°tica e vis√£o computacional. Para mais informa√ß√Ķes sobre o conjunto de dados MNIST e os seus criadores, visita o s√≠tio Web do conjunto de dados MNIST.



Criado em 2023-11-12, Atualizado em 2023-11-22
Autores: glenn-jocher (3)

Coment√°rios