No license

Link to this sectionConjunto de Dados MNIST#

Name: Dataset de Classificação de Imagens MNIST
Creator: Yann LeCun
Keywords: MNIST, conjunto de dados, dígitos manuscritos, classificação de imagens, deep learning, aprendizado de máquina, conjunto de treino, conjunto de teste, NIST

O dataset MNIST (Modified National Institute of Standards and Technology) é uma referência de classificação de imagens de 70.000 imagens em tons de cinza de 28x28 pixels de dígitos escritos à mão, abrangendo 10 classes — os dígitos de 0 a 9. Ele é fornecido com uma divisão predefinida de 60.000 imagens de treino e 10.000 de teste e tem servido há muito tempo como a referência padrão para avaliar algoritmos de aprendizado de máquina e visão computacional. Para o equivalente mais difícil de imagens de vestuário, veja o dataset relacionado Fashion-MNIST; para imagens coloridas, veja CIFAR-10.

Link to this sectionPrincipais recursos#

O MNIST contém 60.000 imagens de treino e 10.000 imagens de teste de dígitos escritos à mão, totalizando 70.000.
Cada imagem é uma foto em tons de cinza de 28x28 de um único dígito, normalizada e suavizada em uma caixa delimitadora fixa de 28x28.
As 10 classes abrangem os dígitos 0–9, com um número aproximadamente equilibrado de imagens por classe.
Ele é fornecido com uma divisão de treino/teste predefinida, portanto, nenhuma divisão manual ou automática é necessária.
O MNIST é uma referência padrão para pesquisas de classificação de imagens e aprendizado profundo.

Link to this sectionEstrutura do Dataset#

O MNIST é fornecido com uma divisão oficial e predefinida, portanto, nenhuma partição automática ou manual é necessária:

Classes: 10 (dígitos escritos à mão 0–9)
Total de imagens: 70.000 (28x28 em escala de cinza)
Conjunto de treino: 60.000 imagens
Conjunto de teste: 10.000 imagens

Divisão de validação

O MNIST não tem uma pasta de validação separada, por isso o Ultralytics usa o conjunto de teste de 10.000 imagens como a divisão de validação durante o treinamento por padrão.

Cada imagem é rotulada com seu dígito correspondente (0–9), tornando o MNIST um dataset supervisionado ideal para tarefas de classificação.

Link to this sectionAplicações#

O MNIST é amplamente utilizado para treinar e avaliar modelos de classificação de imagens, desde as clássicas Redes Neurais Convolucionais (CNNs) e Máquinas de Vetores de Suporte (SVMs) até arquiteturas profundas modernas. Suas pequenas imagens em tons de cinza e 10 classes de dígitos o tornam uma referência rápida e reproduzível para comparação de algoritmos e experimentação em visão computacional.

Algumas aplicações comuns incluem:

Benchmarking de novos algoritmos de classificação
Propósitos educacionais para ensinar conceitos de aprendizado de máquina
Prototipagem de sistemas de reconhecimento de imagem
Testar técnicas de otimização de modelos

Link to this sectionUso#

Treine um modelo de classificação YOLO no MNIST por 100 épocas com um tamanho de imagem de 28. O dataset é baixado e armazenado em cache automaticamente no primeiro uso; se preferir controle total sobre o pré-processamento, os arquivos gzip originais também estão disponíveis no MNIST database. Para obter a lista completa de argumentos disponíveis, consulte a página de Treinamento e o guia de tarefas de classificação de imagens.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Testes rápidos com MNIST160

O Ultralytics também expõe data="mnist160", um recorte de 160 imagens contendo as oito primeiras imagens de cada dígito (0–9) das divisões de treino e teste. Ele reflete a estrutura de diretórios do MNIST, para que você possa trocar datasets sem alterar nenhum outro argumento — ideal para pipelines de CI ou verificações de integridade antes de se comprometer com o dataset completo de 70.000 imagens.

yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28

Link to this sectionExemplos de Imagens e Anotações#

Exemplos de imagens do dataset MNIST:

Amostras do conjunto de dados de classificação de dígitos manuscritos MNIST

As amostras mostram a variedade de estilos de escrita manual que o dataset captura nas 10 classes de dígitos.

Link to this sectionCitações e Agradecimentos#

Se usares o conjunto de dados MNIST no teu trabalho de pesquisa ou desenvolvimento, por favor, cita o seguinte artigo:

Citação

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]},
         volume={2},
         year={2010}
}

Gostaríamos de agradecer a Yann LeCun, Corinna Cortes e Christopher J.C. Burges por criarem e manterem o dataset MNIST como um recurso valioso para a comunidade de pesquisa de aprendizado de máquina e visão computacional. Para obter mais informações sobre o dataset MNIST e seus criadores, visite o site do dataset MNIST.

Link to this sectionFAQ#

Link to this sectionO que é o conjunto de dados MNIST e por que é importante no aprendizado de máquina?#

O dataset MNIST é uma referência de 70.000 imagens em tons de cinza de 28x28 pixels de dígitos escritos à mão, divididas em 60.000 imagens de treino e 10.000 de teste nas 10 classes de 0 a 9. É a referência padrão para avaliar algoritmos de classificação de imagens — seu formato pequeno e uniforme permite que pesquisadores e engenheiros comparem métodos e acompanhem o progresso com o mínimo de configuração, razão pela qual continua sendo uma referência inicial comum em aprendizado de máquina.

Link to this sectionQuantas classes e imagens o dataset MNIST possui?#

O MNIST possui 10 classes — os dígitos escritos à mão de 0 a 9 — e 70.000 imagens em tons de cinza no total, cada uma com 28x28 pixels. Ele é fornecido com uma divisão predefinida de 60.000 imagens de treino e 10.000 de teste, com um número aproximadamente igual de exemplos por dígito.

Link to this sectionComo posso usar a Ultralytics YOLO para treinar um modelo no conjunto de dados MNIST?#

Para treinar um modelo Ultralytics YOLO no MNIST, use os trechos de código abaixo. O dataset é baixado automaticamente no primeiro uso. Para obter uma lista detalhada dos argumentos de treinamento disponíveis, consulte a página Treinamento.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Link to this sectionComo o dataset MNIST é dividido em conjuntos de treino e teste?#

O MNIST é fornecido com uma divisão predefinida de 60.000 imagens de treino e 10.000 de teste. Ao contrário dos datasets de classificação baseados em pastas que o Ultralytics divide automaticamente, a partição oficial do MNIST é usada como está, e o conjunto de teste serve como a divisão de validação durante o treinamento por padrão.

Link to this sectionQual é a diferença entre os conjuntos de dados MNIST e EMNIST?#

O dataset MNIST contém apenas dígitos escritos à mão, enquanto o dataset Extended MNIST (EMNIST) inclui dígitos e letras maiúsculas e minúsculas. O EMNIST foi desenvolvido como um sucessor do MNIST e usa o mesmo formato de 28x28 pixels, tornando-o compatível com ferramentas e modelos projetados para o dataset MNIST original. Essa gama mais ampla de caracteres torna o EMNIST útil para uma maior variedade de aplicações de aprendizado de máquina.

Link to this sectionPosso usar a Plataforma Ultralytics para treinar modelos em datasets como o MNIST?#

Sim. A Plataforma Ultralytics permite carregar datasets, treinar modelos de classificação de imagens e implantá-los sem precisar de muita codificação. É uma maneira conveniente de executar experimentos com MNIST na nuvem — veja a visão geral dos datasets de classificação para opções relacionadas.

Link to this sectionComo o MNIST se compara a outros conjuntos de dados de classificação de imagem?#

O MNIST é mais simples do que muitos datasets modernos como CIFAR-10 ou ImageNet, tornando-o ideal para iniciantes e experimentações rápidas. Embora datasets mais complexos ofereçam maiores desafios com imagens coloridas e diversas categorias de objetos, o MNIST continua sendo valioso por sua simplicidade, tamanho de arquivo pequeno e significado histórico no desenvolvimento de algoritmos de aprendizado de máquina. Para um substituto mais difícil com a mesma estrutura, veja Fashion-MNIST, que apresenta itens de vestuário em vez de dígitos.

Contribuidores

GLglenn-jocher¹⁸ RAraimbekovm² PDpderrenger¹ MAMatthewNoyce¹ JKjk4e¹

Criado 12 de nov. de 2023Atualizado há 22 horas