Link to this sectionConjunto de dados MNIST#
O conjunto de dados MNIST (Modified National Institute of Standards and Technology) é uma grande base de dados de dígitos manuscritos comumente usada para treinar vários sistemas de processamento de imagem e modelos de machine learning. Ele foi criado ao "remisturar" amostras dos conjuntos de dados originais do NIST e tornou-se uma referência para avaliar o desempenho de algoritmos de classificação de imagens.
Link to this sectionPrincipais recursos#
- O MNIST contém 60.000 imagens de treino e 10.000 imagens de teste de dígitos manuscritos.
- O conjunto de dados compreende imagens em tons de cinza com tamanho de 28x28 pixels.
- As imagens são normalizadas para caber em uma bounding box de 28x28 pixels e suavizadas, introduzindo níveis de tons de cinza.
- O MNIST é amplamente usado para treino e teste no campo de machine learning, especialmente para tarefas de classificação de imagens.
Link to this sectionEstrutura do Dataset#
O conjunto de dados MNIST é dividido em dois subconjuntos:
- Conjunto de Treino: Este subconjunto contém 60.000 imagens de dígitos manuscritos usadas para treinar modelos de machine learning.
- Conjunto de Teste: Este subconjunto consiste em 10.000 imagens usadas para testar e avaliar os modelos treinados.
Link to this sectionAcesso ao Conjunto de Dados#
- Arquivos originais: Baixe os arquivos gzip do arquivo original do MNIST se desejar controle direto sobre o pré-processamento.
- Carregador Ultralytics: Use
data="mnist"(oudata="mnist160"para o subconjunto abaixo) em seu comando e o conjunto de dados será baixado, convertido para PNG e armazenado em cache automaticamente.
Cada imagem no conjunto de dados é rotulada com o dígito correspondente (0-9), tornando-o um conjunto de dados de aprendizagem supervisionada ideal para tarefas de classificação.
Link to this sectionExtended MNIST (EMNIST)#
O Extended MNIST (EMNIST) é um conjunto de dados mais recente desenvolvido e lançado pelo NIST para ser o sucessor do MNIST. Enquanto o MNIST incluía imagens apenas de dígitos manuscritos, o EMNIST inclui todas as imagens do NIST Special Database 19, que é uma grande base de dados de letras maiúsculas e minúsculas manuscritas, bem como dígitos. As imagens no EMNIST foram convertidas para o mesmo formato de 28x28 pixels, pelo mesmo processo, que as imagens MNIST. Consequentemente, ferramentas que funcionam com o conjunto de dados MNIST mais antigo e menor provavelmente funcionarão sem modificações com o EMNIST.
Link to this sectionAplicações#
O conjunto de dados MNIST é amplamente usado para treinar e avaliar modelos de deep learning em tarefas de classificação de imagens, tais como Redes Neurais Convolucionais (CNNs), Máquinas de Vetores de Suporte (SVMs) e vários outros algoritmos de machine learning. O formato simples e bem estruturado do conjunto de dados torna-o um recurso essencial para pesquisadores e profissionais no campo de machine learning e computer vision.
Algumas aplicações comuns incluem:
- Avaliação comparativa de novos algoritmos de classificação
- Propósitos educacionais para ensinar conceitos de machine learning
- Prototipagem de sistemas de reconhecimento de imagem
- Testar técnicas de otimização de modelos
Link to this sectionUso#
Para treinar um modelo CNN no conjunto de dados MNIST por 100 epochs com um tamanho de imagem de 28x28, você pode usar os seguintes trechos de código. Para uma lista abrangente de argumentos disponíveis, consulte a página de Treino do modelo.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)Link to this sectionExemplos de Imagens e Anotações#
O conjunto de dados MNIST contém imagens em tons de cinza de dígitos manuscritos, fornecendo um conjunto de dados bem estruturado para tarefas de classificação de imagens. Aqui estão alguns exemplos de imagens do conjunto de dados:

O exemplo mostra a variedade e a complexidade dos dígitos manuscritos no conjunto de dados MNIST, destacando a importância de um conjunto de dados diversificado para treinar modelos robustos de classificação de imagens.
Link to this sectionCitações e Agradecimentos#
Se você usar o conjunto de dados MNIST em seu trabalho de pesquisa ou desenvolvimento, por favor, cite o seguinte artigo:
@article{lecun2010mnist,
title={MNIST handwritten digit database},
author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
journal={ATT Labs [Online]},
volume={2},
year={2010}
}Gostaríamos de agradecer a Yann LeCun, Corinna Cortes e Christopher J.C. Burges por criar e manter o conjunto de dados MNIST como um recurso valioso para a comunidade de pesquisa de machine learning e computer vision. Para mais informações sobre o conjunto de dados MNIST e seus criadores, visite o site do conjunto de dados MNIST.
Link to this sectionTestes Rápidos com MNIST160#
Precisa de um teste de regressão extremamente rápido? O Ultralytics também disponibiliza data="mnist160", uma fatia de 160 imagens contendo as oito primeiras imagens de cada dígito (0-9) tanto das divisões de treino quanto de teste. Ele espelha a estrutura de diretórios do MNIST, portanto, você pode trocar conjuntos de dados sem alterar nenhum outro argumento:
yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28Use este subconjunto para pipelines de CI ou verificações de integridade antes de se comprometer com o conjunto de dados completo de 70.000 imagens.
Link to this sectionFAQ#
Link to this sectionO que é o conjunto de dados MNIST e por que ele é importante em machine learning?#
O conjunto de dados MNIST, ou conjunto de dados Modified National Institute of Standards and Technology, é uma coleção amplamente utilizada de dígitos manuscritos projetada para treinar e testar sistemas de classificação de imagens. Ele inclui 60.000 imagens de treino e 10.000 imagens de teste, todas em tons de cinza e com tamanho de 28x28 pixels. A importância do conjunto de dados reside no seu papel como uma referência padrão para avaliar algoritmos de classificação de imagens, ajudando pesquisadores e engenheiros a comparar métodos e acompanhar o progresso no campo.
Link to this sectionComo posso usar o Ultralytics YOLO para treinar um modelo no conjunto de dados MNIST?#
Para treinar um modelo no conjunto de dados MNIST usando o Ultralytics YOLO, você pode seguir estes passos:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)Para uma lista detalhada de argumentos de treino disponíveis, consulte a página de Treino.
Link to this sectionQual é a diferença entre os conjuntos de dados MNIST e EMNIST?#
O conjunto de dados MNIST contém apenas dígitos manuscritos, enquanto o conjunto de dados Extended MNIST (EMNIST) inclui dígitos e letras maiúsculas e minúsculas. O EMNIST foi desenvolvido como um sucessor do MNIST e utiliza o mesmo formato de 28x28 pixels para as imagens, tornando-o compatível com ferramentas e modelos projetados para o conjunto de dados MNIST original. Essa gama mais ampla de caracteres no EMNIST torna-o útil para uma maior variedade de aplicações de machine learning.
Link to this sectionPosso usar o Ultralytics Platform para treinar modelos em conjuntos de dados personalizados como o MNIST?#
Sim, você pode usar o Ultralytics Platform para treinar modelos em conjuntos de dados personalizados como o MNIST. O Ultralytics Platform oferece uma interface amigável para carregar conjuntos de dados, treinar modelos e gerenciar projetos sem a necessidade de amplo conhecimento em codificação. Para mais detalhes sobre como começar, confira a página de Início Rápido do Ultralytics Platform.
Link to this sectionComo o MNIST se compara a outros conjuntos de dados de classificação de imagens?#
O MNIST é mais simples do que muitos conjuntos de dados modernos como CIFAR-10 ou ImageNet, tornando-o ideal para iniciantes e experimentação rápida. Embora conjuntos de dados mais complexos ofereçam maiores desafios com imagens coloridas e diversas categorias de objetos, o MNIST permanece valioso pela sua simplicidade, tamanho de arquivo pequeno e significado histórico no desenvolvimento de algoritmos de machine learning. Para tarefas de classificação mais avançadas, considere usar Fashion-MNIST, que mantém a mesma estrutura, mas apresenta itens de vestuário em vez de dígitos.