Link to this sectionConjunto de Dados MNIST#
O conjunto de dados MNIST (Modified National Institute of Standards and Technology) é uma grande base de dados de dígitos manuscritos comumente usada para treinar vários sistemas de processamento de imagem e modelos de aprendizado de máquina. Ele foi criado ao "remisturar" as amostras dos conjuntos de dados originais do NIST e tornou-se uma referência para avaliar o desempenho de algoritmos de classificação de imagem.
Link to this sectionPrincipais recursos#
- O MNIST contém 60.000 imagens de treino e 10.000 imagens de teste de dígitos manuscritos.
- O conjunto de dados compreende imagens em tons de cinza com tamanho de 28×28 pixels.
- As imagens são normalizadas para caber em uma caixa delimitadora de 28×28 pixels e suavizadas (anti-aliased), introduzindo níveis de tons de cinza.
- O MNIST é amplamente utilizado para treino e teste no campo do aprendizado de máquina, especialmente para tarefas de classificação de imagem.
Link to this sectionEstrutura do Dataset#
O conjunto de dados MNIST é dividido em dois subconjuntos:
- Conjunto de Treino: Este subconjunto contém 60.000 imagens de dígitos manuscritos usadas para treinar modelos de aprendizado de máquina.
- Conjunto de Teste: Este subconjunto consiste em 10.000 imagens usadas para testar e comparar o desempenho dos modelos treinados.
Link to this sectionAcesso ao Conjunto de Dados#
- Arquivos originais: Baixa os arquivos gzip do arquivo MNIST original se quiser controle direto sobre o pré-processamento.
- Carregador Ultralytics: Usa
data="mnist"(oudata="mnist160"para o subconjunto abaixo) no teu comando e o conjunto de dados será baixado, convertido para PNG e armazenado em cache automaticamente.
Cada imagem no conjunto de dados é rotulada com o dígito correspondente (0-9), tornando-o um conjunto de dados de aprendizado supervisionado ideal para tarefas de classificação.
Link to this sectionExtended MNIST (EMNIST)#
O Extended MNIST (EMNIST) é um conjunto de dados mais recente desenvolvido e lançado pelo NIST para ser o sucessor do MNIST. Enquanto o MNIST incluía imagens apenas de dígitos manuscritos, o EMNIST inclui todas as imagens do NIST Special Database 19, que é uma grande base de dados de letras maiúsculas e minúsculas manuscritas, bem como dígitos. As imagens no EMNIST foram convertidas para o mesmo formato de 28×28 pixels, pelo mesmo processo, que as imagens do MNIST. Consequentemente, ferramentas que funcionam com o conjunto de dados MNIST, mais antigo e menor, provavelmente funcionarão sem modificações com o EMNIST.
Link to this sectionAplicações#
O conjunto de dados MNIST é amplamente utilizado para treinar e avaliar modelos de aprendizado profundo em tarefas de classificação de imagem, como Redes Neurais Convolucionais (CNNs), Máquinas de Vetores de Suporte (SVMs) e vários outros algoritmos de aprendizado de máquina. O formato simples e bem estruturado do conjunto de dados torna-o um recurso essencial para pesquisadores e profissionais na área de aprendizado de máquina e visão computacional.
Algumas aplicações comuns incluem:
- Benchmarking de novos algoritmos de classificação
- Propósitos educacionais para ensinar conceitos de aprendizado de máquina
- Prototipagem de sistemas de reconhecimento de imagem
- Testar técnicas de otimização de modelos
Link to this sectionUso#
Para treinar um modelo CNN no conjunto de dados MNIST por 100 épocas com um tamanho de imagem de 28×28, podes usar os seguintes snippets de código. Para uma lista abrangente de argumentos disponíveis, consulta a página de Treino do modelo.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)Link to this sectionExemplos de Imagens e Anotações#
O conjunto de dados MNIST contém imagens em tons de cinza de dígitos manuscritos, fornecendo um conjunto de dados bem estruturado para tarefas de classificação de imagem. Aqui estão alguns exemplos de imagens do conjunto de dados:

O exemplo mostra a variedade e complexidade dos dígitos manuscritos no conjunto de dados MNIST, destacando a importância de um conjunto de dados diversificado para treinar modelos de classificação de imagem robustos.
Link to this sectionCitações e Agradecimentos#
Se usares o conjunto de dados MNIST no teu trabalho de pesquisa ou desenvolvimento, por favor, cita o seguinte artigo:
@article{lecun2010mnist,
title={MNIST handwritten digit database},
author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
journal={ATT Labs [Online]},
volume={2},
year={2010}
}Gostaríamos de agradecer a Yann LeCun, Corinna Cortes e Christopher J.C. Burges pela criação e manutenção do conjunto de dados MNIST como um recurso valioso para a comunidade de pesquisa em aprendizado de máquina e visão computacional. Para mais informações sobre o conjunto de dados MNIST e os seus criadores, visita o site do conjunto de dados MNIST.
Link to this sectionTestes Rápidos MNIST160#
Precisas de um teste de regressão ultrarrápido? A Ultralytics também expõe data="mnist160", uma fatia de 160 imagens contendo as primeiras oito imagens de cada dígito (0-9) das divisões de treino e teste. Ele espelha a estrutura de diretórios do MNIST, para que possas trocar conjuntos de dados sem alterar quaisquer outros argumentos:
yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28Usa este subconjunto para pipelines de CI ou verificações de integridade antes de te comprometeres com o conjunto de dados completo de 70.000 imagens.
Link to this sectionFAQ#
Link to this sectionO que é o conjunto de dados MNIST e por que é importante no aprendizado de máquina?#
O conjunto de dados MNIST, ou conjunto de dados Modified National Institute of Standards and Technology, é uma coleção amplamente utilizada de dígitos manuscritos projetada para treinar e testar sistemas de classificação de imagem. Inclui 60.000 imagens de treino e 10.000 imagens de teste, todas em tons de cinza e com 28×28 pixels de tamanho. A importância do conjunto de dados reside no seu papel como referência padrão para avaliar algoritmos de classificação de imagem, ajudando pesquisadores e engenheiros a comparar métodos e acompanhar o progresso na área.
Link to this sectionComo posso usar a Ultralytics YOLO para treinar um modelo no conjunto de dados MNIST?#
Para treinar um modelo no conjunto de dados MNIST usando a Ultralytics YOLO, podes seguir estes passos:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)Para uma lista detalhada de argumentos de treino disponíveis, consulta a página de Treino.
Link to this sectionQual é a diferença entre os conjuntos de dados MNIST e EMNIST?#
O conjunto de dados MNIST contém apenas dígitos manuscritos, enquanto o conjunto de dados Extended MNIST (EMNIST) inclui tanto dígitos quanto letras maiúsculas e minúsculas. O EMNIST foi desenvolvido como um sucessor do MNIST e utiliza o mesmo formato de 28×28 pixels para as imagens, tornando-o compatível com ferramentas e modelos projetados para o conjunto de dados MNIST original. Esta gama mais ampla de caracteres no EMNIST torna-o útil para uma variedade maior de aplicações de aprendizado de máquina.
Link to this sectionPosso usar a Ultralytics Platform para treinar modelos em conjuntos de dados personalizados como o MNIST?#
Sim, podes usar a Ultralytics Platform para treinar modelos em conjuntos de dados personalizados como o MNIST. A Ultralytics Platform oferece uma interface amigável para carregar conjuntos de dados, treinar modelos e gerenciar projetos sem a necessidade de amplo conhecimento em codificação. Para mais detalhes sobre como começar, confere a página Ultralytics Platform Quickstart.
Link to this sectionComo o MNIST se compara a outros conjuntos de dados de classificação de imagem?#
O MNIST é mais simples do que muitos conjuntos de dados modernos como CIFAR-10 ou ImageNet, tornando-o ideal para iniciantes e experimentação rápida. Embora conjuntos de dados mais complexos ofereçam maiores desafios com imagens coloridas e diversas categorias de objetos, o MNIST permanece valioso pela sua simplicidade, pequeno tamanho de arquivo e importância histórica no desenvolvimento de algoritmos de aprendizado de máquina. Para tarefas de classificação mais avançadas, considera usar o Fashion-MNIST, que mantém a mesma estrutura, mas apresenta itens de vestuário em vez de dígitos.