Saltar para o conteúdo

Conjunto de dados MNIST

O conjunto de dados MNIST (Modified National Institute of Standards and Technology) é uma grande base de dados de dígitos manuscritos que é normalmente utilizada para treinar vários sistemas de processamento de imagem e modelos de aprendizagem automática. Foi criado através da "re-mistura" das amostras dos conjuntos de dados originais do NIST e tornou-se uma referência para avaliar o desempenho dos algoritmos de classificação de imagens.

Caraterísticas principais

  • A MNIST contém 60.000 imagens de treino e 10.000 imagens de teste de dígitos manuscritos.
  • O conjunto de dados inclui imagens em escala de cinzentos de 28x28 pixéis.
  • As imagens são normalizadas para caberem numa caixa delimitadora de 28x28 pixéis e anti-aliased, introduzindo níveis de escala de cinzentos.
  • A MNIST é amplamente utilizada para treino e teste no domínio da aprendizagem automática, especialmente para tarefas de classificação de imagens.

Estrutura do conjunto de dados

O conjunto de dados MNIST está dividido em dois subconjuntos:

  1. Conjunto de treino: Este subconjunto contém 60.000 imagens de dígitos manuscritos utilizados para treinar modelos de aprendizagem automática.
  2. Conjunto de teste: Este subconjunto é constituído por 10 000 imagens utilizadas para testar e aferir os modelos treinados.

MNIST alargada (EMNIST)

O MNIST alargado (EMNIST) é um novo conjunto de dados desenvolvido e publicado pelo NIST para suceder ao MNIST. Enquanto o MNIST incluía apenas imagens de dígitos manuscritos, o EMNIST inclui todas as imagens da Base de Dados Especial 19 do NIST, que é uma grande base de dados de letras maiúsculas e minúsculas manuscritas, bem como de dígitos. As imagens da EMNIST foram convertidas para o mesmo formato de 28x28 píxeis, pelo mesmo processo, que as imagens da MNIST. Por conseguinte, as ferramentas que funcionam com o conjunto de dados MNIST mais antigo e mais pequeno funcionarão provavelmente sem modificações com o EMNIST.

Aplicações

O conjunto de dados MNIST é amplamente utilizado para treinar e avaliar modelos de aprendizagem profunda em tarefas de classificação de imagens, tais como Redes Neuronais Convolucionais (CNN), Máquinas de Vectores de Suporte (SVM) e vários outros algoritmos de aprendizagem automática. O formato simples e bem estruturado do conjunto de dados torna-o um recurso essencial para investigadores e profissionais no domínio da aprendizagem automática e da visão computacional.

Utilização

Para treinar um modelo CNN no conjunto de dados MNIST para 100 épocas com um tamanho de imagem de 32x32, pode utilizar os seguintes snippets de código. Para obter uma lista completa dos argumentos disponíveis, consulte a página Treinamento do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Exemplos de imagens e anotações

O conjunto de dados MNIST contém imagens em escala de cinzentos de dígitos manuscritos, proporcionando um conjunto de dados bem estruturado para tarefas de classificação de imagens. Aqui estão alguns exemplos de imagens do conjunto de dados:

Imagem de amostra do conjunto de dados

O exemplo mostra a variedade e complexidade dos dígitos manuscritos no conjunto de dados MNIST, realçando a importância de um conjunto de dados diversificado para treinar modelos robustos de classificação de imagens.

Citações e agradecimentos

Se utilizar o conjunto de dados MNIST no seu

trabalho de investigação ou desenvolvimento, é favor citar o seguinte artigo:

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

Gostaríamos de agradecer a Yann LeCun, Corinna Cortes e Christopher J.C. Burges pela criação e manutenção do conjunto de dados MNIST como um recurso valioso para a comunidade de investigação em aprendizagem automática e visão computacional. Para mais informações sobre o conjunto de dados MNIST e os seus criadores, visite o sítio Web do conjunto de dados MNIST.

FAQ

O que é o conjunto de dados MNIST e qual a sua importância para a aprendizagem automática?

O conjunto de dados MNIST, ou conjunto de dados do Instituto Nacional de Normas e Tecnologia modificado, é uma coleção de dígitos manuscritos amplamente utilizada, concebida para treinar e testar sistemas de classificação de imagens. Inclui 60.000 imagens de treino e 10.000 imagens de teste, todas em escala de cinzentos e com 28x28 píxeis de tamanho. A importância do conjunto de dados reside no seu papel como referência padrão para a avaliação de algoritmos de classificação de imagens, ajudando investigadores e engenheiros a comparar métodos e a acompanhar os progressos neste domínio.

Como é que posso utilizar Ultralytics YOLO para treinar um modelo no conjunto de dados MNIST?

Para treinar um modelo no conjunto de dados MNIST utilizando Ultralytics YOLO , pode seguir estes passos:

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Para obter uma lista pormenorizada dos argumentos de formação disponíveis, consulte a página Formação.

Qual é a diferença entre os conjuntos de dados MNIST e EMNIST?

O conjunto de dados MNIST contém apenas dígitos manuscritos, enquanto o conjunto de dados MNIST alargado (EMNIST) inclui tanto dígitos como letras maiúsculas e minúsculas. O EMNIST foi desenvolvido como sucessor do MNIST e utiliza o mesmo formato de 28x28 pixéis para as imagens, tornando-o compatível com as ferramentas e modelos concebidos para o conjunto de dados MNIST original. Esta gama mais vasta de caracteres no EMNIST torna-o útil para uma maior variedade de aplicações de aprendizagem automática.

Posso utilizar o Ultralytics HUB para treinar modelos em conjuntos de dados personalizados como o MNIST?

Sim, pode utilizar o Ultralytics HUB para treinar modelos em conjuntos de dados personalizados como o MNIST. Ultralytics O HUB oferece uma interface fácil de usar para carregar conjuntos de dados, treinar modelos e gerenciar projetos sem a necessidade de conhecimento extenso de codificação. Para obter mais detalhes sobre como começar, consulte a página Ultralytics HUB Quickstart.

📅C riado há 1 ano ✏️ Atualizado há 1 mês

Comentários