Salta para o conteúdo

Conjunto de dados MNIST

O conjunto de dados MNIST (Modified National Institute of Standards and Technology) é uma grande base de dados de dígitos manuscritos que é normalmente utilizada para treinar vários sistemas de processamento de imagem e modelos de aprendizagem automática. Foi criado através da "re-mistura" das amostras dos conjuntos de dados originais do NIST e tornou-se uma referência para avaliar o desempenho dos algoritmos de classificação de imagens.

Características principais

  • A MNIST contém 60.000 imagens de treino e 10.000 imagens de teste de dígitos manuscritos.
  • O conjunto de dados inclui imagens em escala de cinzentos de tamanho 28x28 pixéis.
  • The images are normalized to fit into a 28x28 pixel bounding box and anti-aliased, introducing grayscale levels.
  • A MNIST é amplamente utilizada para treino e teste no domínio da aprendizagem automática, especialmente para tarefas de classificação de imagens.

Estrutura do conjunto de dados

O conjunto de dados MNIST está dividido em dois subconjuntos:

  1. Conjunto de treino: Este subconjunto contém 60.000 imagens de dígitos manuscritos utilizados para treinar modelos de aprendizagem automática.
  2. Conjunto de teste: Este subconjunto consiste em 10.000 imagens utilizadas para testar e avaliar os modelos treinados.

MNIST alargada (EMNIST)

O MNIST alargado (EMNIST) é um novo conjunto de dados desenvolvido e publicado pelo NIST para suceder ao MNIST. Enquanto o MNIST incluía apenas imagens de dígitos manuscritos, o EMNIST inclui todas as imagens da Base de Dados Especial 19 do NIST, que é uma grande base de dados de letras maiúsculas e minúsculas manuscritas, bem como de dígitos. As imagens da EMNIST foram convertidas para o mesmo formato de 28x28 píxeis, pelo mesmo processo, que as imagens da MNIST. Por conseguinte, as ferramentas que funcionam com o conjunto de dados MNIST mais antigo e mais pequeno funcionarão provavelmente sem modificações com o EMNIST.

Aplicações

The MNIST dataset is widely used for training and evaluating deep learning models in image classification tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. The dataset's simple and well-structured format makes it an essential resource for researchers and practitioners in the field of machine learning and computer vision.

Utilização

To train a CNN model on the MNIST dataset for 100 epochs with an image size of 32x32, you can use the following code snippets. For a comprehensive list of available arguments, refer to the model Training page.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Exemplos de imagens e anotações

The MNIST dataset contains grayscale images of handwritten digits, providing a well-structured dataset for image classification tasks. Here are some examples of images from the dataset:

Imagem de amostra do conjunto de dados

O exemplo mostra a variedade e complexidade dos dígitos manuscritos no conjunto de dados MNIST, realçando a importância de um conjunto de dados diversificado para treinar modelos robustos de classificação de imagens.

Citações e agradecimentos

Se utilizares o conjunto de dados MNIST no teu

trabalho de investigação ou desenvolvimento, por favor cita o seguinte artigo:

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

We would like to acknowledge Yann LeCun, Corinna Cortes, and Christopher J.C. Burges for creating and maintaining the MNIST dataset as a valuable resource for the machine learning and computer vision research community. For more information about the MNIST dataset and its creators, visit the MNIST dataset website.

FAQ

O que é o conjunto de dados MNIST e porque é importante para a aprendizagem automática?

O conjunto de dados MNIST, ou conjunto de dados modificado do National Institute of Standards and Technology, é uma coleção de dígitos manuscritos muito utilizada, concebida para treinar e testar sistemas de classificação de imagens. Inclui 60.000 imagens de treino e 10.000 imagens de teste, todas em escala de cinzentos e com 28x28 pixels de tamanho. A importância do conjunto de dados reside no seu papel como referência padrão para a avaliação de algoritmos de classificação de imagens, ajudando investigadores e engenheiros a comparar métodos e a acompanhar os progressos neste domínio.

Como posso utilizar Ultralytics YOLO para treinar um modelo no conjunto de dados MNIST?

Para treinar um modelo no conjunto de dados MNIST utilizando Ultralytics YOLO , podes seguir estes passos:

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Para obteres uma lista detalhada dos argumentos de formação disponíveis, consulta a página Formação.

Qual é a diferença entre os conjuntos de dados MNIST e EMNIST?

O conjunto de dados MNIST contém apenas dígitos manuscritos, enquanto o conjunto de dados MNIST alargado (EMNIST) inclui tanto dígitos como letras maiúsculas e minúsculas. O EMNIST foi desenvolvido como sucessor do MNIST e utiliza o mesmo formato de 28x28 pixéis para as imagens, tornando-o compatível com as ferramentas e modelos concebidos para o conjunto de dados MNIST original. Esta gama mais vasta de caracteres no EMNIST torna-o útil para uma maior variedade de aplicações de aprendizagem automática.

Posso utilizar o Ultralytics HUB para treinar modelos em conjuntos de dados personalizados como o MNIST?

Sim, podes utilizar o Ultralytics HUB para treinar modelos em conjuntos de dados personalizados como o MNIST. Ultralytics O HUB oferece uma interface fácil de usar para carregar conjuntos de dados, treinar modelos e gerenciar projetos sem a necessidade de conhecimento extenso de codificação. Para obter mais detalhes sobre como começar, consulta a página Ultralytics HUB Quickstart.

📅 Created 11 months ago ✏️ Updated 3 days ago

Comentários