Salta para o conteúdo

Conjunto de dados CIFAR-10

O conjunto de dados CIFAR-10 (Canadian Institute For Advanced Research) é uma coleção de imagens amplamente utilizada para algoritmos de aprendizagem automática e visão por computador. Foi desenvolvido por investigadores do instituto CIFAR e consiste em 60.000 imagens a cores 32x32 em 10 classes diferentes.



Observa: Como treinar um modelo de classificação de imagens com o conjunto de dados CIFAR-10 utilizando Ultralytics YOLOv8

Características principais

  • O conjunto de dados CIFAR-10 consiste em 60.000 imagens, divididas em 10 classes.
  • Cada classe contém 6.000 imagens, divididas em 5.000 para treino e 1.000 para teste.
  • As imagens são coloridas e têm um tamanho de 32x32 pixéis.
  • As 10 classes diferentes representam aviões, carros, pássaros, gatos, veados, cães, sapos, cavalos, navios e camiões.
  • O CIFAR-10 é normalmente utilizado para treino e teste no domínio da aprendizagem automática e da visão computacional.

Estrutura do conjunto de dados

O conjunto de dados CIFAR-10 está dividido em dois subconjuntos:

  1. Conjunto de treino: Este subconjunto contém 50.000 imagens utilizadas para treinar modelos de aprendizagem automática.
  2. Conjunto de teste: Este subconjunto consiste em 10.000 imagens utilizadas para testar e avaliar os modelos treinados.

Aplicações

O conjunto de dados CIFAR-10 é amplamente utilizado para treinar e avaliar modelos de aprendizagem profunda em tarefas de classificação de imagens, como Redes Neurais Convolucionais (CNNs), Máquinas de Vetores de Suporte (SVMs) e vários outros algoritmos de aprendizagem automática. A diversidade do conjunto de dados em termos de classes e a presença de imagens a cores fazem dele um conjunto de dados completo para investigação e desenvolvimento no domínio da aprendizagem automática e da visão computacional.

Utilização

Para treinar um modelo YOLO no conjunto de dados CIFAR-10 para 100 épocas com um tamanho de imagem de 32x32, podes utilizar os seguintes snippets de código. Para obter uma lista completa dos argumentos disponíveis, consulta a página de treino do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

Exemplos de imagens e anotações

O conjunto de dados CIFAR-10 contém imagens a cores de vários objectos, proporcionando um conjunto de dados bem estruturado para tarefas de classificação de imagens. Aqui tens alguns exemplos de imagens do conjunto de dados:

Imagem de amostra do conjunto de dados

O exemplo mostra a variedade e complexidade dos objectos no conjunto de dados CIFAR-10, realçando a importância de um conjunto de dados diversificado para treinar modelos de classificação de imagens robustos.

Citações e agradecimentos

Se utilizares o conjunto de dados CIFAR-10 no teu trabalho de investigação ou desenvolvimento, cita o seguinte documento:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Gostaríamos de agradecer a Alex Krizhevsky por criar e manter o conjunto de dados CIFAR-10 como um recurso valioso para a comunidade de investigação em aprendizagem automática e visão computacional. Para mais informações sobre o conjunto de dados CIFAR-10 e o seu criador, visita o sítio Web do conjunto de dados CIFAR-10.

FAQ

Como posso treinar um modelo YOLO no conjunto de dados CIFAR-10?

Para treinar um modelo YOLO no conjunto de dados CIFAR-10 utilizando Ultralytics, pode seguir os exemplos fornecidos para Python e CLI. Eis um exemplo básico para treinar o seu modelo para 100 épocas com um tamanho de imagem de 32x32 pixels:

Exemplo

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

Para mais informações, consulta a página de formação do modelo.

Quais são as principais características do conjunto de dados CIFAR-10?

O conjunto de dados CIFAR-10 consiste em 60.000 imagens a cores divididas em 10 classes. Cada classe contém 6.000 imagens, com 5.000 para treino e 1.000 para teste. As imagens têm um tamanho de 32x32 píxeis e variam entre as seguintes categorias:

  • Aviões
  • Automóveis
  • Aves
  • Gatos
  • Cervo
  • Cães
  • Rãs
  • Cavalos
  • Navios
  • Camiões

Este conjunto de dados diversificado é essencial para treinar modelos de classificação de imagens em domínios como a aprendizagem automática e a visão por computador. Para mais informações, visita as secções do CIFAR-10 sobre a estrutura do conjunto de dados e as aplicações.

Porquê utilizar o conjunto de dados CIFAR-10 para tarefas de classificação de imagens?

O conjunto de dados CIFAR-10 é uma excelente referência para a classificação de imagens devido à sua diversidade e estrutura. Contém uma mistura equilibrada de 60.000 imagens rotuladas em 10 categorias diferentes, o que ajuda a treinar modelos robustos e generalizados. É amplamente utilizado para avaliar modelos de aprendizagem profunda, incluindo Redes Neuronais Convolucionais (CNNs) e outros algoritmos de aprendizagem automática. O conjunto de dados é relativamente pequeno, o que o torna adequado para uma rápida experimentação e desenvolvimento de algoritmos. Explora as suas inúmeras aplicações na secção de aplicações.

Como está estruturado o conjunto de dados CIFAR-10?

O conjunto de dados CIFAR-10 está estruturado em dois subconjuntos principais:

  1. Conjunto de treino: Contém 50.000 imagens utilizadas para treinar modelos de aprendizagem automática.
  2. Conjunto de teste: Consiste em 10.000 imagens para testar e aferir os modelos treinados.

Cada subconjunto inclui imagens categorizadas em 10 classes, com as suas anotações prontamente disponíveis para a formação e avaliação do modelo. Para obter informações mais detalhadas, consulta a secção sobre a estrutura do conjunto de dados.

Como posso citar o conjunto de dados CIFAR-10 na minha investigação?

Se utilizares o conjunto de dados CIFAR-10 nos teus projectos de investigação ou desenvolvimento, não te esqueças de citar o seguinte documento:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

O reconhecimento dos criadores do conjunto de dados ajuda a apoiar a investigação e o desenvolvimento contínuos neste domínio. Para mais informações, consulta a secção de citações e agradecimentos.

Quais são alguns exemplos práticos de utilização do conjunto de dados CIFAR-10?

O conjunto de dados CIFAR-10 é frequentemente utilizado para treinar modelos de classificação de imagens, como as Redes Neuronais Convolucionais (CNN) e as Máquinas de Vectores de Suporte (SVM). Estes modelos podem ser utilizados em várias tarefas de visão computacional, incluindo deteção de objectos, reconhecimento de imagens e etiquetagem automática. Para ver alguns exemplos práticos, consulta os trechos de código na secção de utilização.



Criado em 2023-11-12, Atualizado em 2024-07-12
Autores: RizwanMunawar (1), glenn-jocher (6)

Comentários