Salta para o conteúdo

Conjunto de dados CIFAR-10

O conjunto de dados CIFAR-10 (Canadian Institute For Advanced Research) é uma coleção de imagens amplamente utilizada para algoritmos de aprendizagem automática e visão por computador. Foi desenvolvido por investigadores do instituto CIFAR e consiste em 60.000 imagens a cores 32x32 em 10 classes diferentes.

Características principais

  • O conjunto de dados CIFAR-10 consiste em 60.000 imagens, divididas em 10 classes.
  • Cada classe contém 6.000 imagens, divididas em 5.000 para treino e 1.000 para teste.
  • As imagens são coloridas e têm um tamanho de 32x32 pixéis.
  • As 10 classes diferentes representam aviões, carros, pássaros, gatos, veados, cães, sapos, cavalos, navios e camiões.
  • O CIFAR-10 é normalmente utilizado para treino e teste no domínio da aprendizagem automática e da visão computacional.

Estrutura do conjunto de dados

O conjunto de dados CIFAR-10 está dividido em dois subconjuntos:

  1. Conjunto de treino: Este subconjunto contém 50.000 imagens utilizadas para treinar modelos de aprendizagem automática.
  2. Conjunto de teste: Este subconjunto consiste em 10.000 imagens utilizadas para testar e avaliar os modelos treinados.

Aplicações

O conjunto de dados CIFAR-10 é amplamente utilizado para treinar e avaliar modelos de aprendizagem profunda em tarefas de classificação de imagens, como Redes Neurais Convolucionais (CNNs), Máquinas de Vetores de Suporte (SVMs) e vários outros algoritmos de aprendizagem automática. A diversidade do conjunto de dados em termos de classes e a presença de imagens a cores fazem dele um conjunto de dados completo para investigação e desenvolvimento no domínio da aprendizagem automática e da visão computacional.

Utilização

Para treinar um modelo YOLO no conjunto de dados CIFAR-10 para 100 épocas com um tamanho de imagem de 32x32, podes utilizar os seguintes snippets de código. Para obter uma lista completa dos argumentos disponíveis, consulta a página de treino do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='cifar10', epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

Exemplos de imagens e anotações

O conjunto de dados CIFAR-10 contém imagens a cores de vários objectos, proporcionando um conjunto de dados bem estruturado para tarefas de classificação de imagens. Aqui tens alguns exemplos de imagens do conjunto de dados:

Imagem de amostra do conjunto de dados

O exemplo mostra a variedade e complexidade dos objectos no conjunto de dados CIFAR-10, realçando a importância de um conjunto de dados diversificado para treinar modelos de classificação de imagens robustos.

Citações e agradecimentos

Se utilizares o conjunto de dados CIFAR-10 no teu trabalho de investigação ou desenvolvimento, cita o seguinte documento:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Gostaríamos de agradecer a Alex Krizhevsky por criar e manter o conjunto de dados CIFAR-10 como um recurso valioso para a comunidade de investigação em aprendizagem automática e visão computacional. Para mais informações sobre o conjunto de dados CIFAR-10 e o seu criador, visita o sítio Web do conjunto de dados CIFAR-10.



Criado em 2023-11-12, Atualizado em 2023-11-22
Autores: glenn-jocher (3)

Comentários