Dataset CIFAR-10

O dataset CIFAR-10 (Canadian Institute For Advanced Research) é uma coleção de imagens amplamente utilizada para machine learning e algoritmos de visão computacional. Ele foi desenvolvido por pesquisadores no instituto CIFAR e consiste em 60.000 imagens coloridas de 32x32 em 10 classes diferentes.



Watch: How to Train an Image Classification Model with CIFAR-10 Dataset using Ultralytics YOLO26

Principais recursos

  • O dataset CIFAR-10 consiste em 60.000 imagens, divididas em 10 classes.
  • Cada classe contém 6.000 imagens, divididas em 5.000 para treinamento e 1.000 para testes.
  • As imagens são coloridas e têm um tamanho de 32x32 pixels.
  • As 10 classes diferentes representam aviões, carros, pássaros, gatos, cervos, cães, sapos, cavalos, navios e caminhões.
  • O CIFAR-10 é comumente usado para treinamento e testes no campo de machine learning e visão computacional.

Estrutura do Dataset

O dataset CIFAR-10 é dividido em dois subconjuntos:

  1. Conjunto de Treinamento: Este subconjunto contém 50.000 imagens usadas para treinar modelos de machine learning.
  2. Conjunto de Testes: Este subconjunto consiste em 10.000 imagens usadas para testar e avaliar os modelos treinados.

Aplicações

O dataset CIFAR-10 é amplamente utilizado para treinar e avaliar modelos de deep learning em tarefas de classificação de imagens, como Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) e vários outros algoritmos de machine learning. A diversidade do dataset em termos de classes e a presença de imagens coloridas tornam-no um dataset completo para pesquisa e desenvolvimento no campo de machine learning e visão computacional.

Utilização

Para treinar um modelo YOLO no dataset CIFAR-10 por 100 epochs com um tamanho de imagem de 32x32, podes usar os seguintes snippets de código. Para uma lista abrangente de argumentos disponíveis, consulta a página de Training do modelo.

Exemplo de Treino
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Amostra de Imagens e Anotações

O dataset CIFAR-10 contém imagens coloridas de vários objetos, fornecendo um dataset bem estruturado para tarefas de classificação de imagens. Aqui estão alguns exemplos de imagens do dataset:

Exemplos do dataset de classificação de imagens CIFAR-10

O exemplo demonstra a variedade e a complexidade dos objetos no dataset CIFAR-10, destacando a importância de um dataset diversificado para treinar modelos de classificação de imagens robustos.

Citações e Agradecimentos

Se usares o dataset CIFAR-10 no teu trabalho de pesquisa ou desenvolvimento, por favor cita o seguinte artigo:

Citação
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Gostaríamos de agradecer a Alex Krizhevsky por criar e manter o dataset CIFAR-10 como um recurso valioso para a comunidade de pesquisa em machine learning e computer vision. Para mais informações sobre o dataset CIFAR-10 e seu criador, visita o site do dataset CIFAR-10.

FAQ

Como posso treinar um modelo YOLO no dataset CIFAR-10?

Para treinar um modelo YOLO no dataset CIFAR-10 usando a Ultralytics, podes seguir os exemplos fornecidos para Python e CLI. Aqui tens um exemplo básico para treinar o teu modelo por 100 épocas com um tamanho de imagem de 32x32 pixels:

Exemplo
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Para mais detalhes, consulta a página de Training do modelo.

Quais são as principais características do dataset CIFAR-10?

O dataset CIFAR-10 consiste em 60.000 imagens coloridas divididas em 10 classes. Cada classe contém 6.000 imagens, com 5.000 para treinamento e 1.000 para testes. As imagens têm 32x32 pixels de tamanho e variam entre as seguintes categorias:

  • Aviões
  • Carros
  • Pássaros
  • Gatos
  • Cervos
  • Cães
  • Sapos
  • Cavalos
  • Navios
  • Caminhões

Este dataset diversificado é essencial para treinar modelos de classificação de imagens em áreas como machine learning e visão computacional. Para mais informações, visita as seções sobre dataset structure e applications do CIFAR-10.

Por que usar o dataset CIFAR-10 para tarefas de classificação de imagens?

O dataset CIFAR-10 é um excelente benchmark para classificação de imagens devido à sua diversidade e estrutura. Contém uma mistura equilibrada de 60.000 imagens rotuladas em 10 categorias diferentes, o que ajuda no treinamento de modelos robustos e generalizados. É amplamente utilizado para avaliar modelos de deep learning, incluindo Convolutional Neural Networks (CNNs) e outros algoritmos de machine learning. O dataset é relativamente pequeno, tornando-o adequado para experimentação rápida e desenvolvimento de algoritmos. Explora as suas inúmeras aplicações na seção applications.

Como o dataset CIFAR-10 é estruturado?

O dataset CIFAR-10 é estruturado em dois subconjuntos principais:

  1. Conjunto de Treinamento: Contém 50.000 imagens usadas para treinar modelos de machine learning.
  2. Conjunto de Testes: Consiste em 10.000 imagens para testar e avaliar os modelos treinados.

Cada subconjunto compreende imagens categorizadas em 10 classes, com as suas anotações prontamente disponíveis para treinamento e avaliação de modelos. Para informações mais detalhadas, consulta a seção dataset structure.

Como posso citar o dataset CIFAR-10 na minha pesquisa?

Se usares o dataset CIFAR-10 nos teus projetos de pesquisa ou desenvolvimento, certifica-te de citar o seguinte artigo:

Citação
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Agradecer aos criadores do dataset ajuda a apoiar a pesquisa e o desenvolvimento contínuos na área. Para mais detalhes, consulta a seção citations and acknowledgments.

Quais são alguns exemplos práticos de uso do dataset CIFAR-10?

O dataset CIFAR-10 é frequentemente usado para treinar modelos de classificação de imagens, como Convolutional Neural Networks (CNNs) e Support Vector Machines (SVMs). Estes modelos podem ser empregados em várias tarefas de visão computacional, incluindo object detection, image recognition e etiquetagem automatizada. Para ver alguns exemplos práticos, verifica os snippets de código na seção usage.

Comentários