Dataset CIFAR-10
O dataset CIFAR-10 (Canadian Institute For Advanced Research) é uma coleção de imagens amplamente utilizada para machine learning e algoritmos de visão computacional. Ele foi desenvolvido por pesquisadores no instituto CIFAR e consiste em 60.000 imagens coloridas de 32x32 em 10 classes diferentes.
Principais recursos
- O dataset CIFAR-10 consiste em 60.000 imagens, divididas em 10 classes.
- Cada classe contém 6.000 imagens, divididas em 5.000 para treinamento e 1.000 para testes.
- As imagens são coloridas e têm um tamanho de 32x32 pixels.
- As 10 classes diferentes representam aviões, carros, pássaros, gatos, cervos, cães, sapos, cavalos, navios e caminhões.
- O CIFAR-10 é comumente usado para treinamento e testes no campo de machine learning e visão computacional.
Estrutura do Dataset
O dataset CIFAR-10 é dividido em dois subconjuntos:
- Conjunto de Treinamento: Este subconjunto contém 50.000 imagens usadas para treinar modelos de machine learning.
- Conjunto de Testes: Este subconjunto consiste em 10.000 imagens usadas para testar e avaliar os modelos treinados.
Aplicações
O dataset CIFAR-10 é amplamente utilizado para treinar e avaliar modelos de deep learning em tarefas de classificação de imagens, como Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) e vários outros algoritmos de machine learning. A diversidade do dataset em termos de classes e a presença de imagens coloridas tornam-no um dataset completo para pesquisa e desenvolvimento no campo de machine learning e visão computacional.
Utilização
Para treinar um modelo YOLO no dataset CIFAR-10 por 100 epochs com um tamanho de imagem de 32x32, podes usar os seguintes snippets de código. Para uma lista abrangente de argumentos disponíveis, consulta a página de Training do modelo.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)Amostra de Imagens e Anotações
O dataset CIFAR-10 contém imagens coloridas de vários objetos, fornecendo um dataset bem estruturado para tarefas de classificação de imagens. Aqui estão alguns exemplos de imagens do dataset:

O exemplo demonstra a variedade e a complexidade dos objetos no dataset CIFAR-10, destacando a importância de um dataset diversificado para treinar modelos de classificação de imagens robustos.
Citações e Agradecimentos
Se usares o dataset CIFAR-10 no teu trabalho de pesquisa ou desenvolvimento, por favor cita o seguinte artigo:
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}Gostaríamos de agradecer a Alex Krizhevsky por criar e manter o dataset CIFAR-10 como um recurso valioso para a comunidade de pesquisa em machine learning e computer vision. Para mais informações sobre o dataset CIFAR-10 e seu criador, visita o site do dataset CIFAR-10.
FAQ
Como posso treinar um modelo YOLO no dataset CIFAR-10?
Para treinar um modelo YOLO no dataset CIFAR-10 usando a Ultralytics, podes seguir os exemplos fornecidos para Python e CLI. Aqui tens um exemplo básico para treinar o teu modelo por 100 épocas com um tamanho de imagem de 32x32 pixels:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)Para mais detalhes, consulta a página de Training do modelo.
Quais são as principais características do dataset CIFAR-10?
O dataset CIFAR-10 consiste em 60.000 imagens coloridas divididas em 10 classes. Cada classe contém 6.000 imagens, com 5.000 para treinamento e 1.000 para testes. As imagens têm 32x32 pixels de tamanho e variam entre as seguintes categorias:
- Aviões
- Carros
- Pássaros
- Gatos
- Cervos
- Cães
- Sapos
- Cavalos
- Navios
- Caminhões
Este dataset diversificado é essencial para treinar modelos de classificação de imagens em áreas como machine learning e visão computacional. Para mais informações, visita as seções sobre dataset structure e applications do CIFAR-10.
Por que usar o dataset CIFAR-10 para tarefas de classificação de imagens?
O dataset CIFAR-10 é um excelente benchmark para classificação de imagens devido à sua diversidade e estrutura. Contém uma mistura equilibrada de 60.000 imagens rotuladas em 10 categorias diferentes, o que ajuda no treinamento de modelos robustos e generalizados. É amplamente utilizado para avaliar modelos de deep learning, incluindo Convolutional Neural Networks (CNNs) e outros algoritmos de machine learning. O dataset é relativamente pequeno, tornando-o adequado para experimentação rápida e desenvolvimento de algoritmos. Explora as suas inúmeras aplicações na seção applications.
Como o dataset CIFAR-10 é estruturado?
O dataset CIFAR-10 é estruturado em dois subconjuntos principais:
- Conjunto de Treinamento: Contém 50.000 imagens usadas para treinar modelos de machine learning.
- Conjunto de Testes: Consiste em 10.000 imagens para testar e avaliar os modelos treinados.
Cada subconjunto compreende imagens categorizadas em 10 classes, com as suas anotações prontamente disponíveis para treinamento e avaliação de modelos. Para informações mais detalhadas, consulta a seção dataset structure.
Como posso citar o dataset CIFAR-10 na minha pesquisa?
Se usares o dataset CIFAR-10 nos teus projetos de pesquisa ou desenvolvimento, certifica-te de citar o seguinte artigo:
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}Agradecer aos criadores do dataset ajuda a apoiar a pesquisa e o desenvolvimento contínuos na área. Para mais detalhes, consulta a seção citations and acknowledgments.
Quais são alguns exemplos práticos de uso do dataset CIFAR-10?
O dataset CIFAR-10 é frequentemente usado para treinar modelos de classificação de imagens, como Convolutional Neural Networks (CNNs) e Support Vector Machines (SVMs). Estes modelos podem ser empregados em várias tarefas de visão computacional, incluindo object detection, image recognition e etiquetagem automatizada. Para ver alguns exemplos práticos, verifica os snippets de código na seção usage.