Conjunto de dados CIFAR-10
O conjunto de dados CIFAR-10 (Canadian Institute For Advanced Research) é uma coleção de imagens amplamente utilizada para algoritmos de aprendizagem automática e visão por computador. Foi desenvolvido por investigadores do instituto CIFAR e consiste em 60.000 imagens a cores 32x32 em 10 classes diferentes.
Observa: Como treinar um modelo de classificação de imagens com o conjunto de dados CIFAR-10 utilizando Ultralytics YOLOv8
Características principais
- O conjunto de dados CIFAR-10 consiste em 60.000 imagens, divididas em 10 classes.
- Cada classe contém 6.000 imagens, divididas em 5.000 para treino e 1.000 para teste.
- As imagens são coloridas e têm um tamanho de 32x32 pixéis.
- As 10 classes diferentes representam aviões, carros, pássaros, gatos, veados, cães, sapos, cavalos, navios e camiões.
- O CIFAR-10 é normalmente utilizado para treino e teste no domínio da aprendizagem automática e da visão computacional.
Estrutura do conjunto de dados
O conjunto de dados CIFAR-10 está dividido em dois subconjuntos:
- Conjunto de treino: Este subconjunto contém 50.000 imagens utilizadas para treinar modelos de aprendizagem automática.
- Conjunto de teste: Este subconjunto consiste em 10.000 imagens utilizadas para testar e avaliar os modelos treinados.
Aplicações
O conjunto de dados CIFAR-10 é amplamente utilizado para treinar e avaliar modelos de aprendizagem profunda em tarefas de classificação de imagens, como Redes Neurais Convolucionais (CNNs), Máquinas de Vetores de Suporte (SVMs) e vários outros algoritmos de aprendizagem automática. A diversidade do conjunto de dados em termos de classes e a presença de imagens a cores fazem dele um conjunto de dados completo para investigação e desenvolvimento no domínio da aprendizagem automática e da visão computacional.
Utilização
Para treinar um modelo YOLO no conjunto de dados CIFAR-10 para 100 épocas com um tamanho de imagem de 32x32, podes utilizar os seguintes snippets de código. Para obter uma lista completa dos argumentos disponíveis, consulta a página de treino do modelo.
Exemplo de comboio
Exemplos de imagens e anotações
O conjunto de dados CIFAR-10 contém imagens a cores de vários objectos, proporcionando um conjunto de dados bem estruturado para tarefas de classificação de imagens. Aqui tens alguns exemplos de imagens do conjunto de dados:
O exemplo mostra a variedade e complexidade dos objectos no conjunto de dados CIFAR-10, realçando a importância de um conjunto de dados diversificado para treinar modelos de classificação de imagens robustos.
Citações e agradecimentos
Se utilizares o conjunto de dados CIFAR-10 no teu trabalho de investigação ou desenvolvimento, cita o seguinte documento:
Gostaríamos de agradecer a Alex Krizhevsky por criar e manter o conjunto de dados CIFAR-10 como um recurso valioso para a comunidade de investigação em aprendizagem automática e visão computacional. Para mais informações sobre o conjunto de dados CIFAR-10 e o seu criador, visita o sítio Web do conjunto de dados CIFAR-10.
FAQ
Como posso treinar um modelo YOLO no conjunto de dados CIFAR-10?
Para treinar um modelo YOLO no conjunto de dados CIFAR-10 utilizando Ultralytics, pode seguir os exemplos fornecidos para Python e CLI. Eis um exemplo básico para treinar o seu modelo para 100 épocas com um tamanho de imagem de 32x32 pixels:
Exemplo
from ultralytics import YOLO
# Load a model
model = YOLO("yolov8n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
Para mais informações, consulta a página de formação do modelo.
Quais são as principais características do conjunto de dados CIFAR-10?
O conjunto de dados CIFAR-10 consiste em 60.000 imagens a cores divididas em 10 classes. Cada classe contém 6.000 imagens, com 5.000 para treino e 1.000 para teste. As imagens têm um tamanho de 32x32 píxeis e variam entre as seguintes categorias:
- Aviões
- Automóveis
- Aves
- Gatos
- Cervo
- Cães
- Rãs
- Cavalos
- Navios
- Camiões
Este conjunto de dados diversificado é essencial para treinar modelos de classificação de imagens em domínios como a aprendizagem automática e a visão por computador. Para mais informações, visita as secções do CIFAR-10 sobre a estrutura do conjunto de dados e as aplicações.
Porquê utilizar o conjunto de dados CIFAR-10 para tarefas de classificação de imagens?
O conjunto de dados CIFAR-10 é uma excelente referência para a classificação de imagens devido à sua diversidade e estrutura. Contém uma mistura equilibrada de 60.000 imagens rotuladas em 10 categorias diferentes, o que ajuda a treinar modelos robustos e generalizados. É amplamente utilizado para avaliar modelos de aprendizagem profunda, incluindo Redes Neuronais Convolucionais (CNNs) e outros algoritmos de aprendizagem automática. O conjunto de dados é relativamente pequeno, o que o torna adequado para uma rápida experimentação e desenvolvimento de algoritmos. Explora as suas inúmeras aplicações na secção de aplicações.
Como está estruturado o conjunto de dados CIFAR-10?
O conjunto de dados CIFAR-10 está estruturado em dois subconjuntos principais:
- Conjunto de treino: Contém 50.000 imagens utilizadas para treinar modelos de aprendizagem automática.
- Conjunto de teste: Consiste em 10.000 imagens para testar e aferir os modelos treinados.
Cada subconjunto inclui imagens categorizadas em 10 classes, com as suas anotações prontamente disponíveis para a formação e avaliação do modelo. Para obter informações mais detalhadas, consulta a secção sobre a estrutura do conjunto de dados.
Como posso citar o conjunto de dados CIFAR-10 na minha investigação?
Se utilizares o conjunto de dados CIFAR-10 nos teus projectos de investigação ou desenvolvimento, não te esqueças de citar o seguinte documento:
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}
O reconhecimento dos criadores do conjunto de dados ajuda a apoiar a investigação e o desenvolvimento contínuos neste domínio. Para mais informações, consulta a secção de citações e agradecimentos.
Quais são alguns exemplos práticos de utilização do conjunto de dados CIFAR-10?
O conjunto de dados CIFAR-10 é frequentemente utilizado para treinar modelos de classificação de imagens, como as Redes Neuronais Convolucionais (CNN) e as Máquinas de Vectores de Suporte (SVM). Estes modelos podem ser utilizados em várias tarefas de visão computacional, incluindo deteção de objectos, reconhecimento de imagens e etiquetagem automática. Para ver alguns exemplos práticos, consulta os trechos de código na secção de utilização.