No license

Link to this sectionConjunto de dados CIFAR-10#

O conjunto de dados CIFAR-10 (Canadian Institute For Advanced Research) é um marco clássico de classificação de imagens composto por 60.000 imagens coloridas de 32x32, divididas uniformemente em 10 classes — avião, automóvel, pássaro, gato, veado, cão, sapo, cavalo, navio e caminhão. Ele vem com uma divisão predefinida de 50.000 imagens de treino e 10.000 de teste (6.000 por classe), tornando-o um ponto de partida leve e bem equilibrado para treinar e avaliar modelos de classificação. Para um desafio mais detalhado, veja o conjunto de dados relacionado CIFAR-100.

Watch: How to Train an Image Classification Model with CIFAR-10 Dataset using Ultralytics YOLO

Link to this sectionPrincipais recursos#

O CIFAR-10 contém 60.000 imagens coloridas de 32x32 pixels, divididas uniformemente em 10 classes.
Cada classe contém exatamente 6.000 imagens — 5.000 para treino e 1.000 para teste — portanto, o conjunto de dados é perfeitamente equilibrado.
As 10 classes são avião, automóvel, pássaro, gato, veado, cão, sapo, cavalo, navio e caminhão.
O conjunto de dados vem com uma divisão de treino/teste predefinida, portanto não é necessária nenhuma divisão manual ou automática.
O CIFAR-10 é um marco padrão para pesquisas de classificação de imagens e reconhecimento de objetos.

Link to this sectionEstrutura do Dataset#

O CIFAR-10 vem com uma divisão oficial e predefinida, portanto não é necessária nenhuma particionamento manual ou automático:

Classes: 10 (avião, automóvel, pássaro, gato, veado, cão, sapo, cavalo, navio, caminhão)
Total de imagens: 60.000 (32x32 coloridas)
Conjunto de treino: 50.000 imagens (5.000 por classe)
Conjunto de teste: 10.000 imagens (1.000 por classe)

Divisão de validação

O CIFAR-10 não possui uma pasta de validação separada, por isso o Ultralytics usa o conjunto de teste de 10.000 imagens como a divisão de validação durante o treinamento por padrão.

Link to this sectionAplicações#

O CIFAR-10 é amplamente utilizado para treinar e avaliar modelos de classificação de imagens, desde Redes Neurais Convolucionais (CNNs) clássicas e Máquinas de Vetores de Suporte (SVMs) até arquiteturas profundas modernas. Seu tamanho reduzido de imagem e classes equilibradas tornam-no ideal para experimentação rápida, benchmarking de novos algoritmos e ensino dos fundamentos de visão computacional.

Link to this sectionUso#

Treine um modelo YOLO no CIFAR-10 por 100 épocas com um tamanho de imagem de 32. Para a lista completa de argumentos disponíveis, veja a página de Treinamento e o guia de tarefas de classificação de imagens.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Link to this sectionExemplos de Imagens e Anotações#

O conjunto de dados CIFAR-10 contém imagens coloridas de vários objetos, fornecendo um conjunto de dados bem estruturado para tarefas de classificação de imagens. Aqui estão alguns exemplos de imagens do conjunto de dados:

Amostras do conjunto de dados de classificação de imagens CIFAR-10

As amostras mostram a diversidade dos objetos no conjunto de dados CIFAR-10, destacando o valor de um conjunto de dados variado para treinar modelos robustos de classificação de imagens.

Link to this sectionCitações e Agradecimentos#

Se usares o conjunto de dados CIFAR-10 no teu trabalho de pesquisa ou desenvolvimento, por favor cita o seguinte artigo:

Citação

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Gostaríamos de agradecer a Alex Krizhevsky por criar e manter o conjunto de dados CIFAR-10 como um recurso valioso para a comunidade de pesquisa de aprendizado de máquina e visão computacional. Para mais informações sobre o conjunto de dados CIFAR-10 e seu criador, visite o site do conjunto de dados CIFAR-10.

Link to this sectionFAQ#

Link to this sectionPara que é utilizado o conjunto de dados CIFAR-10 no aprendizado de máquina?#

O conjunto de dados CIFAR-10 é amplamente utilizado para treinar e avaliar modelos de classificação de imagens e reconhecimento de objetos. Ele contém 60.000 imagens coloridas de 32x32 distribuídas uniformemente em 10 classes, e seu tamanho reduzido e classes equilibradas tornam-no um marco rápido e confiável para algoritmos como Redes Neurais Convolucionais (CNNs) e Máquinas de Vetores de Suporte (SVMs).

Link to this sectionComo posso treinar um modelo Ultralytics YOLO no conjunto de dados CIFAR-10?#

Para treinar um modelo Ultralytics YOLO no CIFAR-10, use os trechos de código abaixo. O conjunto de dados é baixado automaticamente no primeiro uso. Para uma lista completa de argumentos, veja a página de Treinamento do modelo.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Link to this sectionQuantas classes o conjunto de dados CIFAR-10 possui?#

O CIFAR-10 possui 10 classes — avião, automóvel, pássaro, gato, veado, cão, sapo, cavalo, navio e caminhão — com exatamente 6.000 imagens cada, totalizando 60.000 imagens. As classes são mutuamente exclusivas e perfeitamente equilibradas, sem sobreposição entre as categorias.

Link to this sectionComo o conjunto de dados CIFAR-10 é dividido em conjuntos de treino e teste?#

O CIFAR-10 vem com uma divisão predefinida de 50.000 imagens de treino e 10.000 imagens de teste, com exatamente 5.000 imagens de treino e 1.000 de teste por classe. Ao contrário dos conjuntos de dados de classificação baseados em pastas que o Ultralytics divide automaticamente, a partição oficial do CIFAR-10 é usada como está, e o conjunto de teste serve como a divisão de validação durante o treinamento por padrão.

Link to this sectionPosso usar a Ultralytics Platform para treinar modelos no conjunto de dados CIFAR-10?#

Sim. A Ultralytics Platform permite gerenciar conjuntos de dados, treinar modelos de classificação de imagens e implantá-los sem a necessidade de codificação extensa. É uma maneira conveniente de executar experimentos com o CIFAR-10 na nuvem, e você pode explorar mais opções em nossa visão geral de conjuntos de dados de classificação.

Contribuidores

GLglenn-jocher¹³ RIRizwanMunawar² JKjk4e² RAraimbekovm¹ MAMatthewNoyce¹ AMambitious-octopus¹

Criado 12 de nov. de 2023Atualizado anteontem