Salta para o conteúdo

Conjunto de dados Caltech-256

O conjunto de dados Caltech-256 é uma extensa coleção de imagens utilizadas para tarefas de classificação de objectos. Contém cerca de 30.000 imagens divididas em 257 categorias (256 categorias de objectos e 1 categoria de fundo). As imagens são cuidadosamente seleccionadas e anotadas para fornecer uma referência desafiadora e diversificada para algoritmos de reconhecimento de objectos.



Observa: Como treinar o modelo de classificação de imagens utilizando o conjunto de dados Caltech-256 com Ultralytics HUB

Características principais

  • O conjunto de dados Caltech-256 inclui cerca de 30.000 imagens a cores divididas em 257 categorias.
  • Cada categoria contém um mínimo de 80 imagens.
  • As categorias abrangem uma grande variedade de objectos do mundo real, incluindo animais, veículos, artigos domésticos e pessoas.
  • As imagens são de tamanhos e resoluções variáveis.
  • O Caltech-256 é amplamente utilizado para treino e teste no domínio da aprendizagem automática, em particular para tarefas de reconhecimento de objectos.

Estrutura do conjunto de dados

Tal como o Caltech-101, o conjunto de dados Caltech-256 não tem uma divisão formal entre os conjuntos de treino e de teste. Os utilizadores criam normalmente as suas próprias divisões de acordo com as suas necessidades específicas. Uma prática comum é utilizar um subconjunto aleatório de imagens para treino e as restantes imagens para teste.

Aplicações

O conjunto de dados Caltech-256 é amplamente utilizado para treinar e avaliar modelos de aprendizagem profunda em tarefas de reconhecimento de objectos, tais como Redes Neuronais Convolucionais (CNNs), Máquinas de Vectores de Suporte (SVMs) e vários outros algoritmos de aprendizagem automática. O seu conjunto diversificado de categorias e imagens de alta qualidade tornam-no um conjunto de dados inestimável para a investigação e o desenvolvimento no domínio da aprendizagem automática e da visão computacional.

Utilização

Para treinar um modelo YOLO no conjunto de dados Caltech-256 para 100 épocas, podes usar os seguintes trechos de código. Para obter uma lista abrangente dos argumentos disponíveis, consulta a página Treinamento do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech256 model=yolov8n-cls.pt epochs=100 imgsz=416

Exemplos de imagens e anotações

O conjunto de dados Caltech-256 contém imagens a cores de alta qualidade de vários objectos, fornecendo um conjunto de dados abrangente para tarefas de reconhecimento de objectos. Eis alguns exemplos de imagens do conjunto de dados(crédito):

Imagem de amostra do conjunto de dados

O exemplo mostra a diversidade e complexidade dos objectos no conjunto de dados Caltech-256, realçando a importância de um conjunto de dados variado para treinar modelos robustos de reconhecimento de objectos.

Citações e agradecimentos

Se utilizares o conjunto de dados Caltech-256 no teu trabalho de investigação ou desenvolvimento, cita o seguinte documento:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Gostaríamos de agradecer a Gregory Griffin, Alex Holub e Pietro Perona pela criação e manutenção do conjunto de dados Caltech-256 como um recurso valioso para a comunidade de investigação em aprendizagem automática e visão computacional. Para mais informações sobre o

O conjunto de dados Caltech-256 e os seus criadores, visita o sítio Web do conjunto de dados Caltech-256.

FAQ

O que é o conjunto de dados Caltech-256 e porque é que é importante para a aprendizagem automática?

O conjunto de dados Caltech-256 é um grande conjunto de dados de imagens utilizado principalmente para tarefas de classificação de objectos em aprendizagem automática e visão computacional. Consiste em cerca de 30.000 imagens a cores divididas em 257 categorias, abrangendo uma vasta gama de objectos do mundo real. As imagens diversificadas e de alta qualidade do conjunto de dados fazem dele uma excelente referência para avaliar algoritmos de reconhecimento de objectos, o que é crucial para desenvolver modelos robustos de aprendizagem automática.

Como posso treinar um modelo YOLO no conjunto de dados Caltech-256 utilizando Python ou CLI?

Para treinar um modelo YOLO no conjunto de dados Caltech-256 para 100 épocas, podes usar os seguintes snippets de código. Consulte a página Treinamento do modelo para obter opções adicionais.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech256 model=yolov8n-cls.pt epochs=100 imgsz=416

Quais são os casos de utilização mais comuns para o conjunto de dados Caltech-256?

O conjunto de dados Caltech-256 é amplamente utilizado para várias tarefas de reconhecimento de objectos, tais como:

  • Treinar redes neurais convolucionais (CNNs)
  • Avaliar o desempenho das máquinas de vectores de suporte (SVM)
  • Aferição de novos algoritmos de aprendizagem profunda
  • Desenvolver modelos de deteção de objectos utilizando estruturas como Ultralytics YOLO

A sua diversidade e anotações exaustivas tornam-no ideal para a investigação e desenvolvimento em aprendizagem automática e visão computacional.

Como é que o conjunto de dados Caltech-256 está estruturado e dividido para treino e teste?

O conjunto de dados Caltech-256 não vem com uma divisão predefinida para treino e teste. Normalmente, os utilizadores criam as suas próprias divisões de acordo com as suas necessidades específicas. Uma abordagem comum é selecionar aleatoriamente um subconjunto de imagens para treino e utilizar as restantes imagens para teste. Esta flexibilidade permite aos utilizadores adaptarem o conjunto de dados aos requisitos específicos do seu projeto e às configurações experimentais.

Por que razão devo utilizar Ultralytics YOLO para treinar modelos no conjunto de dados Caltech-256?

Ultralytics YOLO oferecem várias vantagens para o treino no conjunto de dados Caltech-256:

  • Elevada precisão: os modelos YOLO são conhecidos pelo seu desempenho topo de gama em tarefas de deteção de objectos.
  • Rapidez: Oferecem capacidades de inferência em tempo real, o que os torna adequados para aplicações que exigem previsões rápidas.
  • Facilidade de utilização: Com o Ultralytics HUB, os utilizadores podem treinar, validar e implementar modelos sem uma codificação extensiva.
  • Modelos pré-treinados: A partir de modelos pré-treinados, como yolov8n-cls.ptpode reduzir significativamente o tempo de formação e melhorar a precisão do modelo.

Para mais informações, consulta o nosso guia de formação completo.



Criado em 2023-11-12, Atualizado em 2024-07-18
Autores: RizwanMunawar (1), glenn-jocher (6)

Comentários