Conjunto de dados Caltech-256
O conjunto de dados Caltech-256 é uma vasta coleção de imagens usada para tarefas de classificação de objetos. Contém cerca de 30.000 imagens divididas em 257 categorias (256 categorias de objetos e 1 categoria de fundo). As imagens são cuidadosamente selecionadas e anotadas para fornecer uma referência desafiadora e diversificada para algoritmos de reconhecimento de objetos.
O conjunto de dados Caltech-256, como fornecido, não vem com divisões de treino/validação pré-definidas. No entanto, quando utilizas os comandos de treino fornecidos nos exemplos de utilização abaixo, a estrutura Ultralytics dividirá automaticamente o conjunto de dados para ti. A divisão padrão utilizada é 80% para o conjunto de treino e 20% para o conjunto de validação.
Principais recursos
- O conjunto de dados Caltech-256 compreende cerca de 30.000 imagens a cores divididas em 257 categorias.
- Cada categoria contém um mínimo de 80 imagens.
- As categorias abrangem uma grande variedade de objetos do mundo real, incluindo animais, veículos, artigos domésticos e pessoas.
- As imagens são de tamanhos e resoluções variáveis.
- O Caltech-256 é amplamente utilizado para treino e teste no campo da aprendizagem automática, particularmente para tarefas de reconhecimento de objetos.
Estrutura do Dataset
Tal como o Caltech-101, o conjunto de dados Caltech-256 não tem uma divisão formal entre conjuntos de treino e teste. Os utilizadores criam tipicamente as suas próprias divisões de acordo com as suas necessidades específicas. Uma prática comum é usar um subconjunto aleatório de imagens para treino e as imagens restantes para teste.
Aplicações
O conjunto de dados Caltech-256 é extensivamente usado para treinar e avaliar modelos de deep learning em tarefas de reconhecimento de objetos, tais como Redes Neuronais Convolucionais (CNNs), Máquinas de Vetores de Suporte (SVMs) e vários outros algoritmos de aprendizagem automática. O seu conjunto diversificado de categorias e imagens de alta qualidade tornam-no um conjunto de dados inestimável para investigação e desenvolvimento no campo da aprendizagem automática e visão computacional.
Utilização
Para treinar um modelo YOLO no conjunto de dados Caltech-256 durante 100 épocas, podes usar os seguintes fragmentos de código. Para uma lista abrangente de argumentos disponíveis, consulta a página de Treino do modelo.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)Amostra de Imagens e Anotações
O conjunto de dados Caltech-256 contém imagens a cores de alta qualidade de vários objetos, fornecendo um conjunto de dados abrangente para tarefas de reconhecimento de objetos. Aqui estão alguns exemplos de imagens do conjunto de dados (créditos):

O exemplo demonstra a diversidade e a complexidade dos objetos no conjunto de dados Caltech-256, enfatizando a importância de um conjunto de dados variado para treinar modelos de reconhecimento de objetos robustos.
Citações e Agradecimentos
Se utilizares o conjunto de dados Caltech-256 no teu trabalho de investigação ou desenvolvimento, por favor cita o seguinte artigo:
@article{griffin2007caltech,
title={Caltech-256 object category dataset},
author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
year={2007}
}Gostaríamos de agradecer a Gregory Griffin, Alex Holub e Pietro Perona por criarem e manterem o conjunto de dados Caltech-256 como um recurso valioso para a comunidade de investigação de aprendizagem automática e visão computacional. Para mais informações sobre o conjunto de dados Caltech-256 e os seus criadores, visita o site do conjunto de dados Caltech-256.
FAQ
O que é o conjunto de dados Caltech-256 e porque é importante para a aprendizagem automática?
O conjunto de dados Caltech-256 é um grande conjunto de dados de imagens usado principalmente para tarefas de classificação de objetos em aprendizagem automática e visão computacional. Consiste em cerca de 30.000 imagens a cores divididas em 257 categorias, cobrindo uma vasta gama de objetos do mundo real. As imagens diversificadas e de alta qualidade do conjunto de dados tornam-no uma excelente referência para avaliar algoritmos de reconhecimento de objetos, o que é crucial para desenvolver modelos de aprendizagem automática robustos.
Como posso treinar um modelo YOLO no conjunto de dados Caltech-256 usando Python ou CLI?
Para treinar um modelo YOLO no conjunto de dados Caltech-256 durante 100 épocas, podes usar os seguintes fragmentos de código. Consulta a página de Treino do modelo para opções adicionais.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)Quais são os casos de uso mais comuns para o conjunto de dados Caltech-256?
O conjunto de dados Caltech-256 é amplamente usado para várias tarefas de reconhecimento de objetos, tais como:
- Treinar Redes Neuronais Convolucionais (CNNs)
- Avaliar o desempenho de Máquinas de Vetores de Suporte (SVMs)
- Avaliar novos algoritmos de deep learning
- Desenvolver modelos de detecção de objetos usando estruturas como o Ultralytics YOLO
A sua diversidade e anotações abrangentes tornam-no ideal para investigação e desenvolvimento em aprendizagem automática e visão computacional.
Como é que o conjunto de dados Caltech-256 está estruturado e dividido para treino e teste?
O conjunto de dados Caltech-256 não vem com uma divisão predefinida para treino e teste. Os utilizadores criam tipicamente as suas próprias divisões de acordo com as suas necessidades específicas. Uma abordagem comum é selecionar aleatoriamente um subconjunto de imagens para treino e usar as imagens restantes para teste. Esta flexibilidade permite aos utilizadores adaptar o conjunto de dados aos requisitos específicos do seu projeto e às configurações experimentais.
Porque devo usar o Ultralytics YOLO para treinar modelos no conjunto de dados Caltech-256?
Os modelos Ultralytics YOLO oferecem várias vantagens para treino no conjunto de dados Caltech-256:
- Alta Precisão: Os modelos YOLO são conhecidos pelo seu desempenho de ponta em tarefas de detecção de objetos.
- Velocidade: Fornecem capacidades de inferência em tempo real, tornando-os adequados para aplicações que requerem previsões rápidas.
- Facilidade de Uso: Com a Ultralytics Platform, podes treinar, validar e implementar modelos sem necessidade de muita codificação.
- Modelos Pré-treinados: Começar com modelos pré-treinados, como
yolo26n-cls.pt, pode reduzir significativamente o tempo de treino e melhorar a precisão do modelo.
Para mais detalhes, explora o nosso guia de treino abrangente e aprende sobre classificação de imagens com o Ultralytics YOLO.