Conjuntos de dados
Os conjuntos de dados Ultralytics oferecem uma solução simplificada para gerir os seus dados de treino. Depois de carregados, os conjuntos de dados podem ser usados imediatamente para o treino de modelos, com processamento automático e geração de estatísticas.
Assista: Carregar conjuntos de dados para Ultralytics
Fazer Upload do Conjunto de Dados
Ultralytics aceita vários formatos de upload para maior flexibilidade:
| Formato | Descrição |
|---|---|
| Imagens | Ficheiros de imagem individuais (JPG, PNG, WebP, TIFF, RAW) |
| Arquivo ZIP | Pasta compactada com imagens e etiquetas opcionais |
| Vídeo | Arquivos MP4, AVI - fotogramas extraídos a ~1 fps |
| YOLO | Estrutura YOLO padrão com rótulos |
Extração de quadros de vídeo
Ao carregar vídeos, os fotogramas são extraídos automaticamente:
- Taxa de fotogramas: ~1 fotograma por segundo
- Número máximo de fotogramas: 100 fotogramas por vídeo
- Processamento: extração no lado do cliente antes do upload
- Formato: Quadros convertidos para o formato de imagem padrão
Isto é ideal para criar conjuntos de dados de treino a partir de imagens de vigilância, gravações de ação ou qualquer fonte de vídeo.
Preparando o seu conjunto de dados
Para conjuntos de dados rotulados, use o YOLO padrão:
my-dataset/
├── images/
│ ├── train/
│ │ ├── img001.jpg
│ │ └── img002.jpg
│ └── val/
│ ├── img003.jpg
│ └── img004.jpg
├── labels/
│ ├── train/
│ │ ├── img001.txt
│ │ └── img002.txt
│ └── val/
│ ├── img003.txt
│ └── img004.txt
└── data.yaml
O ficheiro YAML define a configuração do seu conjunto de dados:
# data.yaml
path: .
train: images/train
val: images/val
names:
0: person
1: car
2: dog
Processo de upload
- Navegue até Conjuntos de dados na barra lateral
- Clique em Carregar conjunto de dados ou arraste os ficheiros para a zona de carregamento
- Selecione o tipo de tarefa (detect, segment, pose, OBB, classify)
- Adicione um nome e uma descrição opcional
- Clique em Carregar
Após o upload, a Plataforma processa os seus dados:
- Normalização: imagens grandes redimensionadas (máximo 4096 px)
- Miniaturas: pré-visualizações de 256 px geradas
- Análise de rótulos: rótulos YOLO extraídos
- Estatísticas: Distribuições de classes calculadas
Validar antes de carregar
Pode validar o seu conjunto de dados localmente antes de fazer o upload:
from ultralytics.hub import check_dataset
check_dataset("path/to/dataset.zip", task="detect")
Navegar pelas imagens
Visualize as imagens do seu conjunto de dados em vários layouts:
| Visualizar | Descrição |
|---|---|
| Grelha | Grelha de miniaturas com sobreposições de anotações |
| Compacto | Miniaturas menores para uma visualização rápida |
| Tabela | Lista com nome do ficheiro, dimensões e contagem de etiquetas |
Visualizador em ecrã inteiro
Clique em qualquer imagem para abrir o visualizador em ecrã inteiro com:
- Navegação: Teclas de seta ou clique para navegar
- Metadados: Nome do ficheiro, dimensões, divisão, contagem de etiquetas
- Anotações: Alternar visibilidade das anotações
- Discriminação por classe: contagem de rótulos por classe
Filtrar por divisão
Filtrar imagens pela divisão do conjunto de dados:
| Divisão | Propósito |
|---|---|
| Treinar | Usado para treinar modelos |
| Validar | Utilizado para validação durante o treino |
| Teste | Utilizado para avaliação final |
| Desconhecido | Sem divisão atribuída |
Estatísticas do conjunto de dados
A guia Estatísticas fornece uma análise automática do seu conjunto de dados:
Distribuição de classes
Gráfico de barras mostrando o número de anotações por classe:
Mapa de calor de localização
Visualização de onde as anotações aparecem nas imagens:
Análise dimensional
Gráfico de dispersão das dimensões da imagem (largura vs. altura):
Cache de estatísticas
As estatísticas são armazenadas em cache por 5 minutos. As alterações nas anotações serão refletidas após o cache expirar.
Exportar conjunto de dados
Exporte o seu conjunto de dados no formato NDJSON para utilização offline:
- Abra o menu de ações do conjunto de dados
- Clique em Exportar
- Descarregue o ficheiro NDJSON
O formato NDJSON armazena um objeto JSON por linha:
{"filename": "img001.jpg", "split": "train", "labels": [...]}
{"filename": "img002.jpg", "split": "train", "labels": [...]}
Consulte a documentação do formatoUltralytics para obter as especificações completas.
URI do conjunto de dados
Conjuntos de dados da plataforma de referência utilizando o ul:// Formato URI:
ul://username/datasets/dataset-slug
Use este URI para treinar modelos em qualquer lugar:
export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo11n.pt data=ul://username/datasets/my-dataset epochs=100
Treine em qualquer lugar com os dados da plataforma
O ul:// O URI funciona em qualquer ambiente:
- Máquina local: Treine no seu hardware, os dados são descarregados automaticamente
- Google : Aceda aos seus conjuntos de dados da Plataforma em cadernos
- Servidores remotos: treine em máquinas virtuais na nuvem com acesso total ao conjunto de dados
Definições de visibilidade
Controle quem pode ver o seu conjunto de dados:
| Configurando | Descrição |
|---|---|
| Privado | Só você pode aceder |
| Público | Qualquer pessoa pode visualizar na página Explorar |
Para alterar a visibilidade:
- Abrir menu de ações do conjunto de dados
- Clique em Editar
- Alternar configuração de visibilidade
- Clique em Guardar
Editar Conjunto de Dados
Atualizar nome, descrição ou visibilidade do conjunto de dados:
- Abrir menu de ações do conjunto de dados
- Clique em Editar
- Fazer alterações
- Clique em Guardar
Excluir Conjunto de Dados
Elimine um conjunto de dados que já não precisa:
- Abrir menu de ações do conjunto de dados
- Clique em Excluir
- Confirmar eliminação
Lixeira e Restaurar
Os conjuntos de dados eliminados são movidos para a Lixeira por 30 dias. Pode restaurá-los a partir da página Lixeira em Definições.
Treinar no conjunto de dados
Comece a treinar diretamente a partir do seu conjunto de dados:
- Clique em Modelo de comboio na página do conjunto de dados
- Selecione um projeto ou crie um novo
- Configurar os parâmetros de treino
- Comece a treinar
Consulte Formação em nuvem para obter mais detalhes.
FAQ
O que acontece aos meus dados após o upload?
Os seus dados são processados e armazenados na região selecionada (EUA, UE ou AP). As imagens são:
- Validado quanto ao formato e tamanho
- Normalizado se maior que 4096px (preservando a proporção da imagem)
- Armazenado usando armazenamento endereçável por conteúdo (CAS) com hash SHA-256
- Miniaturas geradas a 256 px para uma navegação rápida
- Nunca partilhado sem a sua permissão
Como funciona o armazenamento?
Ultralytics utiliza armazenamento endereçável por conteúdo (CAS) para um armazenamento eficiente:
- Desduplicação: imagens idênticas carregadas por diferentes utilizadores são armazenadas apenas uma vez.
- Integridade: o hash SHA-256 garante a integridade dos dados
- Eficiência: Reduz os custos de armazenamento e acelera o processamento
- Regional: os dados permanecem na região selecionada (EUA, UE ou AP)
Posso adicionar imagens a um conjunto de dados existente?
Sim, utilize o botão Adicionar imagens na página do conjunto de dados para carregar imagens adicionais. Novas estatísticas serão calculadas automaticamente.
Como posso mover imagens entre conjuntos de dados?
Use o recurso de seleção em massa:
- Selecione imagens na galeria
- Clique em Mover ou Copiar
- Selecione o conjunto de dados de destino
Que formatos de etiquetas são suportados?
Ultralytics suporta rótulos YOLO :
- Detectar:
class_id x_center y_center width height - Segmentar:
class_id x1 y1 x2 y2 ...(pontos poligonais) - Pose:
class_id x_center y_center width height kp1_x kp1_y kp1_v ... - OBB:
class_id x1 y1 x2 y2 x3 y3 x4 y4
Todas as coordenadas são normalizadas (intervalo 0-1).