Preparação de Dados
A preparação de dados é a base para modelos de visão computacional bem-sucedidos. A Ultralytics Platform oferece ferramentas abrangentes para gerir os seus dados de treino, desde o carregamento e anotação até à análise.
Visão geral
A secção de Dados da Ultralytics Platform ajuda-o a:
- Carregue imagens, vídeos e arquivos (ZIP, TAR, GZ)
- Anote com ferramentas de desenho manuais e etiquetagem inteligente SAM
- Analisar os seus dados com estatísticas e visualizações
- Exportar no formato NDJSON para formação local

Fluxo de Trabalho
graph LR
A[Upload] --> B[Annotate]
B --> C[Analyze]
C --> D[Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| Etapa | Descrição |
|---|---|
| Carregar | Importe imagens, vídeos ou arquivos com processamento automático |
| Anotar | Rotule dados com caixas delimitadoras, polígonos, pontos-chave ou classificações |
| Analisar | Visualize distribuições de classes, mapas de calor espaciais e estatísticas de dimensão |
| Exportar | Descarregar no formato NDJSON para utilização offline |
Tarefas Suportadas
A Plataforma Ultralytics suporta todos os 5 tipos de tarefas YOLO:
| Tarefa | Descrição | Ferramenta de Anotação |
|---|---|---|
| Detectar | Detecção de objetos com caixas delimitadoras | Ferramenta de Retângulo |
| Segmentar | Segmentação de instâncias com máscaras de pixel | Ferramenta de Polígono |
| Pose | Estimativa de pontos-chave (formato COCO de 17 pontos) | Ferramenta de Pontos-chave |
| OBB | Caixas delimitadoras orientadas para objetos rotacionados | Ferramenta de Caixa Orientada |
| Classificar | Classificação ao nível da imagem | Seletor de Classe |
Seleção do tipo de tarefa
O tipo de tarefa é definido ao criar um conjunto de dados e determina quais ferramentas de anotação estão disponíveis. Pode alterá-lo posteriormente nas definições do conjunto de dados, mas as anotações incompatíveis não serão exibidas após a alteração.
Principais Características
Armazenamento Inteligente
Ultralytics utiliza armazenamento endereçável por conteúdo (CAS) para uma gestão eficiente dos dados:
- Desduplicação: imagens idênticas armazenadas apenas uma vez através do hash XXH3-128
- Integridade: o endereçamento baseado em hash garante a integridade dos dados
- Eficiência: Armazenamento otimizado e processamento rápido
URIs de Conjuntos de Dados
Conjuntos de dados de referência utilizando o ul:// Formato URI (ver Utilizar Conjuntos de Dados da Plataforma):
yolo train data=ul://username/datasets/my-dataset
Isso permite o treinamento nos conjuntos de dados da plataforma a partir de qualquer máquina com a sua chave API configurada.
Utilizar dados da plataforma a partir do Python
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
Guias do conjunto de dados
Cada página de conjunto de dados apresenta cinco separadores:
| Tab | Descrição |
|---|---|
| Imagens | Navegue pelas imagens em visualização em grelha, compacta ou tabela com sobreposições de anotações |
| Aulas | Visualizar e editar nomes de classes, cores e contagens de rótulos por classe |
| Gráficos | Estatísticas automáticas: distribuição dividida, contagem de classes, mapas de calor |
| Modelos | Modelos treinados neste conjunto de dados com métricas e status |
| Erros | Imagens cujo processamento falhou, com detalhes do erro e orientações para correção |
Estatísticas e Visualização
O Charts A guia fornece análise automática, incluindo:
- Distribuição dividida: gráfico de rosca com contagem de imagens de treino/validação/teste
- Classes principais: gráfico circular das classes de anotação mais frequentes
- Larguras das imagens: Histograma da distribuição da largura das imagens
- Alturas da imagem: Histograma da distribuição da altura da imagem
- Pontos por instância: Distribuição do número de vértices poligonais ou pontos-chave (conjuntos de dadossegment)
- Localizações das anotações: mapa de calor 2D das posições centrais das caixas delimitadoras
- Dimensões da imagem: mapa de calor 2D de largura vs. altura com linhas-guia de proporção
Links Rápidos
- Conjuntos de Dados: Carregue e gerencie seus dados de treinamento
- Anotação: Rotulagem de dados com ferramentas manuais e assistidas por IA
FAQ
Que formatos de ficheiro são suportados para carregamento?
A Ultralytics Platform suporta:
Imagens: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (máximo de 50 MB cada)
Vídeos: MP4, WebM, MOV, AVI, MKV, M4V (máximo de 1 GB, fotogramas extraídos a 1 FPS, máximo de 100 fotogramas)
Arquivos: ZIP, TAR, TAR.GZ, TGZ, GZ (máximo de 10 GB) contendo imagens com rótulos opcionais YOLO
Qual é o tamanho máximo do conjunto de dados?
Os limites de armazenamento dependem do seu plano:
| Plano | Limite de Armazenamento |
|---|---|
| Gratuito | 100 GB |
| Pro | 500 GB |
| Empresarial | Personalizado |
Limites individuais de ficheiros: Imagens 50 MB, Vídeos 1 GB, Arquivos 10 GB
Posso usar meus conjuntos de dados da Plataforma para treinamento local?
Sim! Use o formato URI do conjunto de dados para treinar localmente:
export ULTRALYTICS_API_KEY="your_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os
os.environ["ULTRALYTICS_API_KEY"] = "your_key"
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
Ou exporte o seu conjunto de dados no formato NDJSON para um treino totalmente offline.