Link to this sectionPreparação de dados#
A preparação de dados é a base para modelos de computer vision de sucesso. A Ultralytics Platform fornece ferramentas abrangentes para gerir os teus dados de treino, desde o carregamento até à anotação e análise.
Watch: Get Started with Ultralytics Platform - Data
Link to this sectionVisão geral#
A secção de Dados da Ultralytics Platform ajuda-te a:
- Carregar imagens, vídeos e ficheiros de conjuntos de dados (ZIP, TAR incluindo
.tar.gz/.tgz, NDJSON) - Anotar com ferramentas de desenho manual e rotulagem inteligente alimentada por SAM — escolhe entre o SAM 2.1 ou o novo SAM 3
- Analisar os teus dados com estatísticas e visualizações
- Exportar no formato NDJSON para treino local

Link to this sectionFluxo de trabalho#
graph LR
A[Upload]:::start --> B[Annotate]:::proc
B --> C[Analyze]:::proc
C --> D[Train]:::out
classDef start fill:#4CAF50,color:#fff
classDef proc fill:#2196F3,color:#fff
classDef out fill:#9C27B0,color:#fff| Etapa | Descrição |
|---|---|
| Upload | Importa imagens, vídeos ou arquivos com processamento automático |
| Anotar | Rotula dados com ferramentas manuais para todos os 6 tipos de tarefas, ou usa a anotação SAM para detecção, segmentação, semântica e OBB |
| Analisar | Vê distribuições de classes, mapas de calor espaciais e estatísticas de dimensão |
| Exportar | Descarrega no formato NDJSON para utilização offline |
Link to this sectionTarefas Suportadas#
A Ultralytics Platform suporta todos os 6 tipos de tarefas YOLO:
| Tarefa | Descrição | Ferramenta de Anotação |
|---|---|---|
| Detect | Detecção de objetos com bounding boxes | Ferramenta de retângulo |
| Segment | Segmentação de instâncias com máscaras de pixel | Ferramenta de polígono |
| Semantic | Segmentação semântica com regiões de pixel por classe | Ferramenta de polígono |
| Pose | Estimativa de pontos-chave com modelos de esqueleto integrados e personalizados | Ferramenta de pontos-chave |
| OBB | Oriented bounding boxes para objetos rodados | Ferramenta de caixa orientada |
| Classify | Classificação ao nível da imagem | Seletor de classe |
O tipo de tarefa é definido ao criar um conjunto de dados e determina quais as ferramentas de anotação disponíveis. Podes alterá-lo mais tarde a partir do seletor de tarefas no cabeçalho do conjunto de dados, mas as anotações incompatíveis não serão apresentadas após a mudança.
Link to this sectionPrincipais recursos#
Link to this sectionArmazenamento Inteligente#
A Ultralytics Platform utiliza Content-Addressable Storage (CAS) para uma gestão de dados eficiente:
- Deduplicação: Imagens idênticas armazenadas apenas uma vez via hashing XXH3-128
- Integridade: O endereçamento baseado em hash garante a integridade dos dados
- Eficiência: Armazenamento otimizado e processamento rápido
Link to this sectionURIs de Conjuntos de Dados#
Referencia conjuntos de dados usando o formato de URI ul:// (vê Using Platform Datasets):
yolo train data=ul://username/datasets/my-datasetIsto permite treinar nos conjuntos de dados da plataforma a partir de qualquer máquina com a tua API key configurada.
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)Link to this sectionVersionamento de Conjuntos de Dados#
Cria snapshots imutáveis em NDJSON do teu conjunto de dados para treino reprodutível. Cada versão captura contagens de imagens, contagens de classes e contagens de anotações no momento da criação. Vê o Versions Tab para detalhes.
Link to this sectionAbas do Dataset#
As páginas dos conjuntos de dados podem mostrar até seis separadores, dependendo do estado do conjunto de dados e das tuas permissões:
| Separador | Descrição |
|---|---|
| Imagens | Explora imagens em vista de grelha, compacta ou de tabela com sobreposições de anotações |
| Classes | Vê e edita nomes de classes, cores e contagens de etiquetas por classe |
| Gráficos | Estatísticas automáticas: distribuição de divisões, contagens de classes, mapas de calor |
| Modelos | Modelos treinados neste conjunto de dados com métricas e estado |
| Versões | Cria e descarrega snapshots imutáveis em NDJSON para treino reprodutível |
| Erros | Imagens que falharam o processamento com detalhes de erro e orientação de correção |
Classes e Charts aparecem quando o conjunto de dados tem imagens. Errors aparece apenas quando existem falhas de processamento. Versions aparece para os proprietários, ou para não proprietários quando as versões já existem.
Link to this sectionClustering#
Explora o teu conjunto de dados como um gráfico de dispersão 2D interativo onde imagens visualmente semelhantes ficam próximas umas das outras — útil para identificar clusters, duplicados e outliers, e para inspecionar como as divisões ou classes estão distribuídas pelos teus dados. Seleciona uma região do gráfico com o laço para filtrar a galeria para essas imagens. Vê Clustering para detalhes.
Link to this sectionEstatísticas e Visualização#
O separador Charts fornece análise automática incluindo:
- Distribuição de Divisão: Gráfico de rosca das contagens de imagens de treino/validação/teste
- Top Classes: Gráfico de rosca das classes de anotação mais frequentes
- Dimensões da Imagem: Histograma da distribuição de largura e altura da imagem (em pixéis)
- Pontos por Instância: Distribuição da contagem de vértices de polígono ou pontos-chave (conjuntos de dados de segmento/pose)
- Localizações de Anotação: Mapa de calor 2D das posições centrais das bounding boxes
- Dimensões da Imagem 2D: Mapa de calor 2D da largura vs altura com linhas guia de proporção
Link to this sectionLinks Rápidos#
- Datasets: Carrega, gere e exporta os teus dados de treino
- Annotation: Rotula dados com ferramentas manuais e assistidas por IA
- Cloud Training: Treina modelos nos teus conjuntos de dados anotados
- Dataset URI: Usa URIs
ul://para treinar a partir de qualquer lugar
Link to this sectionFAQ#
Link to this sectionQue formatos de ficheiro são suportados para carregamento?#
A Ultralytics Platform suporta:
Imagens: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (máx. 50MB cada)
Vídeos: MP4, WebM, MOV, MKV, M4V (máximo de 1GB, quadros extraídos a 1 FPS, máximo de 100 quadros)
Ficheiros de conjunto de dados: Arquivos ZIP ou TAR incluindo .tar.gz e .tgz (máx. 10GB no Free, 20GB no Pro, 50GB no Enterprise) contendo imagens com etiquetas em formato YOLO opcionais, além de exportações NDJSON
Link to this sectionQual é o tamanho máximo do conjunto de dados?#
Os limites de armazenamento dependem do teu plano:
| Plano | Limite de Armazenamento |
|---|---|
| Gratuito | 100 GB |
| Pro | 500 GB |
| Enterprise | Ilimitado |
Limites de ficheiros individuais: Imagens 50MB, Vídeos 1GB, conjuntos de dados 10GB no Free / 20GB no Pro / 50GB no Enterprise
Link to this sectionPosso usar os meus conjuntos de dados da Plataforma para treino local?#
Sim! Usa o formato de URI do conjunto de dados para treinar localmente:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100Ou exporta o teu conjunto de dados no formato NDJSON para um treino totalmente offline.