Link to this sectionConjuntos de Dados#

Q: Como funciona o armazenamento?

A Ultralytics Platform utiliza Content-Addressable Storage (CAS) para um armazenamento eficiente: Deduplicação: Imagens idênticas enviadas por utilizadores diferentes são armazenadas apenas uma vez; Integridade: O hashing XXH3-128 garante a integridade dos dados; Eficiência: Reduz os custos de armazenamento e acelera o processamento; Regional: Os dados permanecem na região selecionada (US, EU ou AP)

Os conjuntos de dados da Ultralytics Platform oferecem uma solução otimizada para gerir os teus dados de treino. Após o carregamento, a plataforma processa automaticamente imagens, rótulos e estatísticas. Um conjunto de dados está pronto para treinar assim que o processamento termina e ele contém pelo menos uma imagem na divisão train, pelo menos uma imagem na divisão val ou test, pelo menos uma imagem rotulada e um total de pelo menos duas imagens.

Link to this sectionCarregar conjunto de dados#

A Ultralytics Platform aceita múltiplos formatos de carregamento para maior flexibilidade.

Já tens dados noutro local?

Se já tens datasets no Ultralytics HUB ou no Roboflow, utiliza as Integrations para os importares diretamente — sem necessidade de exportação ou novo upload manual. Dados no Google Cloud Storage, Amazon S3 ou Azure Blob Storage podem ser utilizados diretamente através do Cloud storage. Áreas de trabalho Enterprise podem utilizar o On Premise para indexar e treinar com dados locais sem enviar pixels para a Platform.

Link to this sectionFormatos Suportados#

Formato	Extensões	Notas	Tamanho máximo
JPEG	`.jpg`, `.jpeg`	Mais comum, recomendado	50 MB
PNG	`.png`	Suporta transparência	50 MB
WebP	`.webp`	Moderno, boa compressão	50 MB
BMP	`.bmp`	Sem compressão	50 MB
TIFF	`.tiff`, `.tif`	Alta qualidade	50 MB
HEIC	`.heic`	Fotos de iPhone	50 MB
AVIF	`.avif`	Formato de nova geração	50 MB
JP2	`.jp2`	JPEG 2000	50 MB
DNG	`.dng`	Raw de câmara	50 MB
MPO	`.mpo`	Objeto de múltiplas imagens	50 MB

Link to this sectionSuporte a Codec do Navegador#

A extensão do arquivo por si só não é suficiente: um vídeo ainda pode falhar se o seu container ou codec não for suportado pelo teu navegador.

Usa H.264 MP4

Vídeo H.264 num container MP4 tem o suporte mais amplo entre os principais navegadores e é a escolha mais segura. Se um vídeo não carregar, re-codifica-o com FFmpeg:

ffmpeg -i input.mov \
  -c:v libx264 -pix_fmt yuv420p \
  -c:a aac -movflags +faststart \
  output.mp4

Quais codecs de vídeo funcionam

Estes são os codecs que navegadores baseados em Chromium normalmente decodificam. O Safari e o Firefox podem diferir, por isso não consideres os valores Sim/Não abaixo como suporte universal de navegador:

Codec	Decodifica no Chrome	Notas
H.264 (AVC)	Sim	Recomendado — suporte mais amplo em navegadores
VP8, VP9, AV1	Sim	Livre de royalties; comum em WebM e MKV
HEVC (H.265)	Apenas hardware	Apenas em dispositivos com um decodificador HEVC
ProRes, MPEG-2, DivX/Xvid, MJPEG, …	Não	Re-codificar para H.264

Link to this sectionA preparar o teu conjunto de dados#

A plataforma suporta Ultralytics YOLO, COCO, Ultralytics NDJSON e carregamentos brutos (sem anotações):

Usa a estrutura de diretórios padrão do YOLO com um ficheiro data.yaml:

my-dataset/
├── images/
│   ├── train/
│   │   ├── img001.jpg
│   │   └── img002.jpg
│   └── val/
│       ├── img003.jpg
│       └── img004.jpg
├── labels/
│   ├── train/
│   │   ├── img001.txt
│   │   └── img002.txt
│   └── val/
│       ├── img003.txt
│       └── img004.txt
└── data.yaml

O ficheiro YAML define a configuração do teu conjunto de dados:

# data.yaml
path: .
train: images/train
val: images/val

names:
    0: person
    1: car
    2: dog

Carregamentos brutos

Raw: Carrega imagens sem anotações (sem rótulos). Útil quando planeias anotar diretamente na plataforma usando o editor de anotações.

Estrutura de diretórios plana

Também podes carregar imagens sem pastas de divisão explícitas. A plataforma respeita o destino de divisão ativo durante o carregamento e, para conjuntos de dados que não sejam de classificação, pode criar automaticamente uma divisão de validação a partir de parte do conjunto de treino quando não são fornecidas informações de divisão. Podes sempre reatribuir imagens mais tarde com a movimentação em massa para divisão ou redistribuição de divisão.

Deteção automática de formato

O formato é detetado automaticamente: conjuntos de dados com um data.yaml contendo chaves names, train ou val são tratados como YOLO. Conjuntos de dados com ficheiros JSON COCO (contendo matrizes images, annotations e categories) são tratados como COCO. Exportações .ndjson são importadas como Ultralytics NDJSON. Conjuntos de dados apenas com imagens e sem anotações são tratados como brutos.

Para detalhes de formatos específicos de tarefas, consulta as tarefas suportadas e a Visão geral dos conjuntos de dados.

Link to this sectionProcesso de carregamento#

Navega até Datasets na barra lateral
Clica em New Dataset ou arrasta os ficheiros para a zona de carregamento
Seleciona o tipo de tarefa (consulta tarefas suportadas)
Adiciona um nome e uma descrição opcional
Define a visibilidade (pública ou privada) e uma licença opcional (consulta licenças disponíveis)
Clica em Create & Upload (ou Create Dataset se estiveres a criar um conjunto de dados vazio)

Seletor de tarefas da caixa de diálogo de carregamento de conjuntos de dados da Ultralytics Platform

Após o carregamento, a plataforma processa os teus dados através de um pipeline de várias fases:

graph LR
    A[Upload]:::start --> B[Validate]:::proc
    B --> C[Normalize]:::proc
    C --> D[Thumbnail]:::proc
    D --> E[Parse Labels]:::proc
    E --> F[Statistics]:::out

    classDef start fill:#4CAF50,color:#fff
    classDef proc fill:#2196F3,color:#fff
    classDef out fill:#9C27B0,color:#fff

Validação: Verificações de formato e tamanho
Normalização: Imagens grandes redimensionadas (máx. 4096px, dimensão mínima 28px)
Miniaturas: Pré-visualizações WebP de 256px geradas
Análise de rótulos: Rótulos nos formatos YOLO e COCO extraídos
Estatísticas: Distribuições de classes e dimensões das imagens calculadas

Barra de progresso do carregamento de conjuntos de dados da Ultralytics Platform

Validar antes de carregar

Podes validar o teu conjunto de dados localmente antes de o carregares:

from ultralytics.data.utils import check_det_dataset

check_det_dataset("path/to/data.yaml")

Requisitos de tamanho de imagem

As imagens devem ter pelo menos 28px no seu lado mais curto. Imagens menores do que isto são rejeitadas durante o processamento. Imagens maiores do que 4096px no seu lado mais longo são redimensionadas automaticamente com a proporção preservada.

Link to this sectionNavegar pelas imagens#

Vê as imagens do teu conjunto de dados em múltiplos layouts.

Abre o painel de Clustering a partir da barra de ferramentas da galeria para explorar o teu conjunto de dados como um gráfico de dispersão 2D interativo.

Ver	Descrição
Grelha	Grelha de miniaturas com sobreposições de anotação (padrão)
Compacto	Miniaturas menores para leitura rápida
Tabela	Lista com miniatura, nome do ficheiro, dimensões, tamanho, divisão, classes e contagens de rótulos

Visualização em grelha da galeria de conjuntos de dados da Ultralytics Platform com anotações

Link to this sectionOrdenação e filtragem#

As imagens podem ser ordenadas e filtradas para uma navegação eficiente:

Ordenar	Descrição
Mais recentes / Mais antigas	Ordem de upload / criação
Nome A-Z / Z-A	Nome do arquivo alfabético
Altura ↑/↓	Altura da imagem em pixels
Largura ↑/↓	Largura da imagem em pixels
Tamanho ↑/↓	Tamanho do arquivo em disco
Anotações ↑/↓	Contagem de anotações por imagem

Datasets Grandes

Para datasets com mais de 100.000 imagens, as ordenações por nome / tamanho / largura / altura são desativadas para manter a galeria responsiva. As ordenações por mais recente, mais antigo e contagem de anotações permanecem disponíveis.

Encontrando Imagens Não Rotuladas

Usa o filtro Annotations definido como Unannotated para encontrar rapidamente imagens que ainda precisam de anotação. Isto é especialmente útil para grandes conjuntos de dados onde queres acompanhar o progresso da rotulagem.

Link to this sectionVisualizador em Tela Cheia#

Clique em qualquer imagem para abrir o visualizador em tela cheia com:

Navegação: Teclas de seta ou visualizações em miniatura para navegar
Metadados: Nome do arquivo, dimensões, selo de divisão, contagem de anotações
Anotações: Alternar a visibilidade da sobreposição de anotações
Detalhamento de Classe: Contagem de rótulos por classe com indicadores de cor
Editar: Entre no modo de anotação para adicionar ou modificar rótulos
Download: Baixe o arquivo da imagem original
Excluir: Exclua a imagem do dataset
Zoom: Cmd/Ctrl+Scroll, Cmd/Ctrl++ ou Cmd/Ctrl+= para aumentar o zoom, e Cmd/Ctrl+- para diminuir o zoom
Redefinir visualização: Cmd/Ctrl + 0 ou o botão de redefinir para ajustar a imagem ao visualizador
Pan: Mantém premida a tecla Space e arrasta para mover a tela quando estiveres com zoom.
Visualização de pixel: Alternar a renderização pixelada para inspeção detalhada

Visualizador em Tela Cheia de Datasets da Plataforma Ultralytics Com Painel de Metadados

Link to this sectionFiltrar por Divisão#

Filtrar imagens por sua divisão de dataset:

Divisão	Objetivo
Treinar	Usado para treinamento de modelo
Val	Usado para validação durante o treinamento
Teste	Usado para avaliação final

Link to this sectionClustering#

O painel Clustering projeta seu dataset em um gráfico de dispersão 2D interativo onde imagens visualmente semelhantes ficam próximas umas das outras. Use-o para revelar clusters, encontrar duplicatas e outliers, e inspecionar como as divisões ou classes estão distribuídas em seus dados — sem sair da galeria. Abra-o a partir do ícone de gráfico de dispersão na barra de ferramentas da galeria em qualquer página de dataset.

Estado Vazio de Clustering de Datasets da Plataforma Ultralytics

Link to this sectionExecutando Análise#

Inicie uma análise:

Abra um dataset e clique no ícone de gráfico de dispersão na barra de ferramentas da galeria
Clica em Analyze Dataset
Aguarde a barra de progresso terminar — os resultados aparecem no mesmo painel

A análise é executada em segundo plano e pode levar alguns minutos, dependendo do tamanho do seu dataset. Você pode fechar o painel ou sair da página e voltar mais tarde.

Link to this sectionVisualização#

Assim que a análise é concluída, o painel mostra um gráfico de dispersão 2D de todas as imagens analisadas. Os filtros da galeria (divisão, classe, rotulado/não rotulado) escurecem os pontos fora do filtro para que você possa focar no subconjunto que lhe interessa.

Gráfico de Dispersão de Clustering de Datasets da Plataforma Ultralytics

Link to this sectionColorir Por#

Altera a forma como os pontos de dados são coloridos com o menu suspenso Color by na barra de ferramentas do painel. Alterna os modos de visualização a qualquer momento — o gráfico é recolorido instantaneamente para que possas ver como as divisões, classes ou propriedades das imagens estão distribuídas pelos teus clusters:

Opção	Sombreamento
Divisões	Treino / Val / Teste
Classes	Primeira classe de anotação em cada imagem
Largura	Largura da imagem
Altura	Altura da imagem
Tamanho	Tamanho do arquivo
Anotações	Número de anotações por imagem

Modos de Cor de Clustering de Datasets da Plataforma Ultralytics

Link to this sectionSeleção de Laço (Lasso)#

Desenhe uma seleção de forma livre ao redor de uma região para destacar pontos no gráfico. A galeria filtra para as imagens correspondentes, para que você possa inspecionar, rotular novamente, mover ou excluí-las usando as operações de imagem usuais.

Limpar Seleção

Um chip acima do gráfico mostra quantos pontos estão selecionados — clique no × para limpar o laço e retornar à visualização completa da galeria.

Link to this sectionPan e Zoom#

Navegue por grandes dispersões diretamente com seu mouse e teclado:

Entrada	Ação
Scroll	Mover o gráfico em 2D
Cmd/Ctrl+Scroll	Aumentar ou diminuir zoom, ancorado no cursor
Manter Espaço	Alternar para o modo arrastar para mover

Link to this sectionReanalisando#

Se o teu conjunto de dados mudar após a análise, um botão Re-analyze aparece no topo do painel para proprietários e editores.

Clica em Re-analyze para recalcular os embeddings e a projeção 2D de raiz.

Link to this sectionAbas do Dataset#

Cada página de dataset pode exibir até seis abas, dependendo do estado do dataset e das suas permissões:

Link to this sectionAba de Imagens#

A visualização padrão mostrando a galeria de imagens com sobreposições de anotação. Suporta modos de visualização em grade, compacto e tabela. Arraste e solte arquivos aqui para adicionar mais imagens.

Link to this sectionAba de Classes#

Esta aba aparece quando o dataset possui imagens.

Gerencie as classes de anotação para seu dataset:

Histograma de classe: Gráfico de barras mostrando a contagem de anotações por classe com alternância de escala linear/logarítmica
Tabela de classes: Tabela ordenável e pesquisável com nome da classe, contagem de rótulos e contagem de imagens
Editar nomes de classes: Clique em qualquer nome de classe para renomeá-lo diretamente
Editar cores de classes: Clique em uma amostra de cor para alterar a cor da classe
Adicionar nova classe: Use a entrada na parte inferior para adicionar classes

Histograma e Tabela da Aba de Classes de Conjuntos de Dados da Plataforma Ultralytics

Escala Logarítmica para Conjuntos de Dados Desbalanceados

Se o seu conjunto de dados tiver desbalanceamento de classes (por exemplo, 10.000 anotações de "pessoa", mas apenas 50 de "bicicleta"), use o botão Log Scale no histograma de classes para visualizar todas as classes claramente.

Link to this sectionAba de Gráficos#

Esta aba aparece quando o dataset possui imagens.

Estatísticas automáticas calculadas a partir do seu conjunto de dados:

Gráfico	Descrição
Distribuição de Divisão (Split Distribution)	Gráfico de rosca com contagens de imagens de treino/validação/teste e porcentagem rotulada
Principais Classes	Gráfico de rosca das 10 classes de anotação mais frequentes
Dimensões da Imagem	Histograma da distribuição de largura e altura da imagem (sobreposto) com média
Pontos por Instância	Contagem de vértices de polígono ou keypoints por anotação (segmentação/pose)
Localizações de Anotação	Mapa de calor 2D das posições centrais das BBox
Tamanho do Arquivo de Imagem	Histograma da distribuição do tamanho dos arquivos de imagem
Formatos de Imagem	Distribuição dos formatos de imagem de origem (JPG, PNG, etc.)
Dimensões da Bounding Box	Histograma da largura e altura das bounding boxes (sobreposto)
Objetos por Imagem	Histograma da contagem de anotações por imagem
Dimensões da Imagem 2D	Mapa de calor 2D de largura vs altura com linhas guia de proporção

Grade de Estatísticas da Aba de Gráficos de Conjuntos de Dados da Plataforma Ultralytics

Cache de Estatísticas

As estatísticas são armazenadas em cache por 5 minutos. Alterações nas anotações serão refletidas após o cache expirar.

Mapas de Calor em Tela Cheia

Clique no botão de expandir em qualquer mapa de calor para visualizá-lo em modo de tela cheia. Isso oferece uma visualização maior e mais detalhada — útil para entender padrões espaciais em grandes conjuntos de dados.

Link to this sectionAba de Modelos#

Veja todos os modelos treinados neste conjunto de dados em uma tabela pesquisável:

Coluna	Descrição
Nome	Nome do modelo com link
Projeto	Projeto pai com ícone
Versão	Versão de dataset imutável usada para treinamento, se houver
Status	Badge de status de treinamento
Tarefa	Tipo de tarefa YOLO
Épocas	Melhor época / total de épocas
mAP50-95	Precisão média (mean average precision)
mAP50	mAP com IoU 0.50
Criado	Data de criação

Tabela de Modelos Treinados da Aba de Modelos de Conjuntos de Dados da Plataforma Ultralytics

Link to this sectionAba de Erros#

Esta aba aparece apenas quando um ou mais arquivos falham no processamento.

Imagens que falharam no processamento são listadas aqui com:

Banner de erro: Contagem total de imagens com falha e orientação
Tabela de erros: Nome do arquivo, descrição amigável do erro, dicas de correção e miniatura de visualização
Erros comuns incluem arquivos corrompidos, formatos não suportados, imagens muito pequenas (mínimo 28px) e modos de cor não suportados

Falhas de Processamento da Aba de Erros de Conjuntos de Dados da Plataforma Ultralytics

Erros Comuns de Processamento

Erro	Causa	Correção
Incapaz de ler o arquivo de imagem	Formato corrompido ou não suportado	Exporte novamente a partir do editor de imagens
Incompleto ou corrompido	O arquivo foi truncado durante a transferência	Baixe novamente o arquivo original
Imagem muito pequena	Dimensão mínima abaixo de 28px	Use imagens de origem com resolução maior
Modo de cor não suportado	Modo de cor CMYK ou indexado	Converta para o modo RGB

Link to this sectionAba de Versões#

Crie snapshots NDJSON imutáveis do seu conjunto de dados para treinamento reprodutível. Cada versão captura contagens de imagens, contagens de classes, contagens de anotações e tamanho do arquivo no momento da criação.

Coluna	Descrição
Versão	Número da versão (v1, v2, ...)
Descrição	Descrição fornecida pelo usuário (editável)
Imagens	Contagem de imagens no momento do snapshot
Classes	Contagem de classes no momento do snapshot
Anotações	Contagem de anotações no momento do snapshot
Tamanho	Tamanho do arquivo de exportação NDJSON
Criado	Quando a versão foi criada

Para criar uma versão:

Abra a aba Versões
Opcionalmente, insira uma descrição (por exemplo, "Adicionadas 500 imagens de treino" ou "Corrigidas classes com rótulos errados")
Clique em + Nova Versão
A nova versão aparece na tabela
Baixe a versão separadamente da tabela quando necessário

Cada versão é numerada sequencialmente (v1, v2, v3...) e armazenada permanentemente. Você pode baixar qualquer versão anterior a qualquer momento a partir da tabela de versões.

Salvar uma Versão Durante o Treinamento

Ativa Save Dataset Version na caixa de diálogo de Treinamento em Nuvem para vincular um modelo ao dataset exato usado para o treinamento. A Platform reutiliza uma versão correspondente quando o conteúdo do dataset não foi alterado e cria uma nova versão apenas quando ele foi.

Apenas Conjuntos de Dados Prontos

A criação de versões está disponível após o conjunto de dados atingir o status ready.

Quando Criar Versões

Crie uma versão antes e depois de grandes alterações no seu conjunto de dados — adicionar imagens, corrigir anotações ou rebalancear divisões. Isso permite comparar o desempenho do modelo entre diferentes estados do conjunto de dados.

Tamanho do Arquivo NDJSON

O tamanho exibido é o tamanho do arquivo de exportação NDJSON, que contém URLs de imagens e anotações — não as imagens em si. Os dados reais das imagens são armazenados separadamente e acessados via URLs assinadas.

Link to this sectionExportar Dataset#

Exporte seu conjunto de dados para uso offline com um download NDJSON a partir do cabeçalho do conjunto de dados ou da aba Versões.

Para exportar:

Clique no botão Download (ícone de download) no cabeçalho do conjunto de dados
Baixe o snapshot NDJSON atual diretamente
Use a aba Versions quando quiser um snapshot numerado e imutável que você possa baixar novamente mais tarde

Ultralytics Platform Datasets Export Ndjson Download

O formato NDJSON armazena um objeto JSON por linha. A primeira linha contém os metadados do conjunto de dados, seguidos por uma linha por imagem:

{"type": "dataset", "task": "detect", "name": "my-dataset", "description": "...", "bytes": 12345678, "url": "https://platform.ultralytics.com/...", "class_names": {"0": "person", "1": "car"}, "version": 1, "created_at": "2026-01-15T10:00:00Z", "updated_at": "2026-02-20T14:30:00Z"}
{"type": "image", "file": "img001.jpg", "url": "https://...", "width": 640, "height": 480, "split": "train", "annotations": {"boxes": [[0, 0.5, 0.5, 0.2, 0.3]]}}
{"type": "image", "file": "img002.jpg", "url": "https://...", "width": 1280, "height": 720, "split": "val"}

URLs assinadas

As URLs de imagem no NDJSON exportado são assinadas e válidas por 7 dias. Se precisar de URLs novas, exporte o conjunto de dados novamente ou crie uma nova versão.

Consulte a documentação do formato Ultralytics NDJSON para a especificação completa.

Link to this sectionOperações de imagem#

Link to this sectionAções rápidas#

Clique com o botão direito em qualquer imagem na visualização Grid ou Compact para acessar ações rápidas:

Ação	Descrição
Move to Split	Reatribua a imagem para a divisão de Treino, Validação ou Teste
Download	Baixe o arquivo de imagem original
Delete	Exclua a imagem do conjunto de dados

Individual vs em lote

O menu de contexto da imagem opera em uma única imagem. Para operações em lote com várias imagens, use a visualização Table com seleção por checkbox.

Link to this sectionMover divisão em lote#

Reatribua imagens selecionadas para uma divisão diferente dentro do mesmo conjunto de dados:

Mude para a visualização Table
Selecione as imagens usando os checkboxes
Clique com o botão direito para abrir o menu de contexto
Escolha Move to split > Train, Validation ou Test

Você também pode arrastar e soltar imagens nas abas de filtro de divisão na visualização em grade.

Organizando divisões de Treino/Validação

Envie todas as imagens para um conjunto de dados e, em seguida, use a movimentação em lote para organizar subconjuntos em divisões de treino, validação e teste.

Link to this sectionRedistribuição de divisão#

Redistribua todas as imagens entre as divisões de treino, validação e teste usando proporções personalizadas:

Clique na barra de divisão na barra de ferramentas do conjunto de dados para abrir a caixa de diálogo Redistribute Splits
Ajuste as porcentagens da divisão usando qualquer um dos métodos abaixo
Revise a prévia da contagem de imagens ao vivo para confirmar a distribuição
Clique em Apply para reatribuir aleatoriamente todas as imagens de acordo com suas porcentagens

Ultralytics Platform Datasets Split Redistribution Dialog

A caixa de diálogo oferece três maneiras de definir suas proporções de divisão alvo:

Método	Descrição
Drag	Arraste as alças entre os segmentos coloridos para ajustar visualmente os limites da divisão
Type	Edite a entrada de porcentagem para qualquer divisão (as outras duas divisões são rebalanceadas automaticamente de forma proporcional)
Auto	Um clique para definir instantaneamente uma divisão 80/20 de treino/validação com a divisão de teste definida como 0%

Uma prévia ao vivo mostra exatamente quantas imagens ficarão em cada divisão antes de aplicar.

Divisão rápida 80/20

Clique no botão Auto para definir instantaneamente a divisão 80/20 recomendada de treino/validação. Esta é a proporção mais comum para treinamento.

Link to this sectionExclusão em lote#

Exclua várias imagens de uma vez:

Selecione imagens na visualização de tabela
Clique com o botão direito e escolha Delete
Confirme a exclusão

Link to this sectionURI do conjunto de dados#

Referencie conjuntos de dados da plataforma usando o formato de URI ul:// (consulte Usando conjuntos de dados da plataforma):

ul://username/datasets/dataset-slug

Também podes colar um URL de conjunto de dados ou de modelo da web diretamente (por exemplo, https://platform.ultralytics.com/username/datasets/dataset-slug); este é automaticamente reescrito para o URI ul://. Passar uma lista de conjuntos de dados faz o fine-tuning de um modelo base através de cada um em série, por exemplo model.train(data=["ul://username/datasets/a", "ul://username/datasets/b"]).

Use esta URI para treinar modelos de qualquer lugar:

export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100

Treine de qualquer lugar com dados da plataforma

A URI ul:// funciona a partir de qualquer ambiente:

Máquina local: Treine no seu hardware, dados baixados automaticamente
Google Colab: Acesse seus conjuntos de dados da plataforma em notebooks
Servidores remotos: Treine em VMs em nuvem com acesso total ao conjunto de dados

Link to this sectionLicenças disponíveis#

A plataforma suporta as seguintes licenças para conjuntos de dados:

Licença	Tipo
Nenhuma	Nenhuma licença selecionada
CC0-1.0	Domínio público
CC-BY-2.5	Permissiva
CC-BY-4.0	Permissiva
CC-BY-SA-4.0	Copyleft
CC-BY-NC-4.0	Não comercial
CC-BY-NC-SA-4.0	Copyleft
CC-BY-ND-4.0	Sem derivados
CC-BY-NC-ND-4.0	Não comercial
Apache-2.0	Permissiva
MIT	Permissiva
AGPL-3.0	Copyleft
GPL-3.0	Copyleft
Apenas pesquisa	Restrita
Outra	Personalizada

Licenças Copyleft

Ao clonar um conjunto de dados com uma licença copyleft (AGPL-3.0, GPL-3.0, CC-BY-SA-4.0, CC-BY-NC-SA-4.0), o clone herda a licença e o seletor de licença é bloqueado.

Link to this sectionConfigurações de visibilidade#

Controle quem pode ver seu conjunto de dados:

Configuração	Descrição
Privado	Apenas você pode acessar
Público	Qualquer pessoa pode visualizar na página Explore

A visibilidade é definida ao criar um conjunto de dados na caixa de diálogo New Dataset usando um interruptor. Conjuntos de dados públicos são visíveis na página Explore.

Link to this sectionEditar conjunto de dados#

Os metadados do conjunto de dados são editados em linha diretamente na página — nenhuma caixa de diálogo é necessária:

Nome: Clique no nome do conjunto de dados para editá-lo. As alterações são salvas automaticamente ao sair do campo ou pressionar Enter.
Descrição: Clique na descrição (ou no espaço reservado "Add a description...") para editar. As alterações são salvas automaticamente.
Tipo de tarefa: Clique no selo da tarefa para selecionar um tipo de tarefa diferente.
Licença: Clique no seletor de licença para alterar a licença do conjunto de dados.

Alterando o tipo de tarefa

Cada imagem armazena anotações para todos os tipos de tarefa juntos. Alterar o tipo de tarefa do conjunto de dados controla quais anotações são visíveis no editor e incluídas em exportações e treinamentos. As anotações para outros tipos de tarefa são preservadas no banco de dados e reaparecem quando você alterna de volta.

Link to this sectionClonar Dataset#

Ao visualizar um dataset público que não é teu, clica em Clone Dataset para criar uma cópia no teu espaço de trabalho. O clone inclui todas as imagens, anotações e definições de classe. Se o dataset original tiver uma licença copyleft, o clone herda-a e o seletor de licença fica bloqueado.

Link to this sectionMarcar com Estrela e Partilhar#

Marcar com Estrela: Clica no botão de estrela para marcar um dataset como favorito. O número de estrelas é visível para todos os utilizadores.
Partilhar: Para datasets públicos, clica no botão de partilha para copiar uma hiperligação ou partilhar em redes sociais.

Link to this sectionEliminar Dataset#

Apaga um dataset de que já não precises:

Abre o menu de ações do dataset
Clica em Delete
Confirma na caixa de diálogo: "Isto moverá [name] para o lixo. Podes restaurá-lo no prazo de 30 dias."

Lixo e Restauro

Os datasets apagados são movidos para o Lixo — não são eliminados permanentemente. Podes restaurá-los no prazo de 30 dias em Settings > Trash.

Link to this sectionTreinar num Dataset#

Começa o treino diretamente a partir do teu dataset:

Clica em New Model na página do dataset
Seleciona um projeto ou cria um novo
Configura os parâmetros de treino
Começa o treino

graph LR
    A[Dataset]:::start --> B[New Model]:::proc
    B --> C[Select Project]:::proc
    C --> D[Configure]:::proc
    D --> E[Start Training]:::out

    classDef start fill:#4CAF50,color:#fff
    classDef proc fill:#2196F3,color:#fff
    classDef out fill:#9C27B0,color:#fff

Consulta Cloud Training para detalhes.

Link to this sectionFAQ#

Link to this sectionO que acontece aos meus dados após o upload?#

Os teus dados são processados e armazenados na região selecionada (US, EU ou AP). As imagens são:

Validadas quanto ao formato e tamanho
Rejeitadas se a dimensão mínima for inferior a 28px
Normalizadas se forem maiores que 4096px (preservando a proporção; codificadas para armazenamento otimizado)
Armazenadas utilizando Content-Addressable Storage (CAS) com hashing XXH3-128
Miniaturas geradas em WebP de 256px para uma navegação rápida

Link to this sectionComo funciona o armazenamento?#

A Ultralytics Platform utiliza Content-Addressable Storage (CAS) para um armazenamento eficiente:

Deduplicação: Imagens idênticas enviadas por utilizadores diferentes são armazenadas apenas uma vez
Integridade: O hashing XXH3-128 garante a integridade dos dados
Eficiência: Reduz os custos de armazenamento e acelera o processamento
Regional: Os dados permanecem na região selecionada (US, EU ou AP)

Link to this sectionPosso adicionar imagens a um dataset existente?#

Sim, arrasta e larga ficheiros na página do dataset ou usa o botão de upload para adicionar imagens adicionais. Novas estatísticas serão calculadas automaticamente.

Link to this sectionComo movo imagens entre divisões (splits)?#

Usa a funcionalidade de mover em massa para divisão:

Selecione imagens na visualização de tabela
Clica com o botão direito e escolhe Move to split
Seleciona a divisão de destino (Train, Validation ou Test)

Link to this sectionQue formatos de etiqueta são suportados?#

A Ultralytics Platform suporta etiquetas YOLO, COCO JSON, Ultralytics NDJSON e uploads de imagens em bruto:

Um ficheiro .txt por imagem com coordenadas normalizadas (intervalo 0-1):

Tarefa	Formato	Exemplo
Detectar	`class cx cy w h`	`0 0.5 0.5 0.2 0.3`
Segmentar	`class x1 y1 x2 y2 ...`	`0 0.1 0.1 0.9 0.1 0.9 0.9`
Pose	`class cx cy w h kx1 ky1 v1 ...`	`0 0.5 0.5 0.2 0.3 0.6 0.7 2`
OBB	`class x1 y1 x2 y2 x3 y3 x4 y4`	`0 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9`
Classificar	Estrutura de diretórios	`train/cats/`, `train/dogs/`

Sinalizadores de visibilidade de pose: 0=não rotulado, 1=rotulado mas ocluído, 2=rotulado e visível.

Link to this sectionPosso anotar o mesmo dataset para vários tipos de tarefa?#

Sim. Cada imagem armazena anotações para todos os 6 tipos de tarefa (detect, segment, semantic, pose, OBB, classify) em conjunto. Podes mudar o tipo de tarefa ativa do dataset a qualquer momento sem perder as anotações existentes. Apenas as anotações que correspondem ao tipo de tarefa ativa são apresentadas no editor e incluídas nas exportações e no treino — as anotações para outras tarefas são preservadas e reaparecem quando mudas de volta.

Contribuidores

GLglenn-jocher²⁴ SEsergiuwaxmann⁵ LAlaodouya³ T-t-hakobyan² MYmykolaxboiko¹ LALaughing-q¹

Criado 14 de jan. de 2026Atualizado ontem