Datasets

Los datasets de Ultralytics Platform ofrecen una solución optimizada para gestionar tus datos de entrenamiento. Tras la carga, la plataforma procesa automáticamente las imágenes, las etiquetas y las estadísticas. Un dataset está listo para entrenar una vez que el procesamiento ha finalizado y cuenta con al menos una imagen en la partición train, al menos una imagen en la partición val o test, al menos una imagen etiquetada y un total de al menos dos imágenes.

Subir dataset

Ultralytics Platform acepta múltiples formatos de carga para ofrecerte flexibilidad.

Formatos compatibles

FormatoExtensionesNotasTamaño máx.
JPEG.jpg, .jpegMás comunes, recomendados50 MB
PNG.pngAdmite transparencia50 MB
WebP.webpModerno, buena compresión50 MB
BMP.bmpSin comprimir50 MB
TIFF.tiff, .tifAlta calidad50 MB
HEIC.heicFotos de iPhone50 MB
AVIF.avifFormato de nueva generación50 MB
JP2.jp2JPEG 200050 MB
DNG.dngCámara Raw50 MB
MPO.mpoObjeto multi-imagen50 MB

Preparación de tu dataset

La plataforma admite Ultralytics YOLO, COCO, Ultralytics NDJSON y cargas sin procesar (sin anotar):

Utiliza la estructura de directorios estándar de YOLO con un archivo data.yaml:

my-dataset/
├── images/
│   ├── train/
│   │   ├── img001.jpg
│   │   └── img002.jpg
│   └── val/
│       ├── img003.jpg
│       └── img004.jpg
├── labels/
│   ├── train/
│   │   ├── img001.txt
│   │   └── img002.txt
│   └── val/
│       ├── img003.txt
│       └── img004.txt
└── data.yaml

El archivo YAML define la configuración de tu dataset:

# data.yaml
path: .
train: images/train
val: images/val

names:
    0: person
    1: car
    2: dog
Cargas sin procesar (Raw)

Raw: Sube imágenes sin anotar (sin etiquetas). Es útil cuando planeas anotar directamente en la plataforma usando el editor de anotaciones.

Estructura de directorios plana

También puedes subir imágenes sin carpetas de partición explícitas. La plataforma respeta el destino de partición activo durante la carga y, para datasets que no sean de clasificación, puede crear automáticamente una partición de validación a partir de una parte del conjunto de entrenamiento cuando no se proporciona información de partición. Siempre puedes reasignar imágenes más tarde mediante el movimiento masivo a particiones o la redistribución de particiones.

Detección automática de formato

El formato se detecta automáticamente: los datasets con un archivo data.yaml que contenga claves names, train o val se tratan como YOLO. Los datasets con archivos JSON de COCO (que contengan matrices de images, annotations y categories) se tratan como COCO. Las exportaciones .ndjson se importan como Ultralytics NDJSON. Los datasets que solo tienen imágenes y no tienen anotaciones se tratan como raw.

Para obtener detalles de formato específicos de la tarea, consulta tareas admitidas y la Descripción general de datasets.

Proceso de carga

  1. Navega a Datasets en la barra lateral
  2. Haz clic en New Dataset (Nuevo dataset) o arrastra archivos a la zona de carga
  3. Selecciona el tipo de tarea (consulta tareas admitidas)
  4. Añade un nombre y una descripción opcional
  5. Establece la visibilidad (pública o privada) y una licencia opcional (consulta licencias disponibles)
  6. Haz clic en Create (Crear)

Selector de tareas del diálogo de carga de datasets de Ultralytics Platform

Tras la carga, la plataforma procesa tus datos a través de una pipeline multietapa:

graph LR
    A[Upload] --> B[Validate]
    B --> C[Normalize]
    C --> D[Thumbnail]
    D --> E[Parse Labels]
    E --> F[Statistics]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#2196F3,color:#fff
    style D fill:#2196F3,color:#fff
    style E fill:#2196F3,color:#fff
    style F fill:#9C27B0,color:#fff
  1. Validación: comprobaciones de formato y tamaño
  2. Normalización: redimensionamiento de imágenes grandes (máx. 4096 px, dimensión mínima 28 px)
  3. Miniaturas: generación de vistas previas WebP de 256 px
  4. Análisis de etiquetas: extracción de etiquetas en formato YOLO y COCO
  5. Estadísticas: cálculo de las distribuciones de clases y las dimensiones de las imágenes

Barra de progreso de carga de datasets de Ultralytics Platform

Validar antes de subir

Puedes validar tu dataset localmente antes de subirlo:

from ultralytics.data.utils import check_det_dataset

check_det_dataset("path/to/data.yaml")
Requisitos de tamaño de imagen

Las imágenes deben tener al menos 28 px en su lado más corto. Las imágenes más pequeñas son rechazadas durante el procesamiento. Las imágenes de más de 4096 px en su lado más largo se redimensionan automáticamente manteniendo la relación de aspecto.

Explorar imágenes

Visualiza las imágenes de tu dataset en varios diseños.

Abre el panel Clustering desde la barra de herramientas de la galería para explorar tu dataset como un gráfico de dispersión 2D interactivo.

VistaDescripción
Cuadrícula (Grid)Cuadrícula de miniaturas con superposiciones de anotaciones (predeterminado)
CompactaMiniaturas más pequeñas para un escaneo rápido
TablaLista con miniatura, nombre de archivo, dimensiones, tamaño, partición, clases y recuento de etiquetas

Vista de cuadrícula de la galería de datasets de Ultralytics Platform con anotaciones

Clasificación y filtrado

Las imágenes se pueden clasificar y filtrar para una navegación eficiente:

OrdenarDescripción
Más reciente / Más antiguoOrden de carga / creación
Nombre A-Z / Z-ANombre de archivo alfabéticamente
Altura ↑/↓Altura de la imagen en píxeles
Ancho ↑/↓Ancho de la imagen en píxeles
Tamaño ↑/↓Tamaño del archivo en disco
Anotaciones ↑/↓Recuento de anotaciones por imagen
Datasets grandes

Para datasets de más de 100.000 imágenes, las ordenaciones por nombre / tamaño / ancho / altura están desactivadas para mantener la galería fluida. Las ordenaciones por más reciente, más antiguo y recuento de anotaciones siguen estando disponibles.

Búsqueda de imágenes sin etiquetar

Usa el filtro de etiquetas establecido en Unlabeled (Sin etiquetar) para encontrar rápidamente imágenes que aún necesitan ser anotadas. Esto es especialmente útil para datasets grandes donde deseas hacer un seguimiento del progreso del etiquetado.

Visor en pantalla completa

Haz clic en cualquier imagen para abrir el visor en pantalla completa con:

  • Navegación: Teclas de flecha o vistas previas en miniatura para explorar
  • Metadatos: Nombre de archivo, dimensiones, insignia de división, recuento de anotaciones
  • Anotaciones: Alternar la visibilidad de la capa de anotaciones
  • Desglose por clases: Recuentos de etiquetas por clase con indicadores de color
  • Editar: Entra en el modo de anotación para añadir o modificar etiquetas
  • Descargar: Descarga el archivo de imagen original
  • Eliminar: Elimina la imagen del dataset
  • Zoom: Cmd/Ctrl+Scroll, Cmd/Ctrl++ o Cmd/Ctrl+= para acercar, y Cmd/Ctrl+- para alejar
  • Restablecer vista: Cmd/Ctrl + 0 o el botón de restablecer para ajustar la imagen al visor
  • Desplazamiento (Pan): Mantén presionada la tecla Space (Espacio) y arrastra para mover el lienzo cuando hayas hecho zoom
  • Vista de píxeles: Alterna la renderización pixelada para una inspección detallada

Visor en pantalla completa de Datasets de Ultralytics Platform con panel de metadatos

Filtrar por división

Filtrar imágenes según su división del dataset:

Split (División)Propósito
EntrenarUtilizado para el entrenamiento del modelo
ValUtilizado para la validación durante el entrenamiento
TestUtilizado para la evaluación final

Agrupamiento (Clustering)

El panel Clustering proyecta tu dataset en un gráfico de dispersión 2D interactivo donde las imágenes visualmente similares aparecen juntas. Úsalo para revelar grupos, detectar duplicados y valores atípicos, e inspeccionar cómo se distribuyen las divisiones o las clases en tus datos, todo sin salir de la galería. Ábrelo desde el icono del gráfico de dispersión en la barra de herramientas de la galería en cualquier página de dataset.

Estado vacío de Clustering de Datasets de Ultralytics Platform

Ejecución del análisis

Iniciar un análisis:

  1. Abre un dataset y haz clic en el icono del gráfico de dispersión en la barra de herramientas de la galería
  2. Haz clic en Analyze Dataset
  3. Espera a que finalice la barra de progreso; los resultados aparecerán en el mismo panel

El análisis se ejecuta en segundo plano y puede tardar unos minutos dependiendo del tamaño de tu dataset. Puedes cerrar el panel o salir de la página y volver más tarde.

Visualización

Una vez completado el análisis, el panel muestra un gráfico de dispersión 2D de todas las imágenes analizadas. Los filtros de la galería (división, clase, etiquetado/sin etiquetar) atenúan los puntos que quedan fuera del filtro para que puedas centrarte en el subconjunto que te interesa.

Gráfico de dispersión de Clustering de Datasets de Ultralytics Platform

Colorear por

Cambia la forma en que se sombrean los puntos de datos con el menú desplegable Color by en la barra de herramientas del panel. Cambia los modos de visualización en cualquier momento: el gráfico vuelve a colorearse al instante para que puedas ver cómo se distribuyen las divisiones, las clases o las propiedades de las imágenes en tus grupos:

OpciónSombreado
Splits (Divisiones)Train / Val / Test
ClasesPrimera clase de anotación en cada imagen
Width (Ancho)Ancho de la imagen
Height (Altura)Altura de la imagen
Size (Tamaño)Tamaño del archivo
AnotacionesNúmero de anotaciones por imagen

Modos de color de Clustering de Datasets de Ultralytics Platform

Selección con lazo

Dibuja una selección de forma libre alrededor de una región para resaltar puntos en el gráfico. La galería filtra las imágenes coincidentes para que puedas inspeccionarlas, volver a etiquetarlas, moverlas o eliminarlas usando las operaciones de imagen habituales.

Borrar selección

Un distintivo sobre el gráfico muestra cuántos puntos hay seleccionados; haz clic en la × para borrar el lazo y volver a la vista completa de la galería.

Desplazamiento y Zoom

Navega por grandes dispersiones directamente desde tu ratón y teclado:

EntradaAcción
Scroll (Desplazamiento)Mover el gráfico en 2D
Cmd/Ctrl+ScrollAcercar o alejar, anclado al cursor
Mantener Space (Espacio)Cambiar al modo de arrastrar para desplazar

Reanálisis

Si tu dataset cambia después del análisis, aparece un botón Re-analyze en la parte superior del panel para propietarios y editores.

Haz clic en Re-analyze para volver a calcular las incrustaciones y la proyección 2D desde cero.

Pestañas del conjunto de datos

Cada página de dataset puede mostrar hasta seis pestañas, dependiendo del estado del dataset y tus permisos:

Pestaña Imágenes

La vista predeterminada que muestra la galería de imágenes con superposiciones de anotaciones. Admite modos de vista de cuadrícula, compacta y tabla. Arrastra y suelta archivos aquí para añadir más imágenes.

Pestaña Clases

Esta pestaña aparece cuando el dataset contiene imágenes.

Gestiona las clases de anotación para tu dataset:

  • Histograma de clases: Gráfico de barras que muestra el recuento de anotaciones por clase con alternancia de escala lineal/logarítmica
  • Tabla de clases: Tabla ordenable y buscable con nombre de clase, recuento de etiquetas y recuento de imágenes
  • Editar nombres de clases: Haz clic en cualquier nombre de clase para renombrarlo en línea
  • Editar colores de clases: Haz clic en una muestra de color para cambiar el color de la clase
  • Añadir nueva clase: Usa la entrada en la parte inferior para añadir clases

Histograma y tabla de la pestaña Clases de Datasets de Ultralytics Platform

Escala logarítmica para datasets desequilibrados

Si tu dataset tiene un desequilibrio de clases (por ejemplo, 10.000 anotaciones de "persona" pero solo 50 de "bicicleta"), usa la opción Log Scale en el histograma de clases para visualizar todas las clases con claridad.

Pestaña de gráficos

Esta pestaña aparece cuando el dataset contiene imágenes.

Estadísticas automáticas calculadas a partir de tu dataset:

GráficoDescripción
Distribución de conjuntosGráfico de anillos con el recuento de imágenes de entrenamiento/validación/prueba y el porcentaje etiquetado
Clases principalesGráfico de anillos de las 10 clases de anotación más frecuentes
Anchuras de imagenHistograma de la distribución de la anchura de las imágenes con la media
Alturas de imagenHistograma de la distribución de la altura de las imágenes con la media
Puntos por instanciaRecuento de vértices de polígonos o puntos clave por anotación (segmento/pose)
Ubicaciones de las anotacionesMapa de calor 2D de las posiciones centrales de los BBox
Dimensiones de imagenMapa de calor 2D de anchura frente a altura con líneas guía de relación de aspecto

Cuadrícula de estadísticas de la pestaña de gráficos de Datasets de la plataforma Ultralytics

Caché de estadísticas

Las estadísticas se almacenan en caché durante 5 minutos. Los cambios en las anotaciones se reflejarán una vez que expire la caché.

Mapas de calor a pantalla completa

Haz clic en el botón de ampliar en cualquier mapa de calor para verlo en modo de pantalla completa. Esto proporciona una vista más grande y detallada, útil para comprender los patrones espaciales en datasets grandes.

Pestaña de modelos

Visualiza todos los modelos entrenados con este dataset en una tabla con función de búsqueda:

ColumnaDescripción
NombreNombre del modelo con enlace
ProyectoProyecto padre con icono
EstadoInsignia de estado de entrenamiento
TareaTipo de tarea YOLO
ÉpocasMejor época / total de épocas
mAP50-95Precisión media promedio
mAP50mAP con IoU 0.50
CreadoFecha de creación

Tabla de modelos entrenados de la pestaña de modelos de Datasets de la plataforma Ultralytics

Pestaña de errores

Esta pestaña aparece solo cuando uno o varios archivos fallan en el procesamiento.

Las imágenes que fallaron al procesarse se enumeran aquí con:

  • Banner de error: recuento total de imágenes fallidas y guía
  • Tabla de errores: nombre del archivo, descripción del error fácil de entender, sugerencias de solución y miniatura de vista previa
  • Los errores comunes incluyen archivos dañados, formatos no compatibles, imágenes demasiado pequeñas (mín. 28px) y modos de color no compatibles

Fallos de procesamiento en la pestaña de errores de Datasets de la plataforma Ultralytics

Errores de procesamiento comunes
ErrorCausaSolución
No se puede leer el archivo de imagenFormato dañado o no compatibleVuelve a exportar desde el editor de imágenes
Incompleto o dañadoEl archivo se truncó durante la transferenciaVuelve a descargar el archivo original
Imagen demasiado pequeñaDimensión mínima inferior a 28pxUsa imágenes de origen con mayor resolución
Modo de color no compatibleModo de color CMYK o indexadoConvierte al modo RGB

Pestaña de versiones

Crea instantáneas NDJSON inmutables de tu dataset para un entrenamiento reproducible. Cada versión captura el recuento de imágenes, el recuento de clases, el recuento de anotaciones y el tamaño del archivo en el momento de la creación.

ColumnaDescripción
VersiónNúmero de versión (v1, v2, ...)
DescripciónDescripción proporcionada por el usuario (editable)
ImágenesRecuento de imágenes en el momento de la instantánea
ClasesRecuento de clases en el momento de la instantánea
AnotacionesRecuento de anotaciones en el momento de la instantánea
TamañoTamaño del archivo de exportación NDJSON
CreadoCuándo se creó la versión

Para crear una versión:

  1. Abre la pestaña Versiones
  2. Opcionalmente, introduce una descripción (p. ej., "Añadidas 500 imágenes de entrenamiento" o "Corregidas clases mal etiquetadas")
  3. Haz clic en + Nueva versión
  4. La nueva versión aparece en la tabla
  5. Descarga la versión por separado desde la tabla cuando lo necesites

Cada versión se numera secuencialmente (v1, v2, v3...) y se almacena de forma permanente. Puedes descargar cualquier versión anterior en cualquier momento desde la tabla de versiones.

Solo datasets listos

La creación de versiones está disponible una vez que el dataset alcanza el estado ready.

Cuándo crear versiones

Crea una versión antes y después de cambios importantes en tu dataset, como añadir imágenes, corregir anotaciones o reequilibrar conjuntos. Esto te permite comparar el rendimiento del modelo a través de diferentes estados del dataset.

Tamaño del archivo NDJSON

El tamaño mostrado es el tamaño del archivo de exportación NDJSON, que contiene URLs de imágenes y anotaciones, no las imágenes en sí. Los datos reales de las imágenes se almacenan por separado y se accede a ellos a través de URLs firmadas.

Exportar dataset

Exporta tu dataset para uso sin conexión con una descarga NDJSON desde el encabezado del dataset o la pestaña Versiones.

Para exportar:

  1. Haz clic en el botón Exportar en el encabezado del dataset
  2. Descarga la instantánea NDJSON actual directamente
  3. Usa la pestaña Versiones cuando quieras una instantánea numerada inmutable que puedas volver a descargar más tarde

Descarga de NDJSON de exportación de Datasets de la plataforma Ultralytics

El formato NDJSON almacena un objeto JSON por línea. La primera línea contiene los metadatos del dataset, seguida de una línea por imagen:

{"type": "dataset", "task": "detect", "name": "my-dataset", "description": "...", "url": "https://platform.ultralytics.com/...", "class_names": {"0": "person", "1": "car"}, "version": 1, "created_at": "2026-01-15T10:00:00Z", "updated_at": "2026-02-20T14:30:00Z"}
{"type": "image", "file": "img001.jpg", "url": "https://...", "width": 640, "height": 480, "split": "train", "annotations": {"boxes": [[0, 0.5, 0.5, 0.2, 0.3]]}}
{"type": "image", "file": "img002.jpg", "url": "https://...", "width": 1280, "height": 720, "split": "val"}
URLs firmadas

Las URLs de las imágenes en el NDJSON exportado están firmadas y son válidas durante 7 días. Si necesitas URLs nuevas, vuelve a exportar el dataset o crea una versión nueva.

Consulta la documentación del formato NDJSON de Ultralytics para ver la especificación completa.

Operaciones de imagen

Acciones rápidas

Haz clic derecho en cualquier imagen en la vista Cuadrícula o Compacta para acceder a acciones rápidas:

AcciónDescripción
Mover a conjuntoReasigna la imagen a la partición Train, Val o Test
DescargarDescarga el archivo de imagen original
EliminarElimina la imagen del conjunto de datos

Ultralytics Platform Datasets Image Card Context Menu

Individual frente a masivo

El menú contextual de imágenes funciona sobre una única imagen. Para operaciones masivas en varias imágenes, usa la vista de Tabla con selección mediante casillas de verificación.

Mover a partición de forma masiva

Reasigna las imágenes seleccionadas a una partición diferente dentro del mismo conjunto de datos:

  1. Cambia a la vista de Tabla
  2. Selecciona imágenes usando las casillas de verificación
  3. Haz clic derecho para abrir el menú contextual
  4. Elige Move to split > Train, Validation o Test

También puedes arrastrar y soltar imágenes sobre las pestañas de filtro de particiones en la vista de cuadrícula.

Organización de particiones Train/Val

Sube todas las imágenes a un conjunto de datos y luego usa el movimiento masivo a particiones para organizar los subconjuntos en particiones de entrenamiento, validación y prueba.

Redistribución de particiones

Redistribuye todas las imágenes entre las particiones de entrenamiento, validación y prueba usando proporciones personalizadas:

  1. Haz clic en la barra de particiones en la barra de herramientas del conjunto de datos para abrir el diálogo Redistribute Splits
  2. Ajusta los porcentajes de las particiones usando cualquiera de los métodos siguientes
  3. Revisa la vista previa del recuento de imágenes en tiempo real para confirmar la distribución
  4. Haz clic en Apply para reasignar aleatoriamente todas las imágenes según tus porcentajes

Ultralytics Platform Datasets Split Redistribution Dialog

El diálogo proporciona tres formas de establecer las proporciones de partición objetivo:

MétodoDescripción
ArrastrarArrastra los controladores entre los segmentos de color para ajustar visualmente los límites de las particiones
EscribirEdita el porcentaje de entrada para cualquier partición (las otras dos se reequilibran automáticamente de forma proporcional)
AutoUn clic para establecer instantáneamente una partición 80/20 de entrenamiento/validación con la partición de prueba establecida en 0%

Una vista previa en tiempo real muestra exactamente cuántas imágenes irán a cada partición antes de aplicar los cambios.

Partición rápida 80/20

Haz clic en el botón Auto para establecer instantáneamente la partición recomendada 80/20 de entrenamiento/validación. Esta es la proporción más común para el entrenamiento.

Eliminación masiva

Elimina varias imágenes a la vez:

  1. Selecciona las imágenes en la vista de tabla
  2. Haz clic derecho y elige Delete
  3. Confirma la eliminación

URI del conjunto de datos

Haz referencia a los conjuntos de datos de la Platform usando el formato de URI ul:// (consulta Using Platform Datasets):

ul://username/datasets/dataset-slug

Usa esta URI para entrenar modelos desde cualquier lugar:

export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
Entrena en cualquier lugar con datos de la Platform

La URI ul:// funciona desde cualquier entorno:

  • Máquina local: Entrena en tu hardware, los datos se descargan automáticamente
  • Google Colab: Accede a tus conjuntos de datos de la Platform en notebooks
  • Servidores remotos: Entrena en máquinas virtuales en la nube con acceso total al conjunto de datos

Licencias disponibles

La Platform admite las siguientes licencias para los conjuntos de datos:

LicenciaTipo
NingunaNinguna licencia seleccionada
CC0-1.0Dominio público
CC-BY-2.5Permisiva
CC-BY-4.0Permisiva
CC-BY-SA-4.0Copyleft
CC-BY-NC-4.0No comercial
CC-BY-NC-SA-4.0Copyleft
CC-BY-ND-4.0Sin derivados
CC-BY-NC-ND-4.0No comercial
Apache-2.0Permisiva
MITPermisiva
AGPL-3.0Copyleft
GPL-3.0Copyleft
Solo para investigaciónRestringida
OtroPersonalizado
Licencias Copyleft

Al clonar un conjunto de datos con una licencia copyleft (AGPL-3.0, GPL-3.0, CC-BY-SA-4.0, CC-BY-NC-SA-4.0), el clon hereda la licencia y el selector de licencias queda bloqueado.

Configuración de visibilidad

Controla quién puede ver tu conjunto de datos:

ConfiguraciónDescripción
PrivadoSolo tú puedes acceder
PúblicoCualquiera puede verlo en la página Explore

La visibilidad se establece al crear un conjunto de datos en el diálogo New Dataset mediante un interruptor. Los conjuntos de datos públicos son visibles en la página Explore.

Editar conjunto de datos

Los metadatos del conjunto de datos se editan en línea directamente en la página del conjunto de datos; no se necesita ningún diálogo:

  • Nombre: Haz clic en el nombre del conjunto de datos para editarlo. Los cambios se guardan automáticamente al perder el foco o presionar Enter.
  • Descripción: Haz clic en la descripción (o en el marcador de posición "Add a description...") para editar. Los cambios se guardan automáticamente.
  • Tipo de tarea: Haz clic en la insignia de tarea para seleccionar un tipo de tarea diferente.
  • Licencia: Haz clic en el selector de licencias para cambiar la licencia del conjunto de datos.
Cambiar el tipo de tarea

Cada imagen almacena anotaciones para todos los tipos de tareas juntas. Cambiar el tipo de tarea del conjunto de datos controla qué anotaciones son visibles en el editor e incluidas en las exportaciones y el entrenamiento. Las anotaciones para otros tipos de tareas se conservan en la base de datos y vuelven a aparecer cuando cambias de nuevo.

Clonar conjunto de datos

Al ver un conjunto de datos público que no te pertenece, haz clic en Clone Dataset para crear una copia en tu espacio de trabajo. El clon incluye todas las imágenes, anotaciones y definiciones de clase. Si el conjunto de datos original tiene una licencia copyleft, el clon la hereda y el selector de licencias queda bloqueado.

Destacar y compartir

  • Destacar: Haz clic en el botón de estrella para marcar un conjunto de datos. El recuento de estrellas es visible para todos los usuarios.
  • Compartir: Para conjuntos de datos públicos, haz clic en el botón de compartir para copiar un enlace o compartir en plataformas sociales.

Eliminar conjunto de datos

Elimina un conjunto de datos que ya no necesites:

  1. Abre el menú de acciones del conjunto de datos
  2. Haz clic en Delete
  3. Confirma en el diálogo: "Esto moverá [name] a la papelera. Puedes restaurarlo dentro de 30 días."
Papelera y restauración

Los conjuntos de datos eliminados se mueven a la Papelera, no se borran permanentemente. Puedes restaurarlos en un plazo de 30 días desde Settings > Trash.

Entrenar con un conjunto de datos

Inicia el entrenamiento directamente desde tu conjunto de datos:

  1. Haz clic en New Model en la página del conjunto de datos
  2. Selecciona un proyecto o crea uno nuevo
  3. Configura los parámetros de entrenamiento
  4. Inicia el entrenamiento
graph LR
    A[Dataset] --> B[New Model]
    B --> C[Select Project]
    C --> D[Configure]
    D --> E[Start Training]

    style A fill:#2196F3,color:#fff
    style E fill:#4CAF50,color:#fff

Consulta Cloud Training para obtener más detalles.

Preguntas frecuentes

¿Qué ocurre con mis datos después de subirlos?

Tus datos se procesan y almacenan en la región que hayas seleccionado (EE. UU., UE o AP). Las imágenes son:

  1. Validadas por formato y tamaño
  2. Rechazadas si la dimensión mínima es inferior a 28px
  3. Normalizadas si son mayores de 4096px (preservando la relación de aspecto; codificadas para un almacenamiento optimizado)
  4. Almacenadas utilizando Almacenamiento Direccionable por Contenido (CAS, por sus siglas en inglés) con hashing XXH3-128
  5. Miniaturas generadas en WebP de 256px para una navegación rápida

¿Cómo funciona el almacenamiento?

La plataforma Ultralytics utiliza Content-Addressable Storage (CAS) para un almacenamiento eficiente:

  • Deduplicación: Las imágenes idénticas subidas por distintos usuarios se almacenan una sola vez
  • Integridad: El hashing XXH3-128 garantiza la integridad de los datos
  • Eficiencia: Reduce los costes de almacenamiento y acelera el procesamiento
  • Regional: Los datos permanecen en la región que hayas seleccionado (EE. UU., UE o AP)

¿Puedo añadir imágenes a un conjunto de datos existente?

Sí, arrastra y suelta archivos en la página del conjunto de datos o utiliza el botón de subida para añadir más imágenes. Las nuevas estadísticas se calcularán automáticamente.

¿Cómo muevo imágenes entre divisiones?

Utiliza la función de movimiento masivo a una división:

  1. Selecciona las imágenes en la vista de tabla
  2. Haz clic derecho y elige Move to split
  3. Selecciona la división de destino (Train, Validation o Test)

¿Qué formatos de etiquetas son compatibles?

La plataforma Ultralytics es compatible con etiquetas YOLO, COCO JSON, Ultralytics NDJSON y subidas de imágenes sin procesar:

Un archivo .txt por imagen con coordenadas normalizadas (rango 0-1):

TareaFormatoEjemplo
Detectarclass cx cy w h0 0.5 0.5 0.2 0.3
Segmentarclass x1 y1 x2 y2 ...0 0.1 0.1 0.9 0.1 0.9 0.9
Poseclass cx cy w h kx1 ky1 v1 ...0 0.5 0.5 0.2 0.3 0.6 0.7 2
OBBclass x1 y1 x2 y2 x3 y3 x4 y40 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9
ClasificarEstructura de directoriostrain/cats/, train/dogs/

Marcadores de visibilidad de pose: 0=no etiquetado, 1=etiquetado pero ocluido, 2=etiquetado y visible.

¿Puedo anotar el mismo conjunto de datos para múltiples tipos de tareas?

Sí. Cada imagen almacena anotaciones para los 5 tipos de tareas (detectar, segmentar, pose, OBB, clasificar) conjuntamente. Puedes cambiar el tipo de tarea activa del conjunto de datos en cualquier momento sin perder las anotaciones existentes. Solo las anotaciones que coinciden con el tipo de tarea activo se muestran en el editor y se incluyen en las exportaciones y el entrenamiento; las anotaciones para otras tareas se conservan y reaparecen cuando vuelves a cambiar.

Comentarios