Datasets
Los datasets de Ultralytics Platform ofrecen una solución optimizada para gestionar tus datos de entrenamiento. Tras la carga, la plataforma procesa automáticamente las imágenes, las etiquetas y las estadísticas. Un dataset está listo para entrenar una vez que el procesamiento ha finalizado y cuenta con al menos una imagen en la partición train, al menos una imagen en la partición val o test, al menos una imagen etiquetada y un total de al menos dos imágenes.
Subir dataset
Ultralytics Platform acepta múltiples formatos de carga para ofrecerte flexibilidad.
Formatos compatibles
| Formato | Extensiones | Notas | Tamaño máx. |
|---|---|---|---|
| JPEG | .jpg, .jpeg | Más comunes, recomendados | 50 MB |
| PNG | .png | Admite transparencia | 50 MB |
| WebP | .webp | Moderno, buena compresión | 50 MB |
| BMP | .bmp | Sin comprimir | 50 MB |
| TIFF | .tiff, .tif | Alta calidad | 50 MB |
| HEIC | .heic | Fotos de iPhone | 50 MB |
| AVIF | .avif | Formato de nueva generación | 50 MB |
| JP2 | .jp2 | JPEG 2000 | 50 MB |
| DNG | .dng | Cámara Raw | 50 MB |
| MPO | .mpo | Objeto multi-imagen | 50 MB |
Preparación de tu dataset
La plataforma admite Ultralytics YOLO, COCO, Ultralytics NDJSON y cargas sin procesar (sin anotar):
Utiliza la estructura de directorios estándar de YOLO con un archivo data.yaml:
my-dataset/
├── images/
│ ├── train/
│ │ ├── img001.jpg
│ │ └── img002.jpg
│ └── val/
│ ├── img003.jpg
│ └── img004.jpg
├── labels/
│ ├── train/
│ │ ├── img001.txt
│ │ └── img002.txt
│ └── val/
│ ├── img003.txt
│ └── img004.txt
└── data.yamlEl archivo YAML define la configuración de tu dataset:
# data.yaml
path: .
train: images/train
val: images/val
names:
0: person
1: car
2: dogRaw: Sube imágenes sin anotar (sin etiquetas). Es útil cuando planeas anotar directamente en la plataforma usando el editor de anotaciones.
También puedes subir imágenes sin carpetas de partición explícitas. La plataforma respeta el destino de partición activo durante la carga y, para datasets que no sean de clasificación, puede crear automáticamente una partición de validación a partir de una parte del conjunto de entrenamiento cuando no se proporciona información de partición. Siempre puedes reasignar imágenes más tarde mediante el movimiento masivo a particiones o la redistribución de particiones.
El formato se detecta automáticamente: los datasets con un archivo data.yaml que contenga claves names, train o val se tratan como YOLO. Los datasets con archivos JSON de COCO (que contengan matrices de images, annotations y categories) se tratan como COCO. Las exportaciones .ndjson se importan como Ultralytics NDJSON. Los datasets que solo tienen imágenes y no tienen anotaciones se tratan como raw.
Para obtener detalles de formato específicos de la tarea, consulta tareas admitidas y la Descripción general de datasets.
Proceso de carga
- Navega a
Datasetsen la barra lateral - Haz clic en
New Dataset(Nuevo dataset) o arrastra archivos a la zona de carga - Selecciona el tipo de tarea (consulta tareas admitidas)
- Añade un nombre y una descripción opcional
- Establece la visibilidad (pública o privada) y una licencia opcional (consulta licencias disponibles)
- Haz clic en
Create(Crear)

Tras la carga, la plataforma procesa tus datos a través de una pipeline multietapa:
graph LR
A[Upload] --> B[Validate]
B --> C[Normalize]
C --> D[Thumbnail]
D --> E[Parse Labels]
E --> F[Statistics]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#2196F3,color:#fff
style D fill:#2196F3,color:#fff
style E fill:#2196F3,color:#fff
style F fill:#9C27B0,color:#fff- Validación: comprobaciones de formato y tamaño
- Normalización: redimensionamiento de imágenes grandes (máx. 4096 px, dimensión mínima 28 px)
- Miniaturas: generación de vistas previas WebP de 256 px
- Análisis de etiquetas: extracción de etiquetas en formato YOLO y COCO
- Estadísticas: cálculo de las distribuciones de clases y las dimensiones de las imágenes

Validar antes de subir
Puedes validar tu dataset localmente antes de subirlo:
from ultralytics.data.utils import check_det_dataset
check_det_dataset("path/to/data.yaml")Las imágenes deben tener al menos 28 px en su lado más corto. Las imágenes más pequeñas son rechazadas durante el procesamiento. Las imágenes de más de 4096 px en su lado más largo se redimensionan automáticamente manteniendo la relación de aspecto.
Explorar imágenes
Visualiza las imágenes de tu dataset en varios diseños.
Abre el panel Clustering desde la barra de herramientas de la galería para explorar tu dataset como un gráfico de dispersión 2D interactivo.
| Vista | Descripción |
|---|---|
| Cuadrícula (Grid) | Cuadrícula de miniaturas con superposiciones de anotaciones (predeterminado) |
| Compacta | Miniaturas más pequeñas para un escaneo rápido |
| Tabla | Lista con miniatura, nombre de archivo, dimensiones, tamaño, partición, clases y recuento de etiquetas |

Clasificación y filtrado
Las imágenes se pueden clasificar y filtrar para una navegación eficiente:
| Ordenar | Descripción |
|---|---|
| Más reciente / Más antiguo | Orden de carga / creación |
| Nombre A-Z / Z-A | Nombre de archivo alfabéticamente |
| Altura ↑/↓ | Altura de la imagen en píxeles |
| Ancho ↑/↓ | Ancho de la imagen en píxeles |
| Tamaño ↑/↓ | Tamaño del archivo en disco |
| Anotaciones ↑/↓ | Recuento de anotaciones por imagen |
Para datasets de más de 100.000 imágenes, las ordenaciones por nombre / tamaño / ancho / altura están desactivadas para mantener la galería fluida. Las ordenaciones por más reciente, más antiguo y recuento de anotaciones siguen estando disponibles.
Usa el filtro de etiquetas establecido en Unlabeled (Sin etiquetar) para encontrar rápidamente imágenes que aún necesitan ser anotadas. Esto es especialmente útil para datasets grandes donde deseas hacer un seguimiento del progreso del etiquetado.
Visor en pantalla completa
Haz clic en cualquier imagen para abrir el visor en pantalla completa con:
- Navegación: Teclas de flecha o vistas previas en miniatura para explorar
- Metadatos: Nombre de archivo, dimensiones, insignia de división, recuento de anotaciones
- Anotaciones: Alternar la visibilidad de la capa de anotaciones
- Desglose por clases: Recuentos de etiquetas por clase con indicadores de color
- Editar: Entra en el modo de anotación para añadir o modificar etiquetas
- Descargar: Descarga el archivo de imagen original
- Eliminar: Elimina la imagen del dataset
- Zoom:
Cmd/Ctrl+Scroll,Cmd/Ctrl++oCmd/Ctrl+=para acercar, yCmd/Ctrl+-para alejar - Restablecer vista:
Cmd/Ctrl + 0o el botón de restablecer para ajustar la imagen al visor - Desplazamiento (Pan): Mantén presionada la tecla
Space(Espacio) y arrastra para mover el lienzo cuando hayas hecho zoom - Vista de píxeles: Alterna la renderización pixelada para una inspección detallada

Filtrar por división
Filtrar imágenes según su división del dataset:
| Split (División) | Propósito |
|---|---|
| Entrenar | Utilizado para el entrenamiento del modelo |
| Val | Utilizado para la validación durante el entrenamiento |
| Test | Utilizado para la evaluación final |
Agrupamiento (Clustering)
El panel Clustering proyecta tu dataset en un gráfico de dispersión 2D interactivo donde las imágenes visualmente similares aparecen juntas. Úsalo para revelar grupos, detectar duplicados y valores atípicos, e inspeccionar cómo se distribuyen las divisiones o las clases en tus datos, todo sin salir de la galería. Ábrelo desde el icono del gráfico de dispersión en la barra de herramientas de la galería en cualquier página de dataset.

Ejecución del análisis
Iniciar un análisis:
- Abre un dataset y haz clic en el icono del gráfico de dispersión en la barra de herramientas de la galería
- Haz clic en
Analyze Dataset - Espera a que finalice la barra de progreso; los resultados aparecerán en el mismo panel
El análisis se ejecuta en segundo plano y puede tardar unos minutos dependiendo del tamaño de tu dataset. Puedes cerrar el panel o salir de la página y volver más tarde.
Visualización
Una vez completado el análisis, el panel muestra un gráfico de dispersión 2D de todas las imágenes analizadas. Los filtros de la galería (división, clase, etiquetado/sin etiquetar) atenúan los puntos que quedan fuera del filtro para que puedas centrarte en el subconjunto que te interesa.

Colorear por
Cambia la forma en que se sombrean los puntos de datos con el menú desplegable Color by en la barra de herramientas del panel. Cambia los modos de visualización en cualquier momento: el gráfico vuelve a colorearse al instante para que puedas ver cómo se distribuyen las divisiones, las clases o las propiedades de las imágenes en tus grupos:
| Opción | Sombreado |
|---|---|
| Splits (Divisiones) | Train / Val / Test |
| Clases | Primera clase de anotación en cada imagen |
| Width (Ancho) | Ancho de la imagen |
| Height (Altura) | Altura de la imagen |
| Size (Tamaño) | Tamaño del archivo |
| Anotaciones | Número de anotaciones por imagen |

Selección con lazo
Dibuja una selección de forma libre alrededor de una región para resaltar puntos en el gráfico. La galería filtra las imágenes coincidentes para que puedas inspeccionarlas, volver a etiquetarlas, moverlas o eliminarlas usando las operaciones de imagen habituales.
Un distintivo sobre el gráfico muestra cuántos puntos hay seleccionados; haz clic en la × para borrar el lazo y volver a la vista completa de la galería.
Desplazamiento y Zoom
Navega por grandes dispersiones directamente desde tu ratón y teclado:
| Entrada | Acción |
|---|---|
| Scroll (Desplazamiento) | Mover el gráfico en 2D |
| Cmd/Ctrl+Scroll | Acercar o alejar, anclado al cursor |
| Mantener Space (Espacio) | Cambiar al modo de arrastrar para desplazar |
Reanálisis
Si tu dataset cambia después del análisis, aparece un botón Re-analyze en la parte superior del panel para propietarios y editores.
Haz clic en Re-analyze para volver a calcular las incrustaciones y la proyección 2D desde cero.
Pestañas del conjunto de datos
Cada página de dataset puede mostrar hasta seis pestañas, dependiendo del estado del dataset y tus permisos:
Pestaña Imágenes
La vista predeterminada que muestra la galería de imágenes con superposiciones de anotaciones. Admite modos de vista de cuadrícula, compacta y tabla. Arrastra y suelta archivos aquí para añadir más imágenes.
Pestaña Clases
Esta pestaña aparece cuando el dataset contiene imágenes.
Gestiona las clases de anotación para tu dataset:
- Histograma de clases: Gráfico de barras que muestra el recuento de anotaciones por clase con alternancia de escala lineal/logarítmica
- Tabla de clases: Tabla ordenable y buscable con nombre de clase, recuento de etiquetas y recuento de imágenes
- Editar nombres de clases: Haz clic en cualquier nombre de clase para renombrarlo en línea
- Editar colores de clases: Haz clic en una muestra de color para cambiar el color de la clase
- Añadir nueva clase: Usa la entrada en la parte inferior para añadir clases

Si tu dataset tiene un desequilibrio de clases (por ejemplo, 10.000 anotaciones de "persona" pero solo 50 de "bicicleta"), usa la opción Log Scale en el histograma de clases para visualizar todas las clases con claridad.
Pestaña de gráficos
Esta pestaña aparece cuando el dataset contiene imágenes.
Estadísticas automáticas calculadas a partir de tu dataset:
| Gráfico | Descripción |
|---|---|
| Distribución de conjuntos | Gráfico de anillos con el recuento de imágenes de entrenamiento/validación/prueba y el porcentaje etiquetado |
| Clases principales | Gráfico de anillos de las 10 clases de anotación más frecuentes |
| Anchuras de imagen | Histograma de la distribución de la anchura de las imágenes con la media |
| Alturas de imagen | Histograma de la distribución de la altura de las imágenes con la media |
| Puntos por instancia | Recuento de vértices de polígonos o puntos clave por anotación (segmento/pose) |
| Ubicaciones de las anotaciones | Mapa de calor 2D de las posiciones centrales de los BBox |
| Dimensiones de imagen | Mapa de calor 2D de anchura frente a altura con líneas guía de relación de aspecto |

Las estadísticas se almacenan en caché durante 5 minutos. Los cambios en las anotaciones se reflejarán una vez que expire la caché.
Haz clic en el botón de ampliar en cualquier mapa de calor para verlo en modo de pantalla completa. Esto proporciona una vista más grande y detallada, útil para comprender los patrones espaciales en datasets grandes.
Pestaña de modelos
Visualiza todos los modelos entrenados con este dataset en una tabla con función de búsqueda:
| Columna | Descripción |
|---|---|
| Nombre | Nombre del modelo con enlace |
| Proyecto | Proyecto padre con icono |
| Estado | Insignia de estado de entrenamiento |
| Tarea | Tipo de tarea YOLO |
| Épocas | Mejor época / total de épocas |
| mAP50-95 | Precisión media promedio |
| mAP50 | mAP con IoU 0.50 |
| Creado | Fecha de creación |

Pestaña de errores
Esta pestaña aparece solo cuando uno o varios archivos fallan en el procesamiento.
Las imágenes que fallaron al procesarse se enumeran aquí con:
- Banner de error: recuento total de imágenes fallidas y guía
- Tabla de errores: nombre del archivo, descripción del error fácil de entender, sugerencias de solución y miniatura de vista previa
- Los errores comunes incluyen archivos dañados, formatos no compatibles, imágenes demasiado pequeñas (mín. 28px) y modos de color no compatibles

Errores de procesamiento comunes
| Error | Causa | Solución |
|---|---|---|
| No se puede leer el archivo de imagen | Formato dañado o no compatible | Vuelve a exportar desde el editor de imágenes |
| Incompleto o dañado | El archivo se truncó durante la transferencia | Vuelve a descargar el archivo original |
| Imagen demasiado pequeña | Dimensión mínima inferior a 28px | Usa imágenes de origen con mayor resolución |
| Modo de color no compatible | Modo de color CMYK o indexado | Convierte al modo RGB |
Pestaña de versiones
Crea instantáneas NDJSON inmutables de tu dataset para un entrenamiento reproducible. Cada versión captura el recuento de imágenes, el recuento de clases, el recuento de anotaciones y el tamaño del archivo en el momento de la creación.
| Columna | Descripción |
|---|---|
| Versión | Número de versión (v1, v2, ...) |
| Descripción | Descripción proporcionada por el usuario (editable) |
| Imágenes | Recuento de imágenes en el momento de la instantánea |
| Clases | Recuento de clases en el momento de la instantánea |
| Anotaciones | Recuento de anotaciones en el momento de la instantánea |
| Tamaño | Tamaño del archivo de exportación NDJSON |
| Creado | Cuándo se creó la versión |
Para crear una versión:
- Abre la pestaña Versiones
- Opcionalmente, introduce una descripción (p. ej., "Añadidas 500 imágenes de entrenamiento" o "Corregidas clases mal etiquetadas")
- Haz clic en + Nueva versión
- La nueva versión aparece en la tabla
- Descarga la versión por separado desde la tabla cuando lo necesites
Cada versión se numera secuencialmente (v1, v2, v3...) y se almacena de forma permanente. Puedes descargar cualquier versión anterior en cualquier momento desde la tabla de versiones.
La creación de versiones está disponible una vez que el dataset alcanza el estado ready.
Crea una versión antes y después de cambios importantes en tu dataset, como añadir imágenes, corregir anotaciones o reequilibrar conjuntos. Esto te permite comparar el rendimiento del modelo a través de diferentes estados del dataset.
El tamaño mostrado es el tamaño del archivo de exportación NDJSON, que contiene URLs de imágenes y anotaciones, no las imágenes en sí. Los datos reales de las imágenes se almacenan por separado y se accede a ellos a través de URLs firmadas.
Exportar dataset
Exporta tu dataset para uso sin conexión con una descarga NDJSON desde el encabezado del dataset o la pestaña Versiones.
Para exportar:
- Haz clic en el botón Exportar en el encabezado del dataset
- Descarga la instantánea NDJSON actual directamente
- Usa la pestaña Versiones cuando quieras una instantánea numerada inmutable que puedas volver a descargar más tarde

El formato NDJSON almacena un objeto JSON por línea. La primera línea contiene los metadatos del dataset, seguida de una línea por imagen:
{"type": "dataset", "task": "detect", "name": "my-dataset", "description": "...", "url": "https://platform.ultralytics.com/...", "class_names": {"0": "person", "1": "car"}, "version": 1, "created_at": "2026-01-15T10:00:00Z", "updated_at": "2026-02-20T14:30:00Z"}
{"type": "image", "file": "img001.jpg", "url": "https://...", "width": 640, "height": 480, "split": "train", "annotations": {"boxes": [[0, 0.5, 0.5, 0.2, 0.3]]}}
{"type": "image", "file": "img002.jpg", "url": "https://...", "width": 1280, "height": 720, "split": "val"}Las URLs de las imágenes en el NDJSON exportado están firmadas y son válidas durante 7 días. Si necesitas URLs nuevas, vuelve a exportar el dataset o crea una versión nueva.
Consulta la documentación del formato NDJSON de Ultralytics para ver la especificación completa.
Operaciones de imagen
Acciones rápidas
Haz clic derecho en cualquier imagen en la vista Cuadrícula o Compacta para acceder a acciones rápidas:
| Acción | Descripción |
|---|---|
| Mover a conjunto | Reasigna la imagen a la partición Train, Val o Test |
| Descargar | Descarga el archivo de imagen original |
| Eliminar | Elimina la imagen del conjunto de datos |

El menú contextual de imágenes funciona sobre una única imagen. Para operaciones masivas en varias imágenes, usa la vista de Tabla con selección mediante casillas de verificación.
Mover a partición de forma masiva
Reasigna las imágenes seleccionadas a una partición diferente dentro del mismo conjunto de datos:
- Cambia a la vista de Tabla
- Selecciona imágenes usando las casillas de verificación
- Haz clic derecho para abrir el menú contextual
- Elige
Move to split> Train, Validation o Test
También puedes arrastrar y soltar imágenes sobre las pestañas de filtro de particiones en la vista de cuadrícula.
Sube todas las imágenes a un conjunto de datos y luego usa el movimiento masivo a particiones para organizar los subconjuntos en particiones de entrenamiento, validación y prueba.
Redistribución de particiones
Redistribuye todas las imágenes entre las particiones de entrenamiento, validación y prueba usando proporciones personalizadas:
- Haz clic en la barra de particiones en la barra de herramientas del conjunto de datos para abrir el diálogo Redistribute Splits
- Ajusta los porcentajes de las particiones usando cualquiera de los métodos siguientes
- Revisa la vista previa del recuento de imágenes en tiempo real para confirmar la distribución
- Haz clic en Apply para reasignar aleatoriamente todas las imágenes según tus porcentajes

El diálogo proporciona tres formas de establecer las proporciones de partición objetivo:
| Método | Descripción |
|---|---|
| Arrastrar | Arrastra los controladores entre los segmentos de color para ajustar visualmente los límites de las particiones |
| Escribir | Edita el porcentaje de entrada para cualquier partición (las otras dos se reequilibran automáticamente de forma proporcional) |
| Auto | Un clic para establecer instantáneamente una partición 80/20 de entrenamiento/validación con la partición de prueba establecida en 0% |
Una vista previa en tiempo real muestra exactamente cuántas imágenes irán a cada partición antes de aplicar los cambios.
Haz clic en el botón Auto para establecer instantáneamente la partición recomendada 80/20 de entrenamiento/validación. Esta es la proporción más común para el entrenamiento.
Eliminación masiva
Elimina varias imágenes a la vez:
- Selecciona las imágenes en la vista de tabla
- Haz clic derecho y elige
Delete - Confirma la eliminación
URI del conjunto de datos
Haz referencia a los conjuntos de datos de la Platform usando el formato de URI ul:// (consulta Using Platform Datasets):
ul://username/datasets/dataset-slug
Usa esta URI para entrenar modelos desde cualquier lugar:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100La URI ul:// funciona desde cualquier entorno:
- Máquina local: Entrena en tu hardware, los datos se descargan automáticamente
- Google Colab: Accede a tus conjuntos de datos de la Platform en notebooks
- Servidores remotos: Entrena en máquinas virtuales en la nube con acceso total al conjunto de datos
Licencias disponibles
La Platform admite las siguientes licencias para los conjuntos de datos:
| Licencia | Tipo |
|---|---|
| Ninguna | Ninguna licencia seleccionada |
| CC0-1.0 | Dominio público |
| CC-BY-2.5 | Permisiva |
| CC-BY-4.0 | Permisiva |
| CC-BY-SA-4.0 | Copyleft |
| CC-BY-NC-4.0 | No comercial |
| CC-BY-NC-SA-4.0 | Copyleft |
| CC-BY-ND-4.0 | Sin derivados |
| CC-BY-NC-ND-4.0 | No comercial |
| Apache-2.0 | Permisiva |
| MIT | Permisiva |
| AGPL-3.0 | Copyleft |
| GPL-3.0 | Copyleft |
| Solo para investigación | Restringida |
| Otro | Personalizado |
Al clonar un conjunto de datos con una licencia copyleft (AGPL-3.0, GPL-3.0, CC-BY-SA-4.0, CC-BY-NC-SA-4.0), el clon hereda la licencia y el selector de licencias queda bloqueado.
Configuración de visibilidad
Controla quién puede ver tu conjunto de datos:
| Configuración | Descripción |
|---|---|
| Privado | Solo tú puedes acceder |
| Público | Cualquiera puede verlo en la página Explore |
La visibilidad se establece al crear un conjunto de datos en el diálogo New Dataset mediante un interruptor. Los conjuntos de datos públicos son visibles en la página Explore.
Editar conjunto de datos
Los metadatos del conjunto de datos se editan en línea directamente en la página del conjunto de datos; no se necesita ningún diálogo:
- Nombre: Haz clic en el nombre del conjunto de datos para editarlo. Los cambios se guardan automáticamente al perder el foco o presionar
Enter. - Descripción: Haz clic en la descripción (o en el marcador de posición "Add a description...") para editar. Los cambios se guardan automáticamente.
- Tipo de tarea: Haz clic en la insignia de tarea para seleccionar un tipo de tarea diferente.
- Licencia: Haz clic en el selector de licencias para cambiar la licencia del conjunto de datos.
Cada imagen almacena anotaciones para todos los tipos de tareas juntas. Cambiar el tipo de tarea del conjunto de datos controla qué anotaciones son visibles en el editor e incluidas en las exportaciones y el entrenamiento. Las anotaciones para otros tipos de tareas se conservan en la base de datos y vuelven a aparecer cuando cambias de nuevo.
Clonar conjunto de datos
Al ver un conjunto de datos público que no te pertenece, haz clic en Clone Dataset para crear una copia en tu espacio de trabajo. El clon incluye todas las imágenes, anotaciones y definiciones de clase. Si el conjunto de datos original tiene una licencia copyleft, el clon la hereda y el selector de licencias queda bloqueado.
Destacar y compartir
- Destacar: Haz clic en el botón de estrella para marcar un conjunto de datos. El recuento de estrellas es visible para todos los usuarios.
- Compartir: Para conjuntos de datos públicos, haz clic en el botón de compartir para copiar un enlace o compartir en plataformas sociales.
Eliminar conjunto de datos
Elimina un conjunto de datos que ya no necesites:
- Abre el menú de acciones del conjunto de datos
- Haz clic en
Delete - Confirma en el diálogo: "Esto moverá [name] a la papelera. Puedes restaurarlo dentro de 30 días."
Los conjuntos de datos eliminados se mueven a la Papelera, no se borran permanentemente. Puedes restaurarlos en un plazo de 30 días desde Settings > Trash.
Entrenar con un conjunto de datos
Inicia el entrenamiento directamente desde tu conjunto de datos:
- Haz clic en
New Modelen la página del conjunto de datos - Selecciona un proyecto o crea uno nuevo
- Configura los parámetros de entrenamiento
- Inicia el entrenamiento
graph LR
A[Dataset] --> B[New Model]
B --> C[Select Project]
C --> D[Configure]
D --> E[Start Training]
style A fill:#2196F3,color:#fff
style E fill:#4CAF50,color:#fffConsulta Cloud Training para obtener más detalles.
Preguntas frecuentes
¿Qué ocurre con mis datos después de subirlos?
Tus datos se procesan y almacenan en la región que hayas seleccionado (EE. UU., UE o AP). Las imágenes son:
- Validadas por formato y tamaño
- Rechazadas si la dimensión mínima es inferior a 28px
- Normalizadas si son mayores de 4096px (preservando la relación de aspecto; codificadas para un almacenamiento optimizado)
- Almacenadas utilizando Almacenamiento Direccionable por Contenido (CAS, por sus siglas en inglés) con hashing XXH3-128
- Miniaturas generadas en WebP de 256px para una navegación rápida
¿Cómo funciona el almacenamiento?
La plataforma Ultralytics utiliza Content-Addressable Storage (CAS) para un almacenamiento eficiente:
- Deduplicación: Las imágenes idénticas subidas por distintos usuarios se almacenan una sola vez
- Integridad: El hashing XXH3-128 garantiza la integridad de los datos
- Eficiencia: Reduce los costes de almacenamiento y acelera el procesamiento
- Regional: Los datos permanecen en la región que hayas seleccionado (EE. UU., UE o AP)
¿Puedo añadir imágenes a un conjunto de datos existente?
Sí, arrastra y suelta archivos en la página del conjunto de datos o utiliza el botón de subida para añadir más imágenes. Las nuevas estadísticas se calcularán automáticamente.
¿Cómo muevo imágenes entre divisiones?
Utiliza la función de movimiento masivo a una división:
- Selecciona las imágenes en la vista de tabla
- Haz clic derecho y elige
Move to split - Selecciona la división de destino (Train, Validation o Test)
¿Qué formatos de etiquetas son compatibles?
La plataforma Ultralytics es compatible con etiquetas YOLO, COCO JSON, Ultralytics NDJSON y subidas de imágenes sin procesar:
Un archivo .txt por imagen con coordenadas normalizadas (rango 0-1):
| Tarea | Formato | Ejemplo |
|---|---|---|
| Detectar | class cx cy w h | 0 0.5 0.5 0.2 0.3 |
| Segmentar | class x1 y1 x2 y2 ... | 0 0.1 0.1 0.9 0.1 0.9 0.9 |
| Pose | class cx cy w h kx1 ky1 v1 ... | 0 0.5 0.5 0.2 0.3 0.6 0.7 2 |
| OBB | class x1 y1 x2 y2 x3 y3 x4 y4 | 0 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9 |
| Clasificar | Estructura de directorios | train/cats/, train/dogs/ |
Marcadores de visibilidad de pose: 0=no etiquetado, 1=etiquetado pero ocluido, 2=etiquetado y visible.
¿Puedo anotar el mismo conjunto de datos para múltiples tipos de tareas?
Sí. Cada imagen almacena anotaciones para los 5 tipos de tareas (detectar, segmentar, pose, OBB, clasificar) conjuntamente. Puedes cambiar el tipo de tarea activa del conjunto de datos en cualquier momento sin perder las anotaciones existentes. Solo las anotaciones que coinciden con el tipo de tarea activo se muestran en el editor y se incluyen en las exportaciones y el entrenamiento; las anotaciones para otras tareas se conservan y reaparecen cuando vuelves a cambiar.