Link to this sectionPreparación de datos#
La preparación de datos es la base de unos modelos de computer vision exitosos. Ultralytics Platform ofrece herramientas integrales para gestionar tus datos de entrenamiento, desde la carga y el etiquetado hasta el análisis.
Watch: Get Started with Ultralytics Platform - Data
Link to this sectionDescripción general#
La sección de datos de Ultralytics Platform te ayuda a:
- Subir imágenes, vídeos y archivos de conjuntos de datos (ZIP, TAR incluyendo
.tar.gz/.tgz, NDJSON) - Etiquetar con herramientas de dibujo manual y etiquetado inteligente basado en SAM: elige entre SAM 2.1 o el nuevo SAM 3
- Analizar tus datos con estadísticas y visualizaciones
- Exportar en formato NDJSON para el entrenamiento local

Link to this sectionFlujo de trabajo#
graph LR
A[Upload]:::start --> B[Annotate]:::proc
B --> C[Analyze]:::proc
C --> D[Train]:::out
classDef start fill:#4CAF50,color:#fff
classDef proc fill:#2196F3,color:#fff
classDef out fill:#9C27B0,color:#fff| Etapa | Descripción |
|---|---|
| Subida | Importa imágenes, vídeos o archivos con procesamiento automático |
| Anotar | Etiqueta datos con herramientas manuales para los 6 tipos de tareas, o usa el etiquetado SAM para detect, segment, semantic y OBB |
| Analizar | Visualiza distribuciones de clases, mapas de calor espaciales y estadísticas de dimensiones |
| Exportar | Descarga en formato NDJSON para uso sin conexión |
Link to this sectionTareas compatibles#
Ultralytics Platform admite los 6 tipos de tareas de YOLO:
| Tarea | Descripción | Herramienta de etiquetado |
|---|---|---|
| Detect | Detección de objetos con bounding boxes | Herramienta de rectángulo |
| Segment | Segmentación de instancias con máscaras de píxeles | Herramienta de polígono |
| Semantic | Segmentación semántica con regiones de píxeles por clase | Herramienta de polígono |
| Pose | Estimación de puntos clave con plantillas de esqueleto integradas y personalizadas | Herramienta de puntos clave |
| OBB | Oriented bounding boxes para objetos rotados | Herramienta de caja orientada |
| Classify | Clasificación a nivel de imagen | Selector de clase |
El tipo de tarea se define al crear un conjunto de datos y determina qué herramientas de etiquetado están disponibles. Puedes cambiarlo más adelante desde el selector de tareas en la cabecera del conjunto de datos, pero las anotaciones incompatibles no se mostrarán después del cambio.
Link to this sectionCaracterísticas clave#
Link to this sectionAlmacenamiento inteligente#
Ultralytics Platform utiliza el almacenamiento direccionable por contenido (CAS) para una gestión eficiente de los datos:
- Deduplicación: Las imágenes idénticas se almacenan una sola vez mediante el hashing XXH3-128
- Integridad: El direccionamiento basado en hash garantiza la integridad de los datos
- Eficiencia: Almacenamiento optimizado y procesamiento rápido
Link to this sectionURI de conjuntos de datos#
Haz referencia a conjuntos de datos usando el formato de URI ul:// (consulta Uso de conjuntos de datos en la plataforma):
yolo train data=ul://username/datasets/my-datasetEsto permite entrenar con los conjuntos de datos de la plataforma desde cualquier máquina que tenga configurada tu API key.
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)Link to this sectionControl de versiones de conjuntos de datos#
Crea instantáneas inmutables en formato NDJSON de tu conjunto de datos para un entrenamiento reproducible. Cada versión captura el número de imágenes, el número de clases y el número de anotaciones en el momento de la creación. Consulta la pestaña de versiones para más detalles.
Link to this sectionPestañas de Dataset#
Las páginas de conjuntos de datos pueden mostrar hasta seis pestañas, dependiendo del estado del conjunto de datos y tus permisos:
| Pestaña | Descripción |
|---|---|
| Imágenes | Explora imágenes en vista de cuadrícula, compacta o tabla con superposiciones de anotaciones |
| Clases | Visualiza y edita los nombres de clase, colores y número de etiquetas por clase |
| Gráficos | Estadísticas automáticas: distribución de divisiones, número de clases, mapas de calor |
| Modelos | Modelos entrenados con este conjunto de datos, incluyendo métricas y estado |
| Versiones | Crea y descarga instantáneas NDJSON inmutables para un entrenamiento reproducible |
| Errores | Imágenes que fallaron en el procesamiento, junto con detalles del error y guía de reparación |
Classes y Charts aparecen cuando el conjunto de datos contiene imágenes. Errors solo aparece si existen fallos en el procesamiento. Versions aparece para los propietarios, o para usuarios sin permisos de propietario cuando ya existen versiones.
Link to this sectionAgrupamiento (Clustering)#
Explora tu conjunto de datos como un gráfico de dispersión 2D interactivo donde las imágenes visualmente similares aparecen cerca — útil para detectar grupos, duplicados y valores atípicos, así como para inspeccionar cómo se distribuyen las divisiones o clases a través de tus datos. Selecciona con el lazo una región del gráfico para filtrar la galería a esas imágenes. Consulta Clustering para más detalles.
Link to this sectionEstadísticas y visualización#
La pestaña Charts proporciona un análisis automático que incluye:
- Distribución de la división: Gráfico de anillos con el número de imágenes de entrenamiento/validación/test
- Clases principales: Gráfico de anillos de las clases de anotación más frecuentes
- Dimensiones de imagen: Histograma de la distribución de anchura y altura de la imagen (en píxeles)
- Puntos por instancia: Distribución de vértices de polígono o recuento de puntos clave (conjuntos de datos de segment/pose)
- Ubicaciones de anotación: Mapa de calor 2D de las posiciones centrales de las bounding boxes
- Dimensiones de imagen 2D: Mapa de calor 2D de anchura frente a altura con líneas guía de relación de aspecto
Link to this sectionEnlaces rápidos#
- Conjuntos de datos: Sube, gestiona y exporta tus datos de entrenamiento
- Anotación: Etiqueta datos con herramientas manuales y asistidas por IA
- Entrenamiento en la nube: Entrena modelos con tus conjuntos de datos anotados
- URI de conjunto de datos: Usa URIs
ul://para entrenar desde cualquier lugar
Link to this sectionFAQ#
Link to this section¿Qué formatos de archivo se admiten para la carga?#
Ultralytics Platform admite:
Imágenes: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (máximo 50 MB cada una)
Vídeos: MP4, WebM, MOV, MKV, M4V (máx. 1 GB, fotogramas extraídos a 1 FPS, máx. 100 fotogramas)
Archivos de conjunto de datos: Archivos ZIP o TAR incluyendo .tar.gz y .tgz (máximo 10 GB en Free, 20 GB en Pro, 50 GB en Enterprise) que contengan imágenes con etiquetas opcionales en formato YOLO, además de exportaciones NDJSON
Link to this section¿Cuál es el tamaño máximo del conjunto de datos?#
Los límites de almacenamiento dependen de tu plan:
| Plan | Límite de almacenamiento |
|---|---|
| Gratuito | 100 GB |
| Pro | 500 GB |
| Enterprise | Ilimitado |
Límites por archivo individual: Imágenes 50 MB, vídeos 1 GB, conjuntos de datos 10 GB en Free / 20 GB en Pro / 50 GB en Enterprise
Link to this section¿Puedo usar mis conjuntos de datos de la plataforma para entrenamiento local?#
¡Sí! Utiliza el formato URI del conjunto de datos para entrenar localmente:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100O exporta tu conjunto de datos en formato NDJSON para un entrenamiento totalmente sin conexión.