Meet YOLO26: next-gen vision AI.

Link to this sectionPreparación de datos#

La preparación de datos es la base de unos modelos de computer vision exitosos. Ultralytics Platform ofrece herramientas integrales para gestionar tus datos de entrenamiento, desde la carga y el etiquetado hasta el análisis.



Watch: Get Started with Ultralytics Platform - Data

Link to this sectionDescripción general#

La sección de datos de Ultralytics Platform te ayuda a:

  • Subir imágenes, vídeos y archivos de conjuntos de datos (ZIP, TAR incluyendo .tar.gz/.tgz, NDJSON)
  • Etiquetar con herramientas de dibujo manual y etiquetado inteligente basado en SAM: elige entre SAM 2.1 o el nuevo SAM 3
  • Analizar tus datos con estadísticas y visualizaciones
  • Exportar en formato NDJSON para el entrenamiento local

Ultralytics Platform Data Overview Sidebar Datasets

Link to this sectionFlujo de trabajo#

graph LR
    A[Upload]:::start --> B[Annotate]:::proc
    B --> C[Analyze]:::proc
    C --> D[Train]:::out

    classDef start fill:#4CAF50,color:#fff
    classDef proc fill:#2196F3,color:#fff
    classDef out fill:#9C27B0,color:#fff
EtapaDescripción
SubidaImporta imágenes, vídeos o archivos con procesamiento automático
AnotarEtiqueta datos con herramientas manuales para los 6 tipos de tareas, o usa el etiquetado SAM para detect, segment, semantic y OBB
AnalizarVisualiza distribuciones de clases, mapas de calor espaciales y estadísticas de dimensiones
ExportarDescarga en formato NDJSON para uso sin conexión

Link to this sectionTareas compatibles#

Ultralytics Platform admite los 6 tipos de tareas de YOLO:

TareaDescripciónHerramienta de etiquetado
DetectDetección de objetos con bounding boxesHerramienta de rectángulo
SegmentSegmentación de instancias con máscaras de píxelesHerramienta de polígono
SemanticSegmentación semántica con regiones de píxeles por claseHerramienta de polígono
PoseEstimación de puntos clave con plantillas de esqueleto integradas y personalizadasHerramienta de puntos clave
OBBOriented bounding boxes para objetos rotadosHerramienta de caja orientada
ClassifyClasificación a nivel de imagenSelector de clase
Selección del tipo de tarea

El tipo de tarea se define al crear un conjunto de datos y determina qué herramientas de etiquetado están disponibles. Puedes cambiarlo más adelante desde el selector de tareas en la cabecera del conjunto de datos, pero las anotaciones incompatibles no se mostrarán después del cambio.

Link to this sectionCaracterísticas clave#

Link to this sectionAlmacenamiento inteligente#

Ultralytics Platform utiliza el almacenamiento direccionable por contenido (CAS) para una gestión eficiente de los datos:

  • Deduplicación: Las imágenes idénticas se almacenan una sola vez mediante el hashing XXH3-128
  • Integridad: El direccionamiento basado en hash garantiza la integridad de los datos
  • Eficiencia: Almacenamiento optimizado y procesamiento rápido

Link to this sectionURI de conjuntos de datos#

Haz referencia a conjuntos de datos usando el formato de URI ul:// (consulta Uso de conjuntos de datos en la plataforma):

yolo train data=ul://username/datasets/my-dataset

Esto permite entrenar con los conjuntos de datos de la plataforma desde cualquier máquina que tenga configurada tu API key.

Usa los datos de la plataforma desde Python
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

Link to this sectionControl de versiones de conjuntos de datos#

Crea instantáneas inmutables en formato NDJSON de tu conjunto de datos para un entrenamiento reproducible. Cada versión captura el número de imágenes, el número de clases y el número de anotaciones en el momento de la creación. Consulta la pestaña de versiones para más detalles.

Link to this sectionPestañas de Dataset#

Las páginas de conjuntos de datos pueden mostrar hasta seis pestañas, dependiendo del estado del conjunto de datos y tus permisos:

PestañaDescripción
ImágenesExplora imágenes en vista de cuadrícula, compacta o tabla con superposiciones de anotaciones
ClasesVisualiza y edita los nombres de clase, colores y número de etiquetas por clase
GráficosEstadísticas automáticas: distribución de divisiones, número de clases, mapas de calor
ModelosModelos entrenados con este conjunto de datos, incluyendo métricas y estado
VersionesCrea y descarga instantáneas NDJSON inmutables para un entrenamiento reproducible
ErroresImágenes que fallaron en el procesamiento, junto con detalles del error y guía de reparación

Classes y Charts aparecen cuando el conjunto de datos contiene imágenes. Errors solo aparece si existen fallos en el procesamiento. Versions aparece para los propietarios, o para usuarios sin permisos de propietario cuando ya existen versiones.

Link to this sectionAgrupamiento (Clustering)#

Explora tu conjunto de datos como un gráfico de dispersión 2D interactivo donde las imágenes visualmente similares aparecen cerca — útil para detectar grupos, duplicados y valores atípicos, así como para inspeccionar cómo se distribuyen las divisiones o clases a través de tus datos. Selecciona con el lazo una región del gráfico para filtrar la galería a esas imágenes. Consulta Clustering para más detalles.

Link to this sectionEstadísticas y visualización#

La pestaña Charts proporciona un análisis automático que incluye:

  • Distribución de la división: Gráfico de anillos con el número de imágenes de entrenamiento/validación/test
  • Clases principales: Gráfico de anillos de las clases de anotación más frecuentes
  • Dimensiones de imagen: Histograma de la distribución de anchura y altura de la imagen (en píxeles)
  • Puntos por instancia: Distribución de vértices de polígono o recuento de puntos clave (conjuntos de datos de segment/pose)
  • Ubicaciones de anotación: Mapa de calor 2D de las posiciones centrales de las bounding boxes
  • Dimensiones de imagen 2D: Mapa de calor 2D de anchura frente a altura con líneas guía de relación de aspecto

Link to this sectionEnlaces rápidos#

Link to this sectionFAQ#

Link to this section¿Qué formatos de archivo se admiten para la carga?#

Ultralytics Platform admite:

Imágenes: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (máximo 50 MB cada una)

Vídeos: MP4, WebM, MOV, MKV, M4V (máx. 1 GB, fotogramas extraídos a 1 FPS, máx. 100 fotogramas)

Archivos de conjunto de datos: Archivos ZIP o TAR incluyendo .tar.gz y .tgz (máximo 10 GB en Free, 20 GB en Pro, 50 GB en Enterprise) que contengan imágenes con etiquetas opcionales en formato YOLO, además de exportaciones NDJSON

Link to this section¿Cuál es el tamaño máximo del conjunto de datos?#

Los límites de almacenamiento dependen de tu plan:

PlanLímite de almacenamiento
Gratuito100 GB
Pro500 GB
EnterpriseIlimitado

Límites por archivo individual: Imágenes 50 MB, vídeos 1 GB, conjuntos de datos 10 GB en Free / 20 GB en Pro / 50 GB en Enterprise

Link to this section¿Puedo usar mis conjuntos de datos de la plataforma para entrenamiento local?#

¡Sí! Utiliza el formato URI del conjunto de datos para entrenar localmente:

export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100

O exporta tu conjunto de datos en formato NDJSON para un entrenamiento totalmente sin conexión.

Comentarios