Preparación de datos
La preparación de datos es la base para modelos de visión artificial exitosos. La Plataforma Ultralytics ofrece herramientas completas para gestionar sus datos de entrenamiento, desde la carga y la anotación hasta el análisis.
Visión general
La sección de Datos de la Plataforma Ultralytics le ayuda a:
- Subir imágenes, vídeos y archivos (ZIP, TAR, GZ)
- Anote con herramientas de dibujo manual y etiquetado inteligente SAM
- Analice sus datos con estadísticas y visualizaciones
- Exportar en formato NDJSON para entrenamiento local

Flujo de Trabajo
graph LR
A[Upload] --> B[Annotate]
B --> C[Analyze]
C --> D[Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| Etapa | Descripción |
|---|---|
| Cargar | Importa imágenes, vídeos o archivos con procesamiento automático. |
| Anotar | Etiquete datos con cajas delimitadoras, polígonos, puntos clave o clasificaciones |
| Analizar | Visualice distribuciones de clases, mapas de calor espaciales y estadísticas de dimensiones |
| Exportar | Descargar en formato NDJSON para uso sin conexión |
Tareas admitidas
La Plataforma Ultralytics es compatible con los 5 tipos de tareas de YOLO:
| Tarea | Descripción | Herramienta de Anotación |
|---|---|---|
| Detectar | Detección de objetos con cajas delimitadoras | Herramienta de rectángulo |
| Segmentar | Segmentación de instancias con máscaras de píxeles | Herramienta de polígono |
| Pose | Estimación de puntos clave (formato COCO de 17 puntos) | Herramienta de puntos clave |
| OBB | Cajas delimitadoras orientadas para objetos rotados | Herramienta de caja orientada |
| Clasificar | Clasificación a nivel de imagen | Selector de clase |
Selección del tipo de tarea
El tipo de tarea se establece al crear un conjunto de datos y determina qué herramientas de anotación están disponibles. Puede cambiarlo más tarde desde la configuración del conjunto de datos, pero las anotaciones incompatibles no se mostrarán después del cambio.
Características clave
Almacenamiento Inteligente
Ultralytics utiliza almacenamiento direccionable por contenido (CAS) para una gestión eficiente de los datos:
- Deduplicación: imágenes idénticas almacenadas solo una vez mediante el hash XXH3-128.
- Integridad: el direccionamiento basado en hash garantiza la integridad de los datos.
- Eficiencia: Almacenamiento optimizado y procesamiento rápido
URIs de Conjuntos de Datos
Referenciar conjuntos de datos usando el ul:// Formato URI (véase Uso de Conjuntos de Datos de la Plataforma):
yolo train data=ul://username/datasets/my-dataset
Esto permite entrenar los conjuntos de datos de la plataforma desde cualquier máquina con su clave API configurada.
Utilizar datos de la plataforma desde Python
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
Pestañas del conjunto de datos
Cada página de conjunto de datos ofrece cinco pestañas:
| Pestaña | Descripción |
|---|---|
| Imágenes | Explora imágenes en vista de cuadrícula, compacta o tabla con superposiciones de anotaciones. |
| Clases | Ver y editar nombres de clases, colores y recuentos de etiquetas por clase. |
| Gráficos | Estadísticas automáticas: distribución dividida, recuentos de clases, mapas de calor |
| Modelos | Modelos entrenados en este conjunto de datos con métricas y estado |
| Errores | Imágenes cuyo procesamiento ha fallado, con detalles del error y orientación para solucionarlo. |
Estadísticas y Visualización
El Charts La pestaña proporciona un análisis automático que incluye:
- Distribución dividida: gráfico circular con el recuento de imágenes de entrenamiento/validación/prueba.
- Clases principales: gráfico circular de las clases de anotación más frecuentes
- Anchos de imagen: Histograma de distribución del ancho de las imágenes
- Alturas de imagen: Histograma de distribución de alturas de imagen
- Puntos por instancia: distribución del recuento de vértices poligonales o puntos clave (conjuntos de datossegment)
- Ubicaciones de las anotaciones: mapa de calor 2D de las posiciones centrales de los cuadros delimitadores.
- Dimensiones de la imagen: mapa de calor 2D de anchura frente a altura con líneas guía de relación de aspecto.
Enlaces rápidos
- Conjuntos de Datos: Suba y gestione sus datos de entrenamiento
- Anotación: Datos de etiquetas con herramientas manuales y asistidas por IA
Preguntas frecuentes
¿Qué formatos de archivo son compatibles para la carga?
La Plataforma Ultralytics soporta:
Imágenes: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (máximo 50 MB cada una)
Vídeos: MP4, WebM, MOV, AVI, MKV, M4V (máximo 1 GB, fotogramas extraídos a 1 FPS, máximo 100 fotogramas)
Archivos: ZIP, TAR, TAR.GZ, TGZ, GZ (máximo 10 GB) que contienen imágenes con etiquetas opcionales YOLO.
¿Cuál es el tamaño máximo del conjunto de datos?
Los límites de almacenamiento dependen de su plan:
| Plan | Límite de Almacenamiento |
|---|---|
| Gratuito | 100 GB |
| Pro | 500 GB |
| Empresarial | Personalizado |
Límites de archivos individuales: Imágenes 50 MB, Vídeos 1 GB, Archivos 10 GB
¿Puedo utilizar mis conjuntos de datos de la Plataforma para el entrenamiento local?
¡Sí! Utilice el formato URI del conjunto de datos para entrenar localmente:
export ULTRALYTICS_API_KEY="your_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os
os.environ["ULTRALYTICS_API_KEY"] = "your_key"
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
O exporte su conjunto de datos en formato NDJSON para un entrenamiento totalmente sin conexión.