Ir al contenido

Preparación de datos

La preparación de datos es la base para modelos de visión artificial exitosos. La Plataforma Ultralytics ofrece herramientas completas para gestionar sus datos de entrenamiento, desde la carga y la anotación hasta el análisis.

Visión general

La sección de Datos de la Plataforma Ultralytics le ayuda a:

  • Cargar imágenes, videos y archivos ZIP
  • Anotar con herramientas manuales y etiquetado asistido por IA
  • Analice sus datos con estadísticas y visualizaciones
  • Exporte en formatos estándar para entrenamiento local

Flujo de Trabajo

graph LR
    A[📤 Upload] --> B[🏷️ Annotate]
    B --> C[📊 Analyze]
    C --> D[🚀 Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
EtapaDescripción
CargarImporte imágenes, vídeos o archivos ZIP con procesamiento automático
AnotarEtiquete datos con cajas delimitadoras, polígonos, puntos clave o clasificaciones
AnalizarVisualice distribuciones de clases, mapas de calor espaciales y estadísticas de dimensiones
ExportarDescargue en formato NDJSON para uso sin conexión

Tareas admitidas

La Plataforma Ultralytics es compatible con los 5 tipos de tareas de YOLO:

TareaDescripciónHerramienta de Anotación
DetectarDetección de objetos con cajas delimitadorasHerramienta de rectángulo
SegmentarSegmentación de instancias con máscaras de píxelesHerramienta de polígono
PoseEstimación de puntos clave (formato COCO de 17 puntos)Herramienta de puntos clave
OBBCajas delimitadoras orientadas para objetos rotadosHerramienta de caja orientada
ClasificarClasificación a nivel de imagenSelector de clase

Características clave

Almacenamiento Inteligente

La Plataforma Ultralytics utiliza tecnología de almacenamiento eficiente:

  • Deduplicación: Imágenes idénticas almacenadas una sola vez
  • Integridad: Las sumas de verificación garantizan la integridad de los datos
  • Eficiencia: Almacenamiento optimizado y procesamiento rápido

URIs de Conjuntos de Datos

Referenciar conjuntos de datos usando el ul:// formato URI:

yolo train data=ul://username/datasets/my-dataset

Esto permite entrenar con conjuntos de datos de la Plataforma desde cualquier máquina con su clave API configurada.

Estadísticas y Visualización

Cada conjunto de datos incluye estadísticas automáticas:

  • Distribución de Clases: Gráfico de barras del recuento de etiquetas por clase
  • Mapa de Calor de Ubicación: Distribución espacial de las anotaciones
  • Análisis de Dimensiones: Distribución de ancho vs alto de la imagen
  • Desglose de Divisiones: Recuento de muestras de entrenamiento/validación/prueba

Preguntas frecuentes

¿Qué formatos de archivo son compatibles para la carga?

La Plataforma Ultralytics soporta:

Imágenes: JPEG, PNG, WebP, BMP, GIF, TIFF, HEIC, AVIF, JP2, DNG (máximo 50 MB cada una)

Vídeos: MP4, WebM, MOV, AVI, MKV, M4V (máximo 1 GB, fotogramas extraídos a 1 FPS, máximo 100 fotogramas)

Archivos: archivos ZIP (máximo 50 GB) que contienen imágenes con etiquetas opcionales YOLO

¿Cuál es el tamaño máximo del conjunto de datos?

Los límites de almacenamiento dependen de su plan:

PlanLímite de Almacenamiento
Gratuito100 GB
Pro500 GB
EmpresarialPersonalizado

Límites de archivos individuales: Imágenes 50 MB, Vídeos 1 GB, Archivos ZIP 50 GB

¿Puedo utilizar mis conjuntos de datos de la Plataforma para el entrenamiento local?

¡Sí! Utilice el formato URI del conjunto de datos para entrenar localmente:

export ULTRALYTICS_API_KEY="your_key"
yolo train data=ul://username/datasets/my-dataset epochs=100

O exporte su conjunto de datos en formato NDJSON para un entrenamiento completamente offline.



📅 Creado hace 20 días ✏️ Actualizado hace 12 días
glenn-jocher

Comentarios