Ir al contenido

Preparación de datos

La preparación de datos es la base para modelos de visión artificial exitosos. La Plataforma Ultralytics ofrece herramientas completas para gestionar sus datos de entrenamiento, desde la carga y la anotación hasta el análisis.

Visión general

La sección de Datos de la Plataforma Ultralytics le ayuda a:

  • Subir imágenes, vídeos y archivos (ZIP, TAR, GZ)
  • Anote con herramientas de dibujo manual y etiquetado inteligente SAM
  • Analice sus datos con estadísticas y visualizaciones
  • Exportar en formato NDJSON para entrenamiento local

Descripción general de los datos de Ultralytics Barras laterales Conjuntos de datos

Flujo de Trabajo

graph LR
    A[Upload] --> B[Annotate]
    B --> C[Analyze]
    C --> D[Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
EtapaDescripción
CargarImporta imágenes, vídeos o archivos con procesamiento automático.
AnotarEtiquete datos con cajas delimitadoras, polígonos, puntos clave o clasificaciones
AnalizarVisualice distribuciones de clases, mapas de calor espaciales y estadísticas de dimensiones
ExportarDescargar en formato NDJSON para uso sin conexión

Tareas admitidas

La Plataforma Ultralytics es compatible con los 5 tipos de tareas de YOLO:

TareaDescripciónHerramienta de Anotación
DetectarDetección de objetos con cajas delimitadorasHerramienta de rectángulo
SegmentarSegmentación de instancias con máscaras de píxelesHerramienta de polígono
PoseEstimación de puntos clave (formato COCO de 17 puntos)Herramienta de puntos clave
OBBCajas delimitadoras orientadas para objetos rotadosHerramienta de caja orientada
ClasificarClasificación a nivel de imagenSelector de clase

Selección del tipo de tarea

El tipo de tarea se establece al crear un conjunto de datos y determina qué herramientas de anotación están disponibles. Puede cambiarlo más tarde desde la configuración del conjunto de datos, pero las anotaciones incompatibles no se mostrarán después del cambio.

Características clave

Almacenamiento Inteligente

Ultralytics utiliza almacenamiento direccionable por contenido (CAS) para una gestión eficiente de los datos:

  • Deduplicación: imágenes idénticas almacenadas solo una vez mediante el hash XXH3-128.
  • Integridad: el direccionamiento basado en hash garantiza la integridad de los datos.
  • Eficiencia: Almacenamiento optimizado y procesamiento rápido

URIs de Conjuntos de Datos

Referenciar conjuntos de datos usando el ul:// Formato URI (véase Uso de Conjuntos de Datos de la Plataforma):

yolo train data=ul://username/datasets/my-dataset

Esto permite entrenar los conjuntos de datos de la plataforma desde cualquier máquina con su clave API configurada.

Utilizar datos de la plataforma desde Python

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

Pestañas del conjunto de datos

Cada página de conjunto de datos ofrece cinco pestañas:

PestañaDescripción
ImágenesExplora imágenes en vista de cuadrícula, compacta o tabla con superposiciones de anotaciones.
ClasesVer y editar nombres de clases, colores y recuentos de etiquetas por clase.
GráficosEstadísticas automáticas: distribución dividida, recuentos de clases, mapas de calor
ModelosModelos entrenados en este conjunto de datos con métricas y estado
ErroresImágenes cuyo procesamiento ha fallado, con detalles del error y orientación para solucionarlo.

Estadísticas y Visualización

El Charts La pestaña proporciona un análisis automático que incluye:

  • Distribución dividida: gráfico circular con el recuento de imágenes de entrenamiento/validación/prueba.
  • Clases principales: gráfico circular de las clases de anotación más frecuentes
  • Anchos de imagen: Histograma de distribución del ancho de las imágenes
  • Alturas de imagen: Histograma de distribución de alturas de imagen
  • Puntos por instancia: distribución del recuento de vértices poligonales o puntos clave (conjuntos de datossegment)
  • Ubicaciones de las anotaciones: mapa de calor 2D de las posiciones centrales de los cuadros delimitadores.
  • Dimensiones de la imagen: mapa de calor 2D de anchura frente a altura con líneas guía de relación de aspecto.

Preguntas frecuentes

¿Qué formatos de archivo son compatibles para la carga?

La Plataforma Ultralytics soporta:

Imágenes: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (máximo 50 MB cada una)

Vídeos: MP4, WebM, MOV, AVI, MKV, M4V (máximo 1 GB, fotogramas extraídos a 1 FPS, máximo 100 fotogramas)

Archivos: ZIP, TAR, TAR.GZ, TGZ, GZ (máximo 10 GB) que contienen imágenes con etiquetas opcionales YOLO.

¿Cuál es el tamaño máximo del conjunto de datos?

Los límites de almacenamiento dependen de su plan:

PlanLímite de Almacenamiento
Gratuito100 GB
Pro500 GB
EmpresarialPersonalizado

Límites de archivos individuales: Imágenes 50 MB, Vídeos 1 GB, Archivos 10 GB

¿Puedo utilizar mis conjuntos de datos de la Plataforma para el entrenamiento local?

¡Sí! Utilice el formato URI del conjunto de datos para entrenar localmente:

export ULTRALYTICS_API_KEY="your_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os

os.environ["ULTRALYTICS_API_KEY"] = "your_key"

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

O exporte su conjunto de datos en formato NDJSON para un entrenamiento totalmente sin conexión.



📅 Creado hace 1 mes ✏️ Actualizado hace 5 días
glenn-jochersergiuwaxmann

Comentarios