Preparación de datos
La preparación de datos es la base para modelos de visión artificial exitosos. La Plataforma Ultralytics ofrece herramientas completas para gestionar sus datos de entrenamiento, desde la carga y la anotación hasta el análisis.
Visión general
La sección de Datos de la Plataforma Ultralytics le ayuda a:
- Cargar imágenes, videos y archivos ZIP
- Anotar con herramientas manuales y etiquetado asistido por IA
- Analice sus datos con estadísticas y visualizaciones
- Exporte en formatos estándar para entrenamiento local
Flujo de Trabajo
graph LR
A[📤 Upload] --> B[🏷️ Annotate]
B --> C[📊 Analyze]
C --> D[🚀 Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| Etapa | Descripción |
|---|---|
| Cargar | Importe imágenes, vídeos o archivos ZIP con procesamiento automático |
| Anotar | Etiquete datos con cajas delimitadoras, polígonos, puntos clave o clasificaciones |
| Analizar | Visualice distribuciones de clases, mapas de calor espaciales y estadísticas de dimensiones |
| Exportar | Descargue en formato NDJSON para uso sin conexión |
Tareas admitidas
La Plataforma Ultralytics es compatible con los 5 tipos de tareas de YOLO:
| Tarea | Descripción | Herramienta de Anotación |
|---|---|---|
| Detectar | Detección de objetos con cajas delimitadoras | Herramienta de rectángulo |
| Segmentar | Segmentación de instancias con máscaras de píxeles | Herramienta de polígono |
| Pose | Estimación de puntos clave (formato COCO de 17 puntos) | Herramienta de puntos clave |
| OBB | Cajas delimitadoras orientadas para objetos rotados | Herramienta de caja orientada |
| Clasificar | Clasificación a nivel de imagen | Selector de clase |
Características clave
Almacenamiento Inteligente
La Plataforma Ultralytics utiliza tecnología de almacenamiento eficiente:
- Deduplicación: Imágenes idénticas almacenadas una sola vez
- Integridad: Las sumas de verificación garantizan la integridad de los datos
- Eficiencia: Almacenamiento optimizado y procesamiento rápido
URIs de Conjuntos de Datos
Referenciar conjuntos de datos usando el ul:// formato URI:
yolo train data=ul://username/datasets/my-dataset
Esto permite entrenar con conjuntos de datos de la Plataforma desde cualquier máquina con su clave API configurada.
Estadísticas y Visualización
Cada conjunto de datos incluye estadísticas automáticas:
- Distribución de Clases: Gráfico de barras del recuento de etiquetas por clase
- Mapa de Calor de Ubicación: Distribución espacial de las anotaciones
- Análisis de Dimensiones: Distribución de ancho vs alto de la imagen
- Desglose de Divisiones: Recuento de muestras de entrenamiento/validación/prueba
Enlaces rápidos
- Conjuntos de Datos: Suba y gestione sus datos de entrenamiento
- Anotación: Datos de etiquetas con herramientas manuales y asistidas por IA
Preguntas frecuentes
¿Qué formatos de archivo son compatibles para la carga?
La Plataforma Ultralytics soporta:
Imágenes: JPEG, PNG, WebP, BMP, GIF, TIFF, HEIC, AVIF, JP2, DNG (máximo 50 MB cada una)
Vídeos: MP4, WebM, MOV, AVI, MKV, M4V (máximo 1 GB, fotogramas extraídos a 1 FPS, máximo 100 fotogramas)
Archivos: archivos ZIP (máximo 50 GB) que contienen imágenes con etiquetas opcionales YOLO
¿Cuál es el tamaño máximo del conjunto de datos?
Los límites de almacenamiento dependen de su plan:
| Plan | Límite de Almacenamiento |
|---|---|
| Gratuito | 100 GB |
| Pro | 500 GB |
| Empresarial | Personalizado |
Límites de archivos individuales: Imágenes 50 MB, Vídeos 1 GB, Archivos ZIP 50 GB
¿Puedo utilizar mis conjuntos de datos de la Plataforma para el entrenamiento local?
¡Sí! Utilice el formato URI del conjunto de datos para entrenar localmente:
export ULTRALYTICS_API_KEY="your_key"
yolo train data=ul://username/datasets/my-dataset epochs=100
O exporte su conjunto de datos en formato NDJSON para un entrenamiento completamente offline.