Conjuntos de datos
Ultralytics Platform los conjuntos de datos ofrecen una solución optimizada para gestionar sus datos de entrenamiento. Una vez cargados, los conjuntos de datos pueden utilizarse inmediatamente para el entrenamiento de modelos, con procesamiento automático y generación de estadísticas.
Subir conjunto de datos
La Plataforma Ultralytics acepta múltiples formatos de carga para mayor flexibilidad.
Formatos compatibles
| Formato | Extensiones | Notas | Tamaño máximo |
|---|---|---|---|
| JPEG | .jpg, .jpeg | Más común, recomendado | 50 MB |
| PNG | .png | Soporta transparencia | 50 MB |
| WebP | .webp | Moderno, buena compresión | 50 MB |
| BMP | .bmp | Sin comprimir | 50 MB |
| TIFF | .tiff, .tif | Alta calidad | 50 MB |
| HEIC | .heic | Fotos de iPhone | 50 MB |
| AVIF | .avif | Formato de próxima generación | 50 MB |
| JP2 | .jp2 | JPEG 2000 | 50 MB |
| DNG | .dng | Cámara RAW | 50 MB |
| MPO | .mpo | Objeto de múltiples imágenes | 50 MB |
Los vídeos se extraen automáticamente a fotogramas en el lado del cliente a 1 FPS (máximo 100 fotogramas por vídeo).
| Formato | Extensiones | Extracción | Tamaño máximo |
|---|---|---|---|
| MP4 | .mp4 | 1 FPS, máximo 100 fotogramas | 1 GB |
| WebM | .webm | 1 FPS, máximo 100 fotogramas | 1 GB |
| MOV | .mov | 1 FPS, máximo 100 fotogramas | 1 GB |
| AVI | .avi | 1 FPS, máximo 100 fotogramas | 1 GB |
| MKV | .mkv | 1 FPS, máximo 100 fotogramas | 1 GB |
| M4V | .m4v | 1 FPS, máximo 100 fotogramas | 1 GB |
Extracción de Fotogramas de Video
Los fotogramas de vídeo se extraen a 1 fotograma por segundo en el navegador antes de la carga. Un vídeo de 60 segundos produce 60 fotogramas. El máximo es de 100 fotogramas por vídeo, por lo que los vídeos de más de ~100 segundos serán muestreados.
Los archivos se extraen y procesan automáticamente.
| Formato | Extensiones | Notas | Tamaño máximo |
|---|---|---|---|
| ZIP | .zip | Más común | 10 GB |
| TAR | .tar | Archivo descomprimido | 10 GB |
| TAR.GZ | .tar.gz, .tgz | Archivo comprimido | 10 GB |
| GZ | .gz | Comprimido con Gzip | 10 GB |
Preparación de su Conjunto de Datos
La plataforma admite dos formatos de anotación más cargas sin procesar: Ultralytics YOLO, COCO, y sin procesar (imágenes sin anotar):
Utilice la estructura de directorios estándar de YOLO con un data.yaml archivo:
my-dataset/
├── images/
│ ├── train/
│ │ ├── img001.jpg
│ │ └── img002.jpg
│ └── val/
│ ├── img003.jpg
│ └── img004.jpg
├── labels/
│ ├── train/
│ │ ├── img001.txt
│ │ └── img002.txt
│ └── val/
│ ├── img003.txt
│ └── img004.txt
└── data.yaml
El archivo yaml define la configuración de su conjunto de datos:
# data.yaml
path: .
train: images/train
val: images/val
names:
0: person
1: car
2: dog
Utilice archivos de anotación JSON con la estructura COCO estándar:
my-coco-dataset/
├── train/
│ ├── _annotations.coco.json
│ ├── img001.jpg
│ └── img002.jpg
└── val/
├── _annotations.coco.json
├── img003.jpg
└── img004.jpg
El archivo JSON contiene images, annotations, y categories arrays:
{
"images": [{ "id": 1, "file_name": "img001.jpg", "width": 640, "height": 480 }],
"annotations": [{ "id": 1, "image_id": 1, "category_id": 0, "bbox": [100, 50, 200, 300] }],
"categories": [{ "id": 0, "name": "person" }]
}
Las anotaciones COCO se convierten automáticamente durante la carga. Detección (bbox), segmentation (segmentation polígonos), y pose (keypoints) tareas son compatibles. Los IDs de categoría se remapean a una secuencia densa con índice 0 en todos los archivos de anotación. Para la conversión entre formatos, consulte herramientas de conversión de formato.
Cargas sin procesar
Sin Procesar: Subir imágenes sin anotar (sin etiquetas). Útil cuando planea anotar directamente en la plataforma utilizando el editor de anotaciones.
Estructura de Directorio Plana
También puede cargar imágenes sin la estructura de carpetas train/val. Las imágenes cargadas sin carpetas de división se asignan al train divididos por defecto. Podrá reasignarlos posteriormente mediante la función de movimiento masivo entre divisiones.
Detección Automática de Formato
El formato se detecta automáticamente: conjuntos de datos con un data.yaml que contiene names, train, o val las claves se tratan como YOLO. Conjuntos de datos con archivos JSON de COCO (que contienen images, annotations, y categories arrays) se tratan como COCO. Los conjuntos de datos con solo imágenes y sin anotaciones se tratan como datos en bruto.
Para obtener detalles sobre el formato específico de cada tarea, consulte las tareas compatibles y la Descripción general de conjuntos de datos.
Proceso de Carga
- Navegar a
Datasetsen la barra lateral - Haz clic
New Dataseto arrastre archivos a la zona de carga - Seleccione el tipo de tarea (véase tareas compatibles)
- Añada un nombre y una descripción opcional
- Establecer visibilidad (pública o privada) y licencia opcional (ver licencias disponibles)
- Haz clic
Create

Después de la carga, la plataforma procesa sus datos a través de una pipeline de múltiples etapas:
graph LR
A[Upload] --> B[Validate]
B --> C[Normalize]
C --> D[Thumbnail]
D --> E[Parse Labels]
E --> F[Statistics]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#2196F3,color:#fff
style D fill:#2196F3,color:#fff
style E fill:#2196F3,color:#fff
style F fill:#9C27B0,color:#fff
- Validación: Comprobaciones de formato y tamaño.
- Normalización: Imágenes grandes redimensionadas (máx. 4096px, dimensión mínima 28px)
- Miniaturas: previsualizaciones WebP de 256px generadas
- Análisis de Etiquetas: Etiquetas en formato YOLO y COCO extraídas
- Estadísticas: Distribuciones de clases y dimensiones de imagen calculadas

Validar Antes de la Carga
Puede validar su conjunto de datos localmente antes de cargarlo:
from ultralytics.hub import check_dataset
check_dataset("path/to/dataset.zip", task="detect")
Requisitos de Tamaño de Imagen
Las imágenes deben tener al menos 28px en su lado más corto. Las imágenes más pequeñas que esto se rechazan durante el procesamiento. Las imágenes de más de 4096px en su lado más largo se redimensionan automáticamente conservando la relación de aspecto.
Explorar Imágenes
Visualice las imágenes de su conjunto de datos en múltiples diseños:
| Ver | Descripción |
|---|---|
| Cuadrícula | Cuadrícula de miniaturas con superposiciones de anotaciones (predeterminado) |
| Compacto | Miniaturas más pequeñas para un escaneo rápido |
| Tabla | Lista con miniatura, nombre de archivo, dimensiones, tamaño, división, clases y recuento de etiquetas |

Ordenación y Filtrado
Las imágenes se pueden ordenar y filtrar para una navegación eficiente:
| Ordenar | Descripción |
|---|---|
| Más reciente | Añadidos más recientemente |
| Más antiguo | Más antiguo añadido |
| Nombre A-Z | Alfabético |
| Nombre Z-A | Alfabético inverso |
| Tamaño (el más pequeño) | Archivos más pequeños primero |
| Tamaño (el más grande) | Archivos más grandes primero |
| La mayoría de las etiquetas | La mayoría de las anotaciones |
| Menor número de etiquetas | Menor número de anotaciones |
| Filtrar | Opciones |
|---|---|
| Filtro de división | Entrenamiento, Validación, Prueba o Todos |
| Filtro de etiquetas | Todas las imágenes, Anotadas o Sin anotar |
| Buscar | Filtrar imágenes por nombre de archivo |
Búsqueda de Imágenes sin Etiquetar
Utilice el filtro de etiquetas establecido en Unannotated para encontrar rápidamente imágenes que aún necesitan anotación. Esto es especialmente útil para grandes conjuntos de datos donde se desea seguir el progreso del etiquetado.
Visor de Pantalla Completa
Haga clic en cualquier imagen para abrir el visor de pantalla completa con:
- Navegación: Teclas de flecha o vistas previas en miniatura para navegar
- Metadatos: Nombre de archivo, dimensiones, distintivo de división, recuento de anotaciones
- Anotaciones: Alternar la visibilidad de la superposición de anotaciones.
- Desglose de Clases: Recuentos de etiquetas por clase con indicadores de color
- Editar: Ingrese al modo de anotación para agregar o modificar etiquetas
- Descargar: Descargar el archivo de imagen original
- Eliminar: Eliminar la imagen del conjunto de datos
- Zoom:
Cmd/Ctrl+Scrollpara acercar/alejar - Vista de píxeles: Alternar la renderización pixelada para una inspección detallada

Filtrar por División
Filtre imágenes por su división de conjunto de datos:
| División | Propósito |
|---|---|
| Entrenar | Utilizado para el entrenamiento del modelo |
| Val | Utilizado para validación durante el entrenamiento |
| Prueba | Utilizado para la evaluación final |
Pestañas del Conjunto de Datos
Cada página de conjunto de datos tiene seis pestañas accesibles desde la barra de pestañas:
Pestaña de Imágenes
La vista predeterminada muestra la galería de imágenes con superposiciones de anotaciones. Admite los modos de vista de cuadrícula, compacta y tabla. Arrastre y suelte archivos aquí para añadir más imágenes.
Pestaña Clases
Gestionar clases de anotación para su conjunto de datos:
- Histograma de clases: Gráfico de barras que muestra el recuento de anotaciones por clase con alternancia de escala lineal/logarítmica
- Tabla de clases: Tabla ordenable y con capacidad de búsqueda que incluye el nombre de la clase, el recuento de etiquetas y el recuento de imágenes
- Editar nombres de clase: Haga clic en cualquier nombre de clase para renombrarlo en línea
- Editar colores de clase: Haga clic en una muestra de color para cambiar el color de la clase
- Añadir nueva clase: Utilice el campo de entrada inferior para añadir clases

Escala Logarítmica para Conjuntos de Datos Desequilibrados
Si su conjunto de datos tiene desequilibrio de clases (por ejemplo, 10.000 anotaciones de "persona" pero solo 50 de "bicicleta"), utilice el Log Scale activar el histograma de clases para visualizar todas las clases claramente.
Pestaña de gráficos
Estadísticas automáticas calculadas a partir de su conjunto de datos:
| Gráfico | Descripción |
|---|---|
| Distribución de las divisiones | Gráfico de anillo de los recuentos de imágenes de entrenamiento/validación/prueba y el porcentaje etiquetado |
| Clases Principales | Gráfico de anillo de las 10 clases de anotación más frecuentes |
| Anchuras de Imagen | Histograma de distribución del ancho de imagen con media |
| Alturas de Imagen | Histograma de la distribución de la altura de la imagen con media |
| Puntos por Instancia | Recuento de vértices de polígono o puntos clave por anotación (segment/pose) |
| Ubicaciones de Anotación | Mapa de calor 2D de las posiciones centrales de las cajas delimitadoras |
| Dimensiones de la Imagen | Mapa de calor 2D de ancho vs. alto con líneas guía de relación de aspecto |

Caché de estadísticas
Las estadísticas se almacenan en caché durante 5 minutos. Los cambios en las anotaciones se reflejarán una vez que expire la caché.
Mapas de calor en pantalla completa
Haga clic en el botón de expandir en cualquier mapa de calor para verlo en modo de pantalla completa. Esto proporciona una vista más amplia y detallada, útil para comprender patrones espaciales en grandes conjuntos de datos.
Pestaña de modelos
Ver todos los modelos entrenados con este conjunto de datos en una tabla con capacidad de búsqueda:
| Columna | Descripción |
|---|---|
| Nombre | Nombre del modelo con enlace |
| Proyecto | Proyecto padre con icono |
| Estado | Insignia de estado de entrenamiento |
| Tarea | Tipo de tarea YOLO |
| Épocas | Mejor época / épocas totales |
| mAP50-95 | Precisión media promedio |
| mAP50 | mAP con IoU 0.50 |
| Creada | Fecha de creación |

Pestaña de Errores
Las imágenes que fallaron en el procesamiento se listan aquí con:
- Banner de error: Recuento total de imágenes fallidas y orientación
- Tabla de errores: Nombre de archivo, descripción de error comprensible, sugerencias de solución y miniatura de vista previa
- Los errores comunes incluyen archivos corruptos, formatos no compatibles, imágenes demasiado pequeñas (mín. 28px) y modos de color no compatibles

Errores Comunes de Procesamiento
| Error | Causa | Corrección |
|---|---|---|
| No se puede leer el archivo de imagen | Formato corrupto o no compatible | Volver a exportar desde el editor de imágenes |
| Incompleto o corrupto | El archivo fue truncado durante la transferencia | Volver a descargar el archivo original |
| Imagen demasiado pequeña | Dimensión mínima inferior a 28px | Utilice imágenes de origen de mayor resolución |
| Modo de color no compatible | Modo de color CMYK o indexado | Convertir a modo RGB |
Pestaña de Versiones
Cree instantáneas NDJSON inmutables de su conjunto de datos para un entrenamiento reproducible. Cada versión captura el recuento de imágenes, el recuento de clases, el recuento de anotaciones y el tamaño del archivo en el momento de su creación.
| Columna | Descripción |
|---|---|
| Versión | Número de versión (v1, v2, ...) |
| Descripción | Descripción proporcionada por el usuario (editable) |
| Imágenes | Recuento de imágenes en el momento de la instantánea |
| Clases | Recuento de clases en el momento de la instantánea |
| Anotaciones | Recuento de anotaciones en el momento de la instantánea |
| Tamaño | Tamaño del archivo de exportación NDJSON |
| Creada | Cuando se creó la versión |
Para crear una versión:
- Abrir la pestaña Versiones
- Opcionalmente, introduzca una descripción (p. ej., "Se añadieron 500 imágenes de entrenamiento" o "Se corrigieron clases mal etiquetadas")
- Haz clic en + Nueva versión
- La instantánea NDJSON se genera y descarga automáticamente
Cada versión se numera secuencialmente (v1, v2, v3...) y se almacena permanentemente. Puede descargar cualquier versión anterior en cualquier momento desde la tabla de versiones.
¿Cuándo crear versiones?
Cree una versión antes y después de realizar cambios importantes en su conjunto de datos — como añadir imágenes, corregir anotaciones o reequilibrar las divisiones. Esto le permite comparar el rendimiento del modelo en diferentes estados del conjunto de datos.
Tamaño del archivo NDJSON
El tamaño mostrado es el tamaño del archivo de exportación NDJSON, que contiene URL de imágenes y anotaciones, no las imágenes en sí. Los datos de imagen reales se almacenan por separado y se acceden a través de URL firmadas.
Exportar Conjunto de Datos
Exporte su conjunto de datos en formato NDJSON para uso sin conexión:
- Haga clic en el icono de descarga en el encabezado del conjunto de datos.
- El archivo NDJSON se descarga automáticamente

El formato NDJSON almacena un objeto JSON por línea. La primera línea contiene metadatos del conjunto de datos, seguida de una línea por imagen:
{"type": "dataset", "task": "detect", "name": "my-dataset", "description": "...", "url": "https://platform.ultralytics.com/...", "class_names": {"0": "person", "1": "car"}, "version": 1, "created_at": "2026-01-15T10:00:00Z", "updated_at": "2026-02-20T14:30:00Z"}
{"type": "image", "file": "img001.jpg", "url": "https://...", "width": 640, "height": 480, "split": "train", "annotations": {"boxes": [[0, 0.5, 0.5, 0.2, 0.3]]}}
{"type": "image", "file": "img002.jpg", "url": "https://...", "width": 1280, "height": 720, "split": "val"}
URLs firmadas
Las URL de las imágenes en el NDJSON exportado están firmadas y son válidas durante 7 días. Si necesita URL actualizadas, reexporte el conjunto de datos o cree una nueva versión.
Consulte la documentación del formato NDJSON de Ultralytics para conocer la especificación completa.
Operaciones de Imagen
Acciones rápidas
Haga clic derecho en cualquier imagen en la vista Cuadrícula o Compacta para acceder a acciones rápidas:
| Acción | Descripción |
|---|---|
| Mover a división | Reasigne la imagen a la división de Entrenamiento, Validación o Prueba |
| Descargar | Descargar el archivo de imagen original |
| Eliminar | Eliminar la imagen del conjunto de datos |

Individual vs Masivo
El menú contextual de la imagen opera sobre una sola imagen. Para operaciones masivas en múltiples imágenes, utilice la vista Tabla con selección por casilla.
Movimiento Masivo a División
Reasignar imágenes seleccionadas a una división diferente dentro del mismo conjunto de datos:
- Cambiar a vista Tabla
- Seleccione imágenes usando casillas de verificación
- Haga clic derecho para abrir el menú contextual
- Elegir
Move to split> Entrenar, Validación, o Prueba
También puede arrastrar y soltar imágenes en las pestañas de filtro de división en la vista de cuadrícula.
Organización de divisiones Train/Val
Suba todas las imágenes a un único conjunto de datos, luego use la función de movimiento masivo para organizar los subconjuntos en divisiones de entrenamiento, validación y prueba.
Eliminación Masiva
Eliminar varias imágenes a la vez:
- Seleccione imágenes en la vista de tabla
- Haga clic derecho y elija
Delete - Confirma la eliminación
URI del Conjunto de Datos
Referencie los conjuntos de datos de la plataforma utilizando el ul:// Formato URI (ver Uso de Conjuntos de Datos de la Plataforma):
ul://username/datasets/dataset-slug
Utilice esta URI para entrenar modelos desde cualquier lugar:
export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
Entrene en cualquier lugar con datos de la plataforma
El ul:// La URI funciona desde cualquier entorno:
- Máquina local: Entrene en su hardware, los datos se descargan automáticamente
- Google Colab: Acceda a sus conjuntos de datos de la plataforma en cuadernos
- Servidores remotos: Entrene en máquinas virtuales en la nube con acceso completo al conjunto de datos
Licencias Disponibles
La plataforma admite las siguientes licencias para conjuntos de datos:
| Licencia | Tipo |
|---|---|
| Ninguno | Ninguna licencia seleccionada |
| CC0-1.0 | Dominio público |
| CC-BY-2.5 | Permisivo |
| CC-BY-4.0 | Permisivo |
| CC-BY-SA-4.0 | Copyleft |
| CC-BY-NC-4.0 | No comercial |
| CC-BY-NC-SA-4.0 | Copyleft |
| CC-BY-ND-4.0 | Sin derivados |
| CC-BY-NC-ND-4.0 | No comercial |
| Apache-2.0 | Permisivo |
| MIT | Permisivo |
| AGPL-3.0 | Copyleft |
| GPL-3.0 | Copyleft |
| Solo para investigación | Restringido |
| Otros | Personalizado |
Licencias Copyleft
Al clonar un conjunto de datos con una licencia copyleft (AGPL-3.0, GPL-3-0, CC-BY-SA-4.0, CC-BY-NC-SA-4.0), el clon hereda la licencia y el selector de licencia se bloquea.
Configuración de Visibilidad
Controla quién puede ver tu conjunto de datos:
| Configuración | Descripción |
|---|---|
| Privado | Solo tú puedes acceder |
| Público | Cualquiera puede visualizarlo en la página Explorar |
La visibilidad se establece al crear un conjunto de datos en el New Dataset diálogo utilizando un interruptor de palanca. Los conjuntos de datos públicos son visibles en la Explorar página.
Editar Dataset
Los metadatos del conjunto de datos se editan en línea directamente en la página del conjunto de datos — no se necesita diálogo:
- Nombre: Haga clic en el nombre del conjunto de datos para editarlo. Los cambios se guardan automáticamente al perder el foco o
Enter. - Descripción: Haga clic en la descripción (o en el marcador de posición "Añadir una descripción...") para editar. Los cambios se guardan automáticamente.
- Tipo de tarea: Haz clic en la insignia de la tarea para seleccionar un tipo de tarea diferente.
- Licencia: Haga clic en el selector de licencia para cambiar la licencia del conjunto de datos.
Cambio de tipo de tarea
Cambiar el tipo de tarea puede afectar la forma en que se visualizan las anotaciones existentes. Las anotaciones incompatibles no se mostrarán.
Clonar Conjunto de Datos
Al ver un conjunto de datos público que no posee, haga clic Clone Dataset para crear una copia en su espacio de trabajo. El clon incluye todas las imágenes, anotaciones y definiciones de clases. Si el conjunto de datos original tiene una licencia copyleft, el clon la hereda y el selector de licencia se bloquea.
Destacar y Compartir
- Destacar: Haga clic en el botón de estrella para marcar un conjunto de datos. El recuento de estrellas es visible para todos los usuarios.
- Compartir: Para conjuntos de datos públicos, haga clic en el botón de compartir para copiar un enlace o compartir en plataformas sociales.
Eliminar conjunto de datos
Elimina un conjunto de datos que ya no necesites:
- Abre el menú de acciones del conjunto de datos
- Haz clic
Delete - Confirmar en el diálogo: "Esto moverá [nombre] a la papelera. Puede restaurarlo en un plazo de 30 días."
Papelera y Restaurar
Los conjuntos de datos eliminados se mueven a la Papelera, no se eliminan permanentemente. Puede restaurarlos en un plazo de 30 días desde Settings > Trash.
Entrenar con el Conjunto de Datos
Inicia el entrenamiento directamente desde tu conjunto de datos:
- Haz clic
New Modelen la página del conjunto de datos - Selecciona un proyecto o crea uno nuevo
- Configura los parámetros de entrenamiento
- Inicia el entrenamiento
graph LR
A[Dataset] --> B[New Model]
B --> C[Select Project]
C --> D[Configure]
D --> E[Start Training]
style A fill:#2196F3,color:#fff
style E fill:#4CAF50,color:#fff
Consulta Entrenamiento en la Nube para más detalles.
Preguntas frecuentes
¿Qué sucede con mis datos después de la carga?
Sus datos se procesan y almacenan en la región seleccionada (EE. UU., UE o AP). Las imágenes son:
- Validado en cuanto a formato y tamaño
- Rechazado si la dimensión mínima es inferior a 28px
- Normalizado si es mayor de 4096px (preservando la relación de aspecto; codificado para almacenamiento optimizado)
- Almacenado utilizando Almacenamiento Direccionable por Contenido (CAS) con hashing XXH3-128
- Miniaturas generadas en WebP de 256px para una navegación rápida
¿Cómo funciona el almacenamiento?
La Plataforma Ultralytics utiliza Almacenamiento Direccionable por Contenido (CAS) para un almacenamiento eficiente:
- Deduplicación: Las imágenes idénticas subidas por diferentes usuarios se almacenan solo una vez
- Integridad: El hashing XXH3-128 garantiza la integridad de los datos.
- Eficiencia: Reduce los costos de almacenamiento y acelera el procesamiento
- Regional: Los datos permanecen en la región seleccionada (EE. UU., UE o AP)
¿Puedo añadir imágenes a un conjunto de datos existente?
Sí, arrastre y suelte archivos en la página del conjunto de datos o use el botón de carga para añadir imágenes adicionales. Las nuevas estadísticas se calcularán automáticamente.
¿Cómo muevo imágenes entre divisiones?
Utilice la función de movimiento masivo a división:
- Seleccione imágenes en la vista de tabla
- Haga clic derecho y elija
Move to split - Seleccione la partición objetivo (Entrenamiento, Validación o Prueba)
¿Qué formatos de etiquetas son compatibles?
La Plataforma Ultralytics admite dos formatos de anotación para la carga:
Uno .txt archivo por imagen con coordenadas normalizadas (rango 0-1):
| Tarea | Formato | Ejemplo |
|---|---|---|
| Detectar | class cx cy w h | 0 0.5 0.5 0.2 0.3 |
| Segmentar | class x1 y1 x2 y2 ... | 0 0.1 0.1 0.9 0.1 0.9 0.9 |
| Pose | class cx cy w h kx1 ky1 v1 ... | 0 0.5 0.5 0.2 0.3 0.6 0.7 2 |
| OBB | class x1 y1 x2 y2 x3 y3 x4 y4 | 0 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9 |
| Clasificar | Estructura de directorios | train/cats/, train/dogs/ |
Indicadores de visibilidad de pose: 0=no etiquetado, 1=etiquetado pero ocluido, 2=etiquetado y visible.
Archivos JSON con images, annotations, y categories arrays. Soporta detección (bbox), segmentation (polígono) y pose (keypoints) tareas. COCO utiliza coordenadas de píxeles absolutas que se convierten automáticamente a formato normalizado durante la carga.