Visi贸n general de los conjuntos de datos de detecci贸n de objetos
El entrenamiento de un modelo de detecci贸n de objetos s贸lido y preciso requiere un conjunto de datos completo. En esta gu铆a se presentan varios formatos de conjuntos de datos compatibles con el modelo Ultralytics YOLO y se ofrece informaci贸n sobre su estructura, su uso y c贸mo convertirlos de un formato a otro.
Formatos de datos admitidos
Ultralytics YOLO formato
El formato Ultralytics YOLO es un formato de configuraci贸n de conjuntos de datos que permite definir el directorio ra铆z del conjunto de datos, las rutas relativas a los directorios de im谩genes de entrenamiento/validaci贸n/prueba o *.txt
que contienen las rutas de las im谩genes, y un diccionario de nombres de clases. He aqu铆 un ejemplo:
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes (80 COCO classes)
names:
0: person
1: bicycle
2: car
# ...
77: teddy bear
78: hair drier
79: toothbrush
Las etiquetas de este formato deben exportarse al formato YOLO con una *.txt
por imagen. Si no hay objetos en una imagen, no hay *.txt
es necesario. La direcci贸n *.txt
debe formatearse con una fila por objeto en class x_center y_center width height
formato. Las coordenadas de la casilla deben estar en xywh normalizado (de 0 a 1). Si sus cajas est谩n en p铆xeles, debe dividir x_center
y width
por ancho de imagen, y y_center
y height
por la altura de la imagen. Los n煤meros de clase deben tener 铆ndice cero (empezar por 0).
El archivo de etiquetas correspondiente a la imagen anterior contiene 2 personas (clase 0
) y un empate (clase 27
):
Cuando utilice el formato Ultralytics YOLO , organice sus im谩genes y etiquetas de entrenamiento y validaci贸n como se muestra en el ejemplo del conjunto de datos COCO8 a continuaci贸n.
Utilizaci贸n
A continuaci贸n te explicamos c贸mo utilizar estos formatos para entrenar tu modelo:
Ejemplo
Conjuntos de datos compatibles
A continuaci贸n figura una lista de los conjuntos de datos compatibles y una breve descripci贸n de cada uno de ellos:
- Argoverse: Un conjunto de datos que contiene datos de seguimiento 3D y previsi贸n de movimiento de entornos urbanos con abundantes anotaciones.
- COCO: Common Objects in Context (COCO) es un conjunto de datos de detecci贸n, segmentaci贸n y subtitulaci贸n de objetos a gran escala con 80 categor铆as de objetos.
- LVIS: conjunto de datos de detecci贸n, segmentaci贸n y subtitulaci贸n de objetos a gran escala con 1203 categor铆as de objetos.
- COCO8: un subconjunto m谩s peque帽o de las 4 primeras im谩genes de COCO train y COCO val, adecuado para pruebas r谩pidas.
- COCO128: un subconjunto m谩s peque帽o de las 128 primeras im谩genes de COCO train y COCO val, adecuado para las pruebas.
- Global Wheat 2020: Un conjunto de datos que contiene im谩genes de cabezas de trigo para el Global Wheat Challenge 2020.
- Objetos365: Un conjunto de datos a gran escala de alta calidad para la detecci贸n de objetos con 365 categor铆as de objetos y m谩s de 600K im谩genes anotadas.
- OpenImagesV7: un amplio conjunto de datos de Google con 1,7 millones de im谩genes de entrenamiento y 42.000 im谩genes de validaci贸n.
- SKU-110K: Un conjunto de datos de detecci贸n de objetos densos en entornos comerciales con m谩s de 11 000 im谩genes y 1,7 millones de cuadros delimitadores.
- VisDrone: Un conjunto de datos que contiene datos de detecci贸n de objetos y seguimiento multiobjeto a partir de im谩genes capturadas por drones con m谩s de 10.000 im谩genes y secuencias de v铆deo.
- VOC: El conjunto de datos Pascal Visual Object Classes (VOC) para la detecci贸n y segmentaci贸n de objetos con 20 clases de objetos y m谩s de 11.000 im谩genes.
- xView: Un conjunto de datos para la detecci贸n de objetos en im谩genes a茅reas con 60 categor铆as de objetos y m谩s de 1 mill贸n de objetos anotados.
- Roboflow 100: una prueba comparativa de detecci贸n de objetos con 100 conjuntos de datos que abarcan siete dominios de im谩genes para la evaluaci贸n exhaustiva de modelos.
- Tumor cerebral: Un conjunto de datos para detectar tumores cerebrales incluye im谩genes de resonancia magn茅tica o tomograf铆a computarizada con detalles sobre la presencia, localizaci贸n y caracter铆sticas del tumor.
- Vida salvaje africana: Conjunto de datos con im谩genes de la fauna africana, como b煤falos, elefantes, rinocerontes y cebras.
- Firma: Un conjunto de datos con im谩genes de varios documentos con firmas anotadas, que sirve de apoyo a la investigaci贸n sobre verificaci贸n de documentos y detecci贸n de fraudes.
A帽adir su propio conjunto de datos
Si dispone de su propio conjunto de datos y desea utilizarlo para entrenar modelos de detecci贸n con el formato Ultralytics YOLO , aseg煤rese de que sigue el formato especificado anteriormente en "Ultralytics YOLO format". Convierta sus anotaciones al formato requerido y especifique las rutas, el n煤mero de clases y los nombres de las clases en el archivo de configuraci贸n YAML.
Portar o convertir formatos de etiquetas
COCO Dataset Format a YOLO Format
Puede convertir f谩cilmente etiquetas del popular formato de conjunto de datos COCO al formato YOLO utilizando el siguiente fragmento de c贸digo:
Ejemplo
Esta herramienta de conversi贸n puede utilizarse para convertir el conjunto de datos COCO o cualquier conjunto de datos en formato COCO al formato Ultralytics YOLO .
No olvide volver a comprobar si el conjunto de datos que desea utilizar es compatible con su modelo y sigue las convenciones de formato necesarias. Los conjuntos de datos formateados correctamente son cruciales para entrenar con 茅xito modelos de detecci贸n de objetos.
PREGUNTAS FRECUENTES
驴Cu谩l es el formato del conjunto de datos Ultralytics YOLO y c贸mo estructurarlo?
El formato Ultralytics YOLO es una configuraci贸n estructurada para definir conjuntos de datos en sus proyectos de formaci贸n. Se trata de establecer rutas a las im谩genes de entrenamiento, validaci贸n y prueba y las etiquetas correspondientes. Por ejemplo:
path: ../datasets/coco8 # dataset root directory
train: images/train # training images (relative to 'path')
val: images/val # validation images (relative to 'path')
test: # optional test images
names:
0: person
1: bicycle
2: car
# ...
Las etiquetas se guardan en *.txt
con un archivo por imagen, formateado como class x_center y_center width height
con coordenadas normalizadas. Para obtener una gu铆a detallada, consulte la p谩gina Ejemplo de conjunto de datos COCO8.
驴C贸mo se convierte un conjunto de datos COCO al formato YOLO ?
Puede convertir un conjunto de datos COCO al formato YOLO utilizando las herramientas de conversi贸n de Ultralytics . He aqu铆 un m茅todo r谩pido:
from ultralytics.data.converter import convert_coco
convert_coco(labels_dir="path/to/coco/annotations/")
Este c贸digo convertir谩 sus anotaciones COCO al formato YOLO , permitiendo una integraci贸n perfecta con los modelos Ultralytics YOLO . Para m谩s detalles, visite la secci贸n Portar o convertir formatos de etiquetas.
驴Qu茅 conjuntos de datos admite Ultralytics YOLO para la detecci贸n de objetos?
Ultralytics YOLO admite una amplia gama de conjuntos de datos, incluidos:
Cada p谩gina de conjunto de datos proporciona informaci贸n detallada sobre la estructura y el uso adaptados para un entrenamiento eficaz de YOLO11 . Consulta la lista completa en la secci贸n de conjuntos de datos compatibles.
驴C贸mo empiezo a entrenar un modelo YOLO11 utilizando mi conjunto de datos?
Para empezar a entrenar un modelo YOLO11 , aseg煤rese de que el conjunto de datos tiene el formato correcto y las rutas est谩n definidas en un archivo YAML. Utilice el siguiente script para comenzar el entrenamiento:
Ejemplo
Consulte la secci贸n Uso para obtener m谩s detalles sobre la utilizaci贸n de los distintos modos, incluidos los comandos CLI .
驴D贸nde puedo encontrar ejemplos pr谩cticos de la utilizaci贸n de Ultralytics YOLO para la detecci贸n de objetos?
Ultralytics ofrece numerosos ejemplos y gu铆as pr谩cticas para utilizar YOLO11 en diversas aplicaciones. Para obtener una visi贸n general completa, visite el blogUltralytics , donde encontrar谩 estudios de casos, tutoriales detallados e historias de la comunidad que muestran la detecci贸n de objetos, la segmentaci贸n y mucho m谩s con YOLO11. Para ver ejemplos concretos, consulte la secci贸n Uso de la documentaci贸n.