Conjuntos de datos de clasificaci贸n de im谩genes
Estructura del conjunto de datos para las tareas de clasificaci贸n YOLO
Para Ultralytics YOLO tareas de clasificaci贸n, el conjunto de datos debe organizarse en una estructura espec铆fica de directorios divididos bajo el root
para facilitar la formaci贸n adecuada, las pruebas y los procesos de validaci贸n opcionales. Esta estructura incluye directorios separados para la formaci贸n (train
) y pruebas (test
), con un directorio opcional para la validaci贸n (val
).
Cada uno de estos directorios debe contener un subdirectorio por cada clase del conjunto de datos. Los subdirectorios llevan el nombre de la clase correspondiente y contienen todas las im谩genes de esa clase. Aseg煤rese de que cada archivo de imagen tiene un nombre 煤nico y se almacena en un formato com煤n, como JPEG o PNG.
Ejemplo de estructura de carpetas
Considere el conjunto de datos CIFAR-10 como ejemplo. La estructura de carpetas deber铆a ser la siguiente:
cifar-10-/
|
|-- train/
| |-- airplane/
| | |-- 10008_airplane.png
| | |-- 10009_airplane.png
| | |-- ...
| |
| |-- automobile/
| | |-- 1000_automobile.png
| | |-- 1001_automobile.png
| | |-- ...
| |
| |-- bird/
| | |-- 10014_bird.png
| | |-- 10015_bird.png
| | |-- ...
| |
| |-- ...
|
|-- test/
| |-- airplane/
| | |-- 10_airplane.png
| | |-- 11_airplane.png
| | |-- ...
| |
| |-- automobile/
| | |-- 100_automobile.png
| | |-- 101_automobile.png
| | |-- ...
| |
| |-- bird/
| | |-- 1000_bird.png
| | |-- 1001_bird.png
| | |-- ...
| |
| |-- ...
|
|-- val/ (optional)
| |-- airplane/
| | |-- 105_airplane.png
| | |-- 106_airplane.png
| | |-- ...
| |
| |-- automobile/
| | |-- 102_automobile.png
| | |-- 103_automobile.png
| | |-- ...
| |
| |-- bird/
| | |-- 1045_bird.png
| | |-- 1046_bird.png
| | |-- ...
| |
| |-- ...
Este enfoque estructurado garantiza que el modelo pueda aprender eficazmente de clases bien organizadas durante la fase de entrenamiento y evaluar con precisi贸n el rendimiento durante las fases de prueba y validaci贸n.
Utilizaci贸n
Ejemplo
Conjuntos de datos compatibles
Ultralytics admite los siguientes conjuntos de datos con descarga autom谩tica:
- Caltech 101: conjunto de datos que contiene im谩genes de 101 categor铆as de objetos para tareas de clasificaci贸n de im谩genes.
- Caltech 256: Una versi贸n ampliada de Caltech 101 con 256 categor铆as de objetos e im谩genes m谩s desafiantes.
- CIFAR-10: Un conjunto de datos de 60.000 im谩genes en color de 32x32 en 10 clases, con 6.000 im谩genes por clase.
- CIFAR-100: Una versi贸n ampliada de CIFAR-10 con 100 categor铆as de objetos y 600 im谩genes por clase.
- Moda-MNIST: Un conjunto de datos compuesto por 70 000 im谩genes en escala de grises de 10 categor铆as de moda para tareas de clasificaci贸n de im谩genes.
- ImageNet: Un conjunto de datos a gran escala para la detecci贸n de objetos y la clasificaci贸n de im谩genes con m谩s de 14 millones de im谩genes y 20.000 categor铆as.
- ImageNet-10: un subconjunto m谩s peque帽o de ImageNet con 10 categor铆as para agilizar la experimentaci贸n y las pruebas.
- Imagenette: Un subconjunto m谩s peque帽o de ImageNet que contiene 10 clases f谩cilmente distinguibles para agilizar el entrenamiento y las pruebas.
- Imagewoof: Un subconjunto m谩s desafiante de ImageNet que contiene 10 categor铆as de razas de perros para tareas de clasificaci贸n de im谩genes.
- MNIST: Un conjunto de datos de 70.000 im谩genes en escala de grises de d铆gitos manuscritos para tareas de clasificaci贸n de im谩genes.
- MNIST160: Las primeras 8 im谩genes de cada categor铆a MNIST del conjunto de datos MNIST. El conjunto de datos contiene 160 im谩genes en total.
A帽adir su propio conjunto de datos
Si dispone de su propio conjunto de datos y desea utilizarlo para entrenar modelos de clasificaci贸n con Ultralytics, aseg煤rese de que sigue el formato especificado anteriormente en "Formato del conjunto de datos" y, a continuaci贸n, apunte su data
al directorio del conjunto de datos.
PREGUNTAS FRECUENTES
驴C贸mo puedo estructurar mi conjunto de datos para las tareas de clasificaci贸n de YOLO ?
Para estructurar su conjunto de datos para las tareas de clasificaci贸n de Ultralytics YOLO , debe seguir un formato espec铆fico de directorios divididos. Organice su conjunto de datos en directorios separados para train
, test
y, opcionalmente val
. Cada uno de estos directorios debe contener subdirectorios con el nombre de cada clase, con las im谩genes correspondientes en su interior. Esto facilita los procesos de formaci贸n y evaluaci贸n. A modo de ejemplo, considere el formato del conjunto de datos CIFAR-10:
cifar-10-/
|-- train/
| |-- airplane/
| |-- automobile/
| |-- bird/
| ...
|-- test/
| |-- airplane/
| |-- automobile/
| |-- bird/
| ...
|-- val/ (optional)
| |-- airplane/
| |-- automobile/
| |-- bird/
| ...
Para m谩s detalles, visite Estructura del conjunto de datos para tareas de clasificaci贸n en YOLO .
驴Qu茅 conjuntos de datos admite Ultralytics YOLO para la clasificaci贸n de im谩genes?
Ultralytics YOLO admite la descarga autom谩tica de varios conjuntos de datos para la clasificaci贸n de im谩genes, incluidos:
- Caltech 101
- Caltech 256
- CIFAR-10
- CIFAR-100
- Moda-MNIST
- ImageNet
- ImageNet-10
- Imagenette
- Imagewoof
- MNIST
Estos conjuntos de datos est谩n estructurados de tal forma que resultan f谩ciles de utilizar con YOLO. La p谩gina de cada conjunto de datos ofrece m谩s detalles sobre su estructura y aplicaciones.
驴C贸mo a帽ado mi propio conjunto de datos para la clasificaci贸n de im谩genes YOLO ?
Para utilizar su propio conjunto de datos con Ultralytics YOLO , aseg煤rese de que sigue el formato de directorio especificado necesario para la tarea de clasificaci贸n, con directorios separados train
, test
y, opcionalmente val
y subdirectorios para cada clase que contenga las im谩genes respectivas. Una vez que su conjunto de datos est茅 estructurado correctamente, apunte el archivo data
al directorio ra铆z del conjunto de datos al inicializar el script de entrenamiento. He aqu铆 un ejemplo en Python:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="path/to/your/dataset", epochs=100, imgsz=640)
Encontrar谩 m谩s detalles en la secci贸n A帽adir su propio conjunto de datos.
驴Por qu茅 utilizar Ultralytics YOLO para la clasificaci贸n de im谩genes?
Ultralytics YOLO ofrece varias ventajas para la clasificaci贸n de im谩genes, entre ellas
- Modelos preentrenados: Carga modelos preentrenados como
yolo11n-cls.pt
para poner en marcha su proceso de formaci贸n. - Facilidad de uso: API sencilla y comandos CLI para formaci贸n y evaluaci贸n.
- Alto rendimiento: Precisi贸n y velocidad de vanguardia, ideal para aplicaciones en tiempo real.
- Compatibilidad con m煤ltiples conjuntos de datos: Integraci贸n perfecta con varios conjuntos de datos populares como CIFAR-10, ImageNet, etc.
- Comunidad y asistencia: Acceso a amplia documentaci贸n y a una comunidad activa para la resoluci贸n de problemas y mejoras.
Para m谩s informaci贸n y aplicaciones reales, puede consultar Ultralytics YOLO.
驴C贸mo puedo entrenar un modelo utilizando Ultralytics YOLO ?
Entrenar un modelo utilizando Ultralytics YOLO puede hacerse f谩cilmente tanto en Python como en CLI. He aqu铆 un ejemplo:
Ejemplo
Estos ejemplos demuestran el sencillo proceso de entrenamiento de un modelo YOLO utilizando cualquiera de los dos enfoques. Para m谩s informaci贸n, visite la secci贸n Uso.