Gu铆a para el ensayo de modelos
Introducci贸n
Una vez entrenado y evaluado el modelo, es hora de probarlo. Las pruebas de modelos consisten en evaluar su rendimiento en situaciones reales. En las pruebas se tienen en cuenta factores como la precisi贸n, la fiabilidad, la imparcialidad y la facilidad de comprensi贸n de las decisiones del modelo. El objetivo es asegurarse de que el modelo funciona seg煤n lo previsto, ofrece los resultados esperados y se ajusta al objetivo general de su aplicaci贸n o proyecto.
La prueba de modelos es bastante similar a la evaluaci贸n de modelos, pero son dos pasos distintos en un proyecto de visi贸n por ordenador. En la evaluaci贸n de modelos se utilizan m茅tricas y gr谩ficos para valorar la precisi贸n del modelo. Por otro lado, la prueba de modelos comprueba si el comportamiento aprendido del modelo coincide con las expectativas. En esta gu铆a, exploraremos estrategias para probar sus modelos de visi贸n por ordenador.
Ensayo de modelos Vs. Evaluaci贸n de modelos
En primer lugar, entendamos la diferencia entre evaluaci贸n de modelos y pruebas con un ejemplo.
Supongamos que ha entrenado un modelo de visi贸n por ordenador para reconocer perros y gatos, y quiere desplegar este modelo en una tienda de mascotas para controlar a los animales. Durante la fase de evaluaci贸n del modelo, se utiliza un conjunto de datos etiquetados para calcular par谩metros como la exactitud, la precisi贸n, la recuperaci贸n y la puntuaci贸n F1. Por ejemplo, el modelo podr铆a tener una precisi贸n del 98% a la hora de distinguir entre perros y gatos en un conjunto de datos determinado.
Tras la evaluaci贸n, se pone a prueba el modelo utilizando im谩genes de una tienda de animales para comprobar su capacidad para identificar perros y gatos en condiciones m谩s variadas y realistas. Se comprueba si puede etiquetar correctamente a perros y gatos en movimiento, con distintas condiciones de iluminaci贸n o parcialmente ocultos por objetos como juguetes o muebles. La prueba de modelos comprueba que el modelo se comporta como se espera fuera del entorno de evaluaci贸n controlado.
Preparaci贸n de los ensayos con modelos
Los modelos de visi贸n artificial aprenden de conjuntos de datos detectando patrones, haciendo predicciones y evaluando su rendimiento. Estos conjuntos de datos suelen dividirse en conjuntos de entrenamiento y de prueba para simular las condiciones del mundo real. Los datos de entrenamiento ense帽an al modelo, mientras que los datos de prueba verifican su precisi贸n.
Aqu铆 tienes dos puntos que debes tener en cuenta antes de probar tu modelo:
- Representaci贸n realista: Los datos de prueba previamente no vistos deben ser similares a los datos que el modelo tendr谩 que manejar cuando se despliegue. Esto ayuda a obtener una comprensi贸n realista de las capacidades del modelo.
- Tama帽o suficiente: El tama帽o del conjunto de datos de prueba debe ser lo suficientemente grande como para proporcionar informaci贸n fiable sobre el rendimiento del modelo.
Comprobaci贸n del modelo de visi贸n por ordenador
Estos son los pasos clave que debe seguir para probar su modelo de visi贸n por ordenador y comprender su rendimiento.
- Ejecutar predicciones: Utiliza el modelo para realizar predicciones sobre el conjunto de datos de prueba.
- Comparar predicciones: Comprueba en qu茅 medida coinciden las predicciones del modelo con las etiquetas reales (ground truth).
- Calcule las m茅tricas de rendimiento: Calcule m茅tricas como la exactitud, la precisi贸n, la recuperaci贸n y la puntuaci贸n F1 para comprender los puntos fuertes y d茅biles del modelo. Las pruebas se centran en c贸mo estas m茅tricas reflejan el rendimiento en el mundo real.
- Visualice los resultados: Cree ayudas visuales como matrices de confusi贸n y curvas ROC. Le ayudar谩n a detectar 谩reas espec铆ficas en las que el modelo podr铆a no funcionar bien en aplicaciones pr谩cticas.
A continuaci贸n, pueden analizarse los resultados de las pruebas:
- Im谩genes mal clasificadas: Identifique y revise las im谩genes que el modelo ha clasificado err贸neamente para comprender en qu茅 se equivoca.
- An谩lisis de errores: Realice un an谩lisis exhaustivo de los errores para comprender los tipos de errores (por ejemplo, falsos positivos frente a falsos negativos) y sus posibles causas.
- Sesgo e imparcialidad: Compruebe si hay sesgos en las predicciones del modelo. Aseg煤rese de que el modelo funciona igual de bien en los distintos subconjuntos de datos, especialmente si incluye atributos sensibles como la raza, el sexo o la edad.
Pruebe su modelo YOLO11
Para probar su modelo YOLO11 , puede utilizar el modo de validaci贸n. Es una forma sencilla de comprender los puntos fuertes del modelo y las 谩reas que necesitan mejoras. Adem谩s, tendr谩 que formatear el conjunto de datos de prueba correctamente para YOLO11. Para obtener m谩s informaci贸n sobre c贸mo utilizar el modo de validaci贸n, consulte la p谩gina de documentaci贸n sobre validaci贸n de modelos.
Uso de YOLO11 para predecir en m煤ltiples im谩genes de prueba
Si desea probar su modelo YOLO11 entrenado en varias im谩genes almacenadas en una carpeta, puede hacerlo f谩cilmente de una sola vez. En lugar de utilizar el modo de validaci贸n, que normalmente se utiliza para evaluar el rendimiento del modelo en un conjunto de validaci贸n y proporcionar m茅tricas detalladas, es posible que s贸lo desee ver las predicciones en todas las im谩genes de su conjunto de prueba. Para ello, puede utilizar el modo de predicci贸n.
Diferencia entre los modos de validaci贸n y predicci贸n
- Modo de validaci贸n: Se utiliza para evaluar el rendimiento del modelo comparando las predicciones con etiquetas conocidas (ground truth). Proporciona m茅tricas detalladas como la exactitud, la precisi贸n, la recuperaci贸n y la puntuaci贸n F1.
- Modo predicci贸n: Se utiliza para ejecutar el modelo en datos nuevos y no vistos para generar predicciones. No proporciona m茅tricas de rendimiento detalladas, pero permite ver el rendimiento del modelo en im谩genes del mundo real.
Ejecutar YOLO11 Predicciones sin formaci贸n personalizada
Si est谩 interesado en probar el modelo b谩sico YOLO11 para saber si puede utilizarse para su aplicaci贸n sin un entrenamiento personalizado, puede utilizar el modo de predicci贸n. Aunque el modelo est谩 preentrenado en conjuntos de datos como COCO, la ejecuci贸n de predicciones en su propio conjunto de datos puede darle una idea r谩pida de lo bien que podr铆a funcionar en su contexto espec铆fico.
Sobreajuste e infraajuste en el aprendizaje autom谩tico
Al probar un modelo de aprendizaje autom谩tico, especialmente en visi贸n por ordenador, es importante tener cuidado con el sobreajuste y el infraajuste. Estos problemas pueden afectar significativamente al funcionamiento del modelo con nuevos datos.
Sobreajuste
La sobreadaptaci贸n se produce cuando el modelo aprende demasiado bien los datos de entrenamiento, incluidos el ruido y los detalles que no se generalizan a los nuevos datos. En visi贸n por ordenador, esto significa que el modelo puede funcionar muy bien con las im谩genes de entrenamiento, pero tener problemas con las nuevas.
Signos de sobreajuste
- Alta precisi贸n de entrenamiento, baja precisi贸n de validaci贸n: Si su modelo funciona muy bien en los datos de entrenamiento pero mal en los datos de validaci贸n o prueba, es probable que est茅 sobreajustado.
- Inspecci贸n visual: A veces, se puede observar un sobreajuste si el modelo es demasiado sensible a peque帽os cambios o detalles irrelevantes en las im谩genes.
Insuficiente
La inadaptaci贸n se produce cuando el modelo no puede captar los patrones subyacentes en los datos. En visi贸n por ordenador, un modelo mal ajustado puede incluso no reconocer objetos correctamente en las im谩genes de entrenamiento.
Signos de inadaptaci贸n
- Precisi贸n de entrenamiento baja: Si su modelo no puede alcanzar una precisi贸n alta en el conjunto de entrenamiento, es posible que no est茅 ajustado correctamente.
- Clasificaci贸n visual err贸nea: La incapacidad constante para reconocer caracter铆sticas u objetos obvios sugiere un ajuste insuficiente.
Equilibrio entre sobreadaptaci贸n e inadaptaci贸n
La clave est谩 en encontrar un equilibrio entre la sobreadaptaci贸n y la inadaptaci贸n. Lo ideal es que un modelo funcione bien tanto en los conjuntos de datos de entrenamiento como en los de validaci贸n. Supervisar regularmente el rendimiento de tu modelo mediante m茅tricas e inspecciones visuales, junto con aplicar las estrategias adecuadas, puede ayudarte a conseguir los mejores resultados.
Fuga de datos en visi贸n por ordenador y c贸mo evitarla
Al probar el modelo, es importante tener en cuenta la fuga de datos. La fuga de datos se produce cuando se utiliza accidentalmente informaci贸n ajena al conjunto de datos de entrenamiento para entrenar el modelo. El modelo puede parecer muy preciso durante el entrenamiento, pero no funcionar谩 bien con datos nuevos y desconocidos cuando se produzca una fuga de datos.
Por qu茅 se producen las fugas de datos
La fuga de datos puede ser dif铆cil de detectar y a menudo se debe a sesgos ocultos en los datos de entrenamiento. Estas son algunas de las formas m谩s comunes en las que puede producirse en visi贸n por computador:
- Sesgo de la c谩mara: los diferentes 谩ngulos, la iluminaci贸n, las sombras y los movimientos de la c谩mara pueden introducir patrones no deseados.
- Sesgo de superposici贸n: los logotipos, las marcas de tiempo u otras superposiciones en las im谩genes pueden inducir a error al modelo.
- Sesgo de fuentes y objetos: las fuentes u objetos espec铆ficos que aparecen con frecuencia en determinadas clases pueden sesgar el aprendizaje del modelo.
- Sesgo espacial: los desequilibrios entre el primer plano y el segundo plano, las distribuciones de los cuadros delimitadores y las ubicaciones de los objetos pueden afectar al entrenamiento.
- Sesgo de etiqueta y dominio: Las etiquetas incorrectas o los cambios en los tipos de datos pueden provocar fugas.
Detecci贸n de fugas de datos
Para encontrar fugas de datos, puede:
- Compruebe el rendimiento: Si los resultados del modelo son sorprendentemente buenos, es posible que tenga fugas.
- F铆jese en la importancia de las caracter铆sticas: Si una caracter铆stica es mucho m谩s importante que otras, podr铆a indicar una fuga.
- Inspecci贸n visual: Comprueba que las decisiones del modelo tienen sentido de forma intuitiva.
- Verifique la separaci贸n de datos: Aseg煤rese de que los datos se dividieron correctamente antes de cualquier procesamiento.
Evitar la fuga de datos
Para evitar la fuga de datos, utilice un conjunto de datos diverso con im谩genes o v铆deos de diferentes c谩maras y entornos. Revise cuidadosamente sus datos y compruebe que no haya sesgos ocultos, como que todas las muestras positivas se hayan tomado a una hora concreta del d铆a. Evitar la fuga de datos ayudar谩 a que sus modelos de visi贸n por ordenador sean m谩s fiables y eficaces en situaciones del mundo real.
Qu茅 viene despu茅s de los ensayos con modelos
Una vez probado el modelo, los pasos siguientes depender谩n de los resultados. Si su modelo funciona bien, puede implantarlo en un entorno real. Si los resultados no son satisfactorios, tendr谩 que introducir mejoras. Esto puede implicar analizar los errores, recopilar m谩s datos, mejorar la calidad de los datos, ajustar los hiperpar谩metros y volver a entrenar el modelo.
脷nase a la conversaci贸n sobre IA
Formar parte de una comunidad de entusiastas de la visi贸n por computador puede ayudar a resolver problemas y aprender de forma m谩s eficiente. Aqu铆 tienes algunas formas de conectar, buscar ayuda y compartir tus ideas.
Recursos comunitarios
- Problemas en GitHub: Explora el repositorio GitHub deYOLO11 y utiliza la pesta帽a Cuestiones para hacer preguntas, informar de errores y sugerir nuevas funciones. La comunidad y los mantenedores son muy activos y est谩n dispuestos a ayudar.
- Ultralytics Servidor Discord: 脷nete al servidor Discord deUltralytics para chatear con otros usuarios y desarrolladores, obtener ayuda y compartir tus experiencias.
Documentaci贸n oficial
- Ultralytics YOLO11 Documentaci贸n: Consulte la documentaci贸n oficial de YOLO11 para obtener gu铆as detalladas y consejos 煤tiles sobre diversos proyectos de visi贸n por ordenador.
Estos recursos le ayudar谩n a superar los retos y a mantenerse al d铆a de las 煤ltimas tendencias y pr谩cticas dentro de la comunidad de visi贸n por ordenador.
En resumen
La creaci贸n de modelos de visi贸n por ordenador fiables se basa en pruebas rigurosas de los modelos. Al probar el modelo con datos que no se han visto previamente, podemos analizarlo y detectar puntos d茅biles como el sobreajuste y la fuga de datos. Solucionar estos problemas antes de su despliegue ayuda a que el modelo funcione bien en aplicaciones reales. Es importante recordar que la comprobaci贸n de modelos es tan crucial como su evaluaci贸n para garantizar su 茅xito y eficacia a largo plazo.
PREGUNTAS FRECUENTES
驴Cu谩les son las principales diferencias entre la evaluaci贸n de modelos y la comprobaci贸n de modelos en visi贸n por ordenador?
La evaluaci贸n y la prueba de modelos son pasos distintos en un proyecto de visi贸n por ordenador. La evaluaci贸n de un modelo consiste en utilizar un conjunto de datos etiquetados para calcular par谩metros como la exactitud, la precisi贸n, la recuperaci贸n y la puntuaci贸n F1, lo que proporciona informaci贸n sobre el rendimiento del modelo con un conjunto de datos controlado. Por otro lado, la prueba de modelos eval煤a el rendimiento del modelo en situaciones reales aplic谩ndolo a datos nuevos que no se han visto, lo que garantiza que el comportamiento aprendido del modelo se ajusta a las expectativas fuera del entorno de evaluaci贸n. Para obtener una gu铆a detallada, consulte los pasos de un proyecto de visi贸n por ordenador.
驴C贸mo puedo probar mi modelo Ultralytics YOLO11 en varias im谩genes?
Para probar su modelo Ultralytics YOLO11 en varias im谩genes, puede utilizar el modo de predicci贸n. Este modo le permite ejecutar el modelo en datos nuevos y desconocidos para generar predicciones sin proporcionar m茅tricas detalladas. Es ideal para realizar pruebas de rendimiento en el mundo real con grandes conjuntos de im谩genes almacenados en una carpeta. Para evaluar las m茅tricas de rendimiento, utilice el modo de validaci贸n.
驴Qu茅 debo hacer si mi modelo de visi贸n por ordenador muestra signos de ajuste excesivo o insuficiente?
Para abordar el sobreajuste:
- T茅cnicas de regularizaci贸n como el abandono.
- Aumentar el tama帽o del conjunto de datos de entrenamiento.
- Simplificar la arquitectura del modelo.
Para abordar la inadaptaci贸n:
- Utilizar un modelo m谩s complejo.
- Ofrezca funciones m谩s relevantes.
- Aumentar las iteraciones o 茅pocas de entrenamiento.
Revise las im谩genes mal clasificadas, realice un an谩lisis exhaustivo de los errores y realice un seguimiento peri贸dico de las m茅tricas de rendimiento para mantener un equilibrio. Para obtener m谩s informaci贸n sobre estos conceptos, consulte nuestra secci贸n sobre sobreajuste e infraajuste.
驴C贸mo detectar y evitar la fuga de datos en visi贸n por ordenador?
Para detectar fugas de datos:
- Compruebe que el rendimiento de las pruebas no es inusualmente alto.
- Compruebe la importancia de las caracter铆sticas para obtener informaci贸n inesperada.
- Revisar intuitivamente las decisiones del modelo.
- Garantizar la correcta divisi贸n de los datos antes del tratamiento.
Para evitar la fuga de datos:
- Utilizar diversos conjuntos de datos con varios entornos.
- Revise cuidadosamente los datos para detectar sesgos ocultos.
- Garantizar que no haya solapamiento de informaci贸n entre los conjuntos de entrenamiento y prueba.
Para conocer estrategias detalladas sobre la prevenci贸n de la fuga de datos, consulte nuestra secci贸n sobre Fuga de datos en visi贸n por ordenador.
驴Qu茅 pasos debo seguir despu茅s de probar mi modelo de visi贸n artificial?
Tras las pruebas, si el rendimiento del modelo cumple los objetivos del proyecto, proceda a su implantaci贸n. Si los resultados son insatisfactorios, consid茅relo:
- An谩lisis de errores.
- Recopilaci贸n de datos m谩s diversos y de mayor calidad.
- Ajuste de hiperpar谩metros.
- Reentrenamiento del modelo.
Obtenga informaci贸n de la secci贸n Pruebas de modelos frente a evaluaci贸n de modelos. Evaluaci贸n de modelos para perfeccionar y mejorar la eficacia de los modelos en aplicaciones reales.
驴C贸mo puedo realizar predicciones en YOLO11 sin un entrenamiento personalizado?
Puede ejecutar predicciones utilizando el modelo preentrenado YOLO11 en su conjunto de datos para ver si se adapta a las necesidades de su aplicaci贸n. Utilice el modo de predicci贸n para hacerse una idea r谩pida de los resultados de rendimiento sin necesidad de realizar un entrenamiento personalizado.