Comprensión de los pasos clave en un proyecto de visión artificial

Q: What steps should I follow to augment and split my dataset effectively?

Dividir su conjunto de datos antes del aumento ayuda a validar el rendimiento del modelo en datos originales e inalterados. Siga estos pasos: Después de dividir, aplique técnicas de aumento de datos como rotación, escalado e inversión para aumentar la diversidad del conjunto de datos. Bibliotecas como Albumentations y OpenCV pueden ayudar. Ultralytics también ofrece ajustes de aumento incorporados para mayor comodidad.

Introducción

La visión artificial es un subcampo de la inteligencia artificial (IA) que ayuda a las computadoras a ver y comprender el mundo como lo hacen los humanos. Procesa y analiza imágenes o vídeos para extraer información, reconocer patrones y tomar decisiones basadas en esos datos.

Ver: Cómo hacer Visión Artificial Proyectos | Una guía paso a paso

Las técnicas de visión artificial como la detección de objetos, la clasificación de imágenes y la segmentación de instancias pueden aplicarse en diversos sectores, desde la conducción autónoma hasta las imágenes médicas, para obtener información valiosa.

Trabajar en sus propios proyectos de visión artificial es una excelente manera de comprender y aprender más sobre esta disciplina. Sin embargo, un proyecto de visión artificial puede constar de muchos pasos y, al principio, puede parecer confuso. Al final de esta guía, estará familiarizado con los pasos que implica un proyecto de visión artificial. Recorreremos todo el proceso, desde el inicio hasta el final del proyecto, explicando la importancia de cada parte.

Una visión general de un proyecto de visión artificial

Antes de analizar los detalles de cada paso involucrado en un proyecto de visión artificial, veamos el proceso general. Si comenzara un proyecto de visión artificial hoy, seguiría los siguientes pasos:

Su primera prioridad debe ser comprender los requisitos de su proyecto.
Luego, deberá recopilar y etiquetar con precisión las imágenes que ayudarán a entrenar su modelo.
A continuación, limpiarías tus datos y aplicarías técnicas de aumento para prepararlos para el entrenamiento del modelo.
Después del entrenamiento del modelo, debes probar y evaluar minuciosamente tu modelo para asegurarte de que funciona de manera consistente en diferentes condiciones.
Finalmente, implementaría su modelo en el mundo real y lo actualizaría en función de nuevos conocimientos y comentarios.

Descripción General de los Pasos del Proyecto de Visión Artificial

Ahora que sabemos qué esperar, vamos a sumergirnos directamente en los pasos y hacer que su proyecto avance.

Paso 1: Definición de los Objetivos de su Proyecto

El primer paso en cualquier proyecto de visión artificial es definir claramente el problema que está tratando de resolver. Conocer el objetivo final le ayuda a comenzar a construir una solución. Esto es especialmente cierto cuando se trata de visión artificial porque el objetivo de su proyecto afectará directamente a la tarea de visión artificial en la que debe concentrarse.

Aquí hay algunos ejemplos de objetivos del proyecto y las tareas de visión artificial que se pueden utilizar para alcanzar estos objetivos:

Objetivo: Desarrollar un sistema que pueda supervisar y gestionar el flujo de diferentes tipos de vehículos en las autopistas, mejorando la gestión del tráfico y la seguridad.
- Tarea de Visión Artificial: La detección de objetos es ideal para la monitorización del tráfico porque localiza e identifica eficientemente múltiples vehículos. Es menos exigente computacionalmente que la segmentación de imágenes, que proporciona detalles innecesarios para esta tarea, lo que garantiza un análisis más rápido y en tiempo real.
Objetivo: Desarrollar una herramienta que ayude a los radiólogos proporcionando contornos precisos, a nivel de píxel, de los tumores en las exploraciones de imágenes médicas.
- Tarea de Visión Artificial: La segmentación de imágenes es adecuada para imágenes médicas porque proporciona límites precisos y detallados de los tumores que son cruciales para evaluar el tamaño, la forma y la planificación del tratamiento.
Objetivo: Crear un sistema digital que clasifique diversos documentos (por ejemplo, facturas, recibos, documentación legal) para mejorar la eficiencia organizativa y la recuperación de documentos.
- Tarea de visión artificial: La clasificación de imágenes es ideal aquí, ya que gestiona un documento a la vez, sin necesidad de considerar la posición del documento en la imagen. Este enfoque simplifica y acelera el proceso de clasificación.

Paso 1.5: Selección del Modelo Correcto y Enfoque de Entrenamiento

Después de comprender el objetivo del proyecto y las tareas adecuadas de visión artificial, una parte esencial de la definición del objetivo del proyecto es seleccionar el modelo correcto y el enfoque de entrenamiento.

Dependiendo del objetivo, puede optar por seleccionar el modelo primero o después de ver qué datos puede recopilar en el Paso 2. Por ejemplo, suponga que su proyecto depende en gran medida de la disponibilidad de tipos de datos específicos. En ese caso, puede ser más práctico recopilar y analizar los datos primero antes de seleccionar un modelo. Por otro lado, si tiene una comprensión clara de los requisitos del modelo, puede elegir el modelo primero y luego recopilar datos que se ajusten a esas especificaciones.

La elección entre entrenar desde cero o utilizar transfer learning influye en la preparación de sus datos. El entrenamiento desde cero requiere un conjunto de datos diverso para construir la comprensión del modelo desde sus cimientos. El transfer learning, por otro lado, le permite utilizar un modelo preentrenado y adaptarlo con un conjunto de datos más pequeño y específico. Además, la elección de un modelo específico para entrenar determinará cómo debe preparar sus datos, como el redimensionamiento de imágenes o la adición de anotaciones, según los requisitos específicos del modelo.

Entrenamiento desde cero frente al uso del aprendizaje por transferencia

Nota: Al elegir un modelo, considere su implementación para garantizar la compatibilidad y el rendimiento. Por ejemplo, los modelos ligeros son ideales para el edge computing debido a su eficiencia en dispositivos con recursos limitados. Para obtener más información sobre los puntos clave relacionados con la definición de su proyecto, lea nuestra guía sobre cómo definir los objetivos de su proyecto y seleccionar el modelo adecuado.

Antes de comenzar con el trabajo práctico de un proyecto de visión artificial, es importante tener una comprensión clara de estos detalles. Verifique que haya considerado lo siguiente antes de pasar al Paso 2:

Defina claramente el problema que está intentando resolver.
Determine el objetivo final de su proyecto.
Identifique la tarea específica de visión artificial necesaria (por ejemplo, detección de objetos, clasificación de imágenes, segmentación de imágenes).
Decida si entrenar un modelo desde cero o utilizar el aprendizaje por transferencia.
Seleccione el modelo apropiado para su tarea y necesidades de implementación.

Paso 2: Recopilación y Anotación de Datos

La calidad de sus modelos de visión artificial depende de la calidad de su conjunto de datos. Puede recopilar imágenes de internet, tomar sus propias fotografías o utilizar conjuntos de datos preexistentes. Aquí tiene algunos excelentes recursos para descargar conjuntos de datos de alta calidad: Motor de Búsqueda de Conjuntos de Datos de Google, Repositorio de Aprendizaje Automático de UC Irvine y Conjuntos de Datos de Kaggle.

Algunas bibliotecas, como Ultralytics, ofrecen soporte integrado para varios conjuntos de datos, lo que facilita la puesta en marcha con datos de alta calidad. Estas bibliotecas a menudo incluyen utilidades para usar conjuntos de datos populares sin problemas, lo que puede ahorrarle mucho tiempo y esfuerzo en las etapas iniciales de su proyecto.

Sin embargo, si decides recopilar imágenes o tomar tus propias fotografías, tendrás que anotar tus datos. La anotación de datos es el proceso de etiquetar los datos para transmitir conocimientos al modelo. El tipo de anotación de datos con el que trabajarás depende de la técnica de visión artificial que utilices. A continuación te ofrecemos algunos ejemplos:

Clasificación de imágenes: Etiquetará la imagen completa como una sola clase.
Detección de objetos: Dibujarás bounding boxes alrededor de cada objeto en la imagen y etiquetarás cada box.
Segmentación de imágenes: Etiquetarás cada píxel de la imagen según el objeto al que pertenece, creando límites de objeto detallados.

Anotaciones de bounding box, polígono y puntos clave

La recopilación y el etiquetado de datos pueden ser un esfuerzo manual que requiere mucho tiempo. Las herramientas de etiquetado pueden ayudar a facilitar este proceso. Aquí tienes algunas herramientas de etiquetado de código abierto útiles: LabeI Studio, CVAT y Labelme.

Paso 3: Aumento de datos y división de su conjunto de datos

Después de recolectar y anotar tus datos de imagen, es importante primero dividir tu conjunto de datos en conjuntos de entrenamiento, validación y prueba antes de realizar el aumento de datos. Dividir tu conjunto de datos antes del aumento es crucial para probar y validar tu modelo en datos originales e inalterados. Ayuda a evaluar con precisión qué tan bien se generaliza el modelo a datos nuevos y no vistos.

Aquí se explica cómo dividir sus datos:

Conjunto de entrenamiento: Es la porción más grande de tus datos, típicamente el 70-80% del total, utilizada para entrenar tu modelo.
Conjunto de validación: Por lo general, alrededor del 10-15% de sus datos; este conjunto se utiliza para ajustar los hiperparámetros y validar el modelo durante el entrenamiento, lo que ayuda a prevenir el sobreajuste.
Conjunto de prueba: El 10-15% restante de sus datos se reserva como conjunto de prueba. Se utiliza para evaluar el rendimiento del modelo en datos no vistos una vez finalizado el entrenamiento.

Después de dividir tus datos, puedes realizar el aumento de datos aplicando transformaciones como rotar, escalar e invertir imágenes para aumentar artificialmente el tamaño de tu conjunto de datos. El aumento de datos hace que tu modelo sea más robusto a las variaciones y mejora su rendimiento en imágenes no vistas.

Ejemplos de aumento de datos

Bibliotecas como OpenCV, Albumentations y TensorFlow ofrecen funciones de aumento flexibles que puedes utilizar. Además, algunas bibliotecas, como Ultralytics, tienen ajustes de aumento integrados directamente dentro de su función de entrenamiento del modelo, lo que simplifica el proceso.

Para comprender mejor tus datos, puedes utilizar herramientas como Matplotlib o Seaborn para visualizar las imágenes y analizar su distribución y características. La visualización de los datos ayuda a identificar patrones, anomalías y la eficacia de las técnicas de aumento. El Ultralytics Platform Charts La pestaña permite obtener muchos de estos datos sin necesidad de programar, ya que genera automáticamente distribuciones por categorías, recuentos de clases, histogramas de dimensiones de imagen y mapas de calor de la posición de las anotaciones para cada conjunto de datos cargado.

Al comprender, dividir y aumentar tus datos correctamente, puedes desarrollar un modelo bien entrenado, validado y probado que funcione bien en aplicaciones del mundo real.

Paso 4: Entrenamiento del modelo

Una vez que su conjunto de datos esté listo para el entrenamiento, puede concentrarse en configurar el entorno necesario, administrar sus conjuntos de datos y entrenar su modelo.

Primero, deberá asegurarse de que su entorno esté configurado correctamente. Normalmente, esto incluye lo siguiente:

Instalación de bibliotecas y frameworks esenciales como TensorFlow, PyTorch o Ultralytics.
Si está utilizando una GPU, la instalación de bibliotecas como CUDA y cuDNN ayudará a habilitar la aceleración de la GPU y acelerará el proceso de entrenamiento.

Luego, puede cargar sus conjuntos de datos de entrenamiento y validación en su entorno. Normalice y preprocese los datos mediante el cambio de tamaño, la conversión de formato o el aumento. Con su modelo seleccionado, configure las capas y especifique los hiperparámetros. Compile el modelo configurando la función de pérdida, el optimizador y las métricas de rendimiento.

Las bibliotecas como Ultralytics simplifican el proceso de entrenamiento. Puede comenzar a entrenar alimentando datos al modelo con un código mínimo. Estas bibliotecas gestionan los ajustes de peso, la retropropagación y la validación automáticamente. También ofrecen herramientas para supervisar el progreso y ajustar los hiperparámetros fácilmente. Después del entrenamiento, guarde el modelo y sus pesos con algunos comandos.

Es importante tener en cuenta que una gestión adecuada del conjunto de datos es vital para un entrenamiento eficiente. Utiliza el control de versiones para los conjuntos de datos para trackear los cambios y garantizar la reproducibilidad. Herramientas como DVC (Control de Versiones de Datos) pueden ayudar a gestionar grandes conjuntos de datos.

Paso 5: Evaluación del modelo y ajuste fino del modelo

Es importante evaluar el rendimiento de tu modelo utilizando varias métricas y perfeccionarlo para mejorar la precisión. Evaluar ayuda a identificar las áreas en las que el modelo destaca y dónde puede necesitar mejoras. El ajuste fino asegura que el modelo esté optimizado para el mejor rendimiento posible.

Métricas de rendimiento: Utiliza métricas como la precisión (accuracy), la precisión (precision), la exhaustividad (recall) y la puntuación F1 para evaluar el rendimiento de tu modelo. Estas métricas proporcionan información sobre cómo de bien está haciendo predicciones tu modelo.
Ajuste de hiperparámetros: Ajusta los hiperparámetros para optimizar el rendimiento del modelo. Técnicas como la búsqueda de cuadrícula o la búsqueda aleatoria pueden ayudar a encontrar los mejores valores de hiperparámetros.
Ajuste Fino: Realice pequeños ajustes en la arquitectura del modelo o en el proceso de entrenamiento para mejorar el rendimiento. Esto podría implicar modificar las tasas de aprendizaje, los tamaños de lote u otros parámetros del modelo.

Para una comprensión más profunda de la evaluación del modelo y las técnicas de ajuste fino, consulte nuestra guía de información sobre la evaluación del modelo.

Paso 6: Prueba del modelo

En este paso, puede asegurarse de que su modelo funciona bien con datos completamente invisibles, confirmando su preparación para la implementación. La diferencia entre la prueba del modelo y la evaluación del modelo es que se centra en verificar el rendimiento del modelo final en lugar de mejorarlo iterativamente.

Es importante probar y depurar a fondo cualquier problema común que pueda surgir. Pruebe su modelo en un conjunto de datos de prueba separado que no se haya utilizado durante el entrenamiento o la validación. Este conjunto de datos debe representar escenarios del mundo real para garantizar que el rendimiento del modelo sea consistente y fiable.

Además, aborda problemas comunes como el sobreajuste, el subajuste y el data leakage. Utiliza técnicas como la validación cruzada y la detección de anomalías para identificar y solucionar estos problemas. Para estrategias de prueba integrales, consulta nuestra guía de prueba de modelos.

Paso 7: Implementación del modelo

Una vez que tu modelo ha sido probado a fondo, es hora de implementarlo. La implementación del modelo implica hacer que tu modelo esté disponible para su uso en un entorno de producción. Estos son los pasos para implementar un modelo de visión artificial:

Configuración del entorno: Configure la infraestructura necesaria para la opción de implementación elegida, ya sea basada en la nube (AWS, Google Cloud, Azure) o en el borde (dispositivos locales, IoT).
Exportación del modelo: Exporte su modelo al formato apropiado (por ejemplo, ONNX, TensorRT, CoreML para YOLO26) para asegurar la compatibilidad con su plataforma de despliegue.
Implementación del modelo: Implemente el modelo configurando APIs o puntos de conexión e integrándolo con su aplicación.
Garantizar la escalabilidad: Implemente equilibradores de carga, grupos de escalado automático y herramientas de supervisión para administrar los recursos y manejar el aumento de datos y las solicitudes de los usuarios.

Si desea obtener orientación más detallada sobre estrategias de implementación y prácticas recomendadas, consulte nuestra guía de prácticas de implementación modelo. Ultralytics también ofrece puntos finales de implementación gestionados con escalado automático en 43 regiones de todo el mundo, lo que permite gestionar la configuración de la infraestructura de forma automática.

Paso 8: Monitoreo, mantenimiento y documentación

Una vez que tu modelo está implementado, es importante supervisar continuamente su rendimiento, mantenerlo para solucionar cualquier problema y documentar todo el proceso para futuras referencias y mejoras.

Las herramientas de monitorización pueden ayudarle a rastrear los indicadores clave de rendimiento (KPI) y a detectar anomalías o caídas en la precisión. Al monitorear el modelo, puede estar al tanto de la deriva del modelo, donde el rendimiento del modelo disminuye con el tiempo debido a los cambios en los datos de entrada. Vuelva a entrenar periódicamente el modelo con datos actualizados para mantener la precisión y la relevancia.

Ciclo de vida de monitoreo y mantenimiento de modelos

Además del monitoreo y el mantenimiento, la documentación también es clave. Documente minuciosamente todo el proceso, incluida la arquitectura del modelo, los procedimientos de entrenamiento, los hiperparámetros, los pasos de preprocesamiento de datos y cualquier cambio realizado durante la implementación y el mantenimiento. Una buena documentación garantiza la reproducibilidad y facilita las futuras actualizaciones o la resolución de problemas. Al monitorear, mantener y documentar eficazmente su modelo, puede asegurarse de que siga siendo preciso, confiable y fácil de administrar durante su ciclo de vida.

Interactuar con la comunidad

Conectarse con una comunidad de entusiastas de la visión artificial puede ayudarle a abordar cualquier problema que enfrente mientras trabaja en su proyecto de visión artificial con confianza. Aquí hay algunas maneras de aprender, solucionar problemas y establecer contactos de manera efectiva.

Recursos de la comunidad

Problemas de GitHub: Consulte el repositorio de GitHub de YOLO26 y utilice la pestaña de Issues para hacer preguntas, informar de errores y sugerir nuevas características. La comunidad activa y los mantenedores están ahí para ayudar con problemas específicos.
Servidor de Discord de Ultralytics: Únete al servidor de Discord de Ultralytics para interactuar con otros usuarios y desarrolladores, obtener soporte y compartir ideas.

Documentación oficial

Documentación de Ultralytics YOLO26: Explore la documentación oficial de YOLO26 para obtener guías detalladas con consejos útiles sobre diferentes tareas y proyectos de visión por computadora.

El uso de estos recursos le ayudará a superar los desafíos y a mantenerse al día con las últimas tendencias y mejores prácticas en la comunidad de visión artificial.

Próximos pasos

Emprender un proyecto de visión artificial puede ser emocionante y gratificante. Siguiendo los pasos de esta guía, podrá construir una base sólida para el éxito. Cada paso es crucial para desarrollar una solución que cumpla sus objetivos y funcione eficazmente en escenarios del mundo real. A medida que adquiera experiencia, descubrirá técnicas y herramientas avanzadas para mejorar sus proyectos.

Preguntas frecuentes

¿Cómo elijo la tarea de visión artificial adecuada para mi proyecto?

Elegir la tarea de visión artificial adecuada depende del objetivo final de tu proyecto. Por ejemplo, si quieres monitorizar el tráfico, la detección de objetos es adecuada, ya que puede localizar e identificar múltiples tipos de vehículos en tiempo real. Para imágenes médicas, la segmentación de imágenes es ideal para proporcionar límites detallados de los tumores, lo que ayuda en el diagnóstico y la planificación del tratamiento. Obtén más información sobre tareas específicas como la detección de objetos, la clasificación de imágenes y la segmentación de instancias.

¿Por qué es crucial la anotación de datos en los proyectos de visión artificial?

La anotación de datos es vital para enseñar a tu modelo a reconocer patrones. El tipo de anotación varía según la tarea:

Clasificación de imágenes: Imagen completa etiquetada como una sola clase.
Detección de objetos: Cuadros delimitadores dibujados alrededor de los objetos.
Segmentación de imágenes: Cada píxel etiquetado según el objeto al que pertenece.

Herramientas como Label Studio, CVAT y Labelme pueden ayudar en este proceso. Para obtener más detalles, consulte nuestra guía de recopilación y anotación de datos.

¿Qué pasos debo seguir para aumentar y dividir mi conjunto de datos de manera efectiva?

Dividir tu conjunto de datos antes del aumento ayuda a validar el rendimiento del modelo en datos originales e inalterados. Sigue estos pasos:

Conjunto de entrenamiento: 70-80% de tus datos.
Conjunto de validación: 10-15% para el ajuste de hiperparámetros.
Conjunto de prueba: El 10-15% restante para la evaluación final.

Después de la división, aplica técnicas de aumento de datos como rotación, escalado e inversión para aumentar la diversidad del conjunto de datos. Bibliotecas como Albumentations y OpenCV pueden ayudar. Ultralytics también ofrece ajustes de aumento integrados para mayor comodidad.

¿Cómo puedo exportar mi modelo de visión artificial entrenado para su implementación?

Exportar su modelo garantiza la compatibilidad con diferentes plataformas de despliegue. Ultralytics ofrece múltiples formatos, incluyendo ONNX, TensorRT y CoreML. Para exportar su modelo YOLO26, siga esta guía:

Utilice el export función con el parámetro de formato deseado.
Asegúrate de que el modelo exportado se ajuste a las especificaciones de tu entorno de implementación (por ejemplo, dispositivos edge, nube).

Para más información, consulta la guía de exportación de modelos.

¿Cuáles son las mejores prácticas para monitorear y mantener un modelo de visión artificial implementado?

El monitoreo y el mantenimiento continuos son esenciales para el éxito a largo plazo de un modelo. Implemente herramientas para rastrear los indicadores clave de rendimiento (KPI) y detectar anomalías. Vuelva a entrenar periódicamente el modelo con datos actualizados para contrarrestar la deriva del modelo. Documente todo el proceso, incluida la arquitectura del modelo, los hiperparámetros y los cambios, para garantizar la reproducibilidad y facilitar las futuras actualizaciones. Obtenga más información en nuestra guía de monitoreo y mantenimiento.

📅 Creado hace 1 año ✏️ Actualizado hace 5 días