Meet YOLO26: next-gen vision AI.

Link to this sectionCómo definir los objetivos de tu proyecto de visión artificial#

Para definir un proyecto de visión artificial, escribe un planteamiento del problema que nombre el asunto principal, el alcance, las partes interesadas y las restricciones; establece objetivos medibles y con plazos determinados; y asigna el problema a la tarea de visión artificial que determine tus decisiones de modelo, conjunto de datos y despliegue. Esta guía recorre cada paso con un ejemplo práctico.



Watch: How to define Computer Vision Project's Goal | Problem Statement and VisionAI Tasks Connection 🚀

Para obtener una visión general del flujo de trabajo completo desde la recopilación de datos hasta el despliegue, consulta nuestra guía sobre los pasos clave en un proyecto de visión artificial.

Link to this sectionCómo redactar un planteamiento del problema de visión artificial#

Un planteamiento del problema claro es el primer gran paso hacia la búsqueda de la solución más eficaz. Consta de cuatro partes:

  • Identifica el problema central: Señala el desafío específico que tu proyecto de visión artificial pretende resolver.
  • Determina el alcance: Define los límites de tu problema.
  • Considera a los usuarios finales y a las partes interesadas: Identifica quién se verá afectado por la solución.
  • Analiza los requisitos y las restricciones del proyecto: Evalúa los recursos disponibles (tiempo, presupuesto, personal) e identifica cualquier restricción técnica o normativa.

Link to this sectionEjemplo de un enunciado del problema empresarial#

Considera un proyecto de visión artificial en el que quieras estimar la velocidad de los vehículos en una autopista. El problema central es que los métodos actuales de control de velocidad son ineficientes y propensos a errores debido a sistemas de radar obsoletos y procesos manuales. El proyecto pretende desarrollar un sistema de visión artificial en tiempo real que pueda sustituir a los sistemas de estimación de velocidad heredados.

Vehicle speed estimation on a highway using Ultralytics YOLO

Los usuarios principales son las autoridades de gestión del tráfico y las fuerzas del orden, mientras que las partes interesadas secundarias son los planificadores de carreteras y el público que se beneficia de unas carreteras más seguras. Los requisitos clave implican evaluar el presupuesto, el tiempo y el personal, así como abordar necesidades técnicas como cámaras de alta resolución y procesamiento de datos en tiempo real. Además, deben tenerse en cuenta las restricciones normativas sobre privacidad y seguridad de datos.

Link to this sectionEstablecer objetivos medibles#

Establecer objetivos medibles es clave para el éxito de un proyecto de visión artificial. Los objetivos eficaces siguen los criterios SMART:

CriterioQué significa
EspecíficoDefine metas claras y detalladas.
MedibleAsegúrate de que los objetivos sean cuantificables.
AlcanzableEstablece objetivos realistas dentro de tus capacidades.
RelevanteAlinea los objetivos con tus metas generales del proyecto.
Con plazos determinadosEstablece fechas límite para cada objetivo.

Para el ejemplo de estimación de velocidad en autopistas, los objetivos SMART podrían ser:

  • Lograr al menos un 95% de precisión en la detección de velocidad en un plazo de seis meses, utilizando un conjunto de datos de 10.000 imágenes de vehículos.
  • El sistema debe ser capaz de procesar transmisiones de vídeo en tiempo real a 30 fotogramas por segundo con un retraso mínimo.

Al establecer objetivos específicos y cuantificables, puedes realizar un seguimiento eficaz del progreso, identificar áreas de mejora y garantizar que el proyecto se mantenga en el camino correcto.

Link to this sectionCómo elegir la tarea de visión artificial adecuada#

El planteamiento de tu problema te ayuda a conceptualizar qué tarea de visión artificial puede resolver tu asunto. Las tareas más populares incluyen la clasificación de imágenes, la detección de objetos y la segmentación de imágenes: consulta la página de tareas de Ultralytics para una comparación detallada.

Comparison of image classification, object detection, and image segmentation outputs

Por ejemplo, si tu problema consiste en supervisar la velocidad de los vehículos en una autopista, la tarea relevante es el seguimiento de objetos. El seguimiento es adecuado porque permite seguir a cada vehículo a través de los fotogramas de vídeo con una identificación persistente, que es lo que requiere el cálculo de velocidad.

YOLO object tracking of vehicles on a highway with persistent track IDs

Otras tareas son menos adecuadas por sí solas. La detección de objetos, por ejemplo, localiza vehículos en cada fotograma, pero no mantiene la identidad de cada vehículo entre fotogramas, y sin esa identidad, el sistema no puede medir el movimiento a lo largo del tiempo. Una vez que hayas identificado la tarea de visión artificial adecuada, esta guiará varios aspectos críticos de tu proyecto, como la selección del modelo, la preparación del conjunto de datos y los enfoques de entrenamiento del modelo.

Link to this section¿Qué va primero: modelo, datos o enfoque de entrenamiento?#

El orden de la selección del modelo, la preparación del conjunto de datos y el enfoque de entrenamiento depende de los detalles de tu proyecto:

Tu situaciónEmpieza conEjemplo
Problema y objetivos bien definidosSelección del modeloPara un sistema de control de tráfico que estime la velocidad de los vehículos, elige un modelo de seguimiento de objetos, recopila y etiqueta vídeos de autopistas y luego entrena con técnicas para el procesamiento de vídeo en tiempo real.
Datos únicos o limitadosPreparación del conjunto de datosPara un sistema de reconocimiento facial con un conjunto de datos pequeño, etiqueta primero los datos, luego selecciona un modelo que funcione bien con datos limitados (como un modelo preentrenado para el aprendizaje por transferencia) y planifica la aumentación de datos para ampliar el conjunto de datos.
La experimentación es crucial (investigación)Enfoque de entrenamientoEn un proyecto que explore nuevos métodos para detectar defectos de fabricación, experimenta primero con un subconjunto de datos pequeño. Una vez que encuentres una técnica prometedora, selecciona un modelo adaptado a esos hallazgos y prepara un conjunto de datos exhaustivo.

Si empiezas con los datos, la plataforma Ultralytics simplifica la organización, el etiquetado y el entrenamiento del conjunto de datos a medida que tu proyecto evoluciona.

Link to this sectionCómo afectan las opciones de despliegue a tu proyecto#

Las opciones de despliegue del modelo afectan de forma crítica al rendimiento de tu proyecto de visión artificial, así que tenlas en cuenta desde el principio. El entorno de despliegue debe gestionar la carga computacional de tu modelo:

Opción de despliegueIdeal paraEjemplos de tecnologías
Dispositivos de borde (Edge)Smartphones y dispositivos IoT con recursos computacionales limitados; modelos ligerosTensorFlow Lite, ONNX Runtime
Servidores en la nubeModelos complejos con mayores demandas computacionales; hardware que escala con el proyectoAWS, Google Cloud, Azure
Servidores locales (On-premise)Altas necesidades de privacidad de datos y seguridad; control total sobre los datos y la infraestructuraServidores GPU autogestionados
Soluciones híbridasEquilibrar el rendimiento con el coste y la latencia; procesamiento en el borde más análisis en la nubeCombinación de tiempos de ejecución en el borde y plataformas en la nube

Cada opción ofrece diferentes beneficios y desafíos, y la elección depende de los requisitos específicos del proyecto, como el rendimiento, el coste y la seguridad.

Link to this sectionConclusión#

Un proyecto de visión artificial exitoso comienza con un planteamiento del problema claro, objetivos medibles SMART y la tarea de visión artificial adecuada para el trabajo; estas decisiones guían todo lo que sigue, desde la selección del modelo hasta el despliegue. Como siguiente paso, aprende a recopilar y etiquetar datos, o comenta tu proyecto con otros desarrolladores en GitHub y el servidor de Discord de Ultralytics.

Link to this sectionFAQ#

Link to this section¿Cómo defino un planteamiento del problema claro para mi proyecto de visión artificial?#

Un planteamiento del problema claro nombra el asunto principal que resuelve tu proyecto, su alcance, los usuarios finales y las partes interesadas, así como tus restricciones de recursos y normativas. Trabaja en esas cuatro partes en orden y, a continuación, valida el planteamiento con las partes interesadas antes de tomar decisiones técnicas. Consulta Cómo redactar un planteamiento del problema de visión artificial para ver el desglose completo y un ejemplo práctico.

Link to this section¿Cómo elijo la tarea de visión artificial adecuada para mi problema?#

Haz coincidir la salida que necesita tu problema con la tarea que la produce: una sola etiqueta por imagen apunta a la clasificación de imágenes, las ubicaciones de objetos apuntan a la detección de objetos, los límites a nivel de píxel apuntan a la segmentación de imágenes y las identidades mantenidas a lo largo de los fotogramas de vídeo apuntan al seguimiento de objetos. Supervisar la velocidad de los vehículos, por ejemplo, requiere seguimiento porque la velocidad se calcula a partir del movimiento de cada vehículo a lo largo del tiempo. Consulta la página de tareas de Ultralytics para ver todas las tareas compatibles.

Link to this section¿Cómo establezco objetivos medibles eficaces para mi proyecto de visión artificial?#

Usa los criterios SMART: Específicos, Medibles, Alcanzables, Relevantes y con plazos determinados. Por ejemplo, "Lograr un 95% de precisión en la detección de velocidad en seis meses usando un conjunto de datos de 10.000 imágenes de vehículos". Este enfoque ayuda a realizar un seguimiento del progreso e identifica áreas de mejora. Lee más sobre cómo establecer objetivos medibles.

Link to this section¿Puede un modelo preentrenado recordar clases que conocía antes del entrenamiento personalizado?#

No, los modelos preentrenados no "recuerdan" las clases en el sentido tradicional. Aprenden patrones de conjuntos de datos masivos y, durante el entrenamiento personalizado (ajuste fino), estos patrones se ajustan a tu tarea específica. La capacidad del modelo es limitada, y centrarse en nueva información puede sobrescribir algunos aprendizajes previos.

Overview of transfer learning from a pretrained model to a custom model

Si quieres utilizar las clases con las que se preentrenó el modelo, un enfoque práctico es utilizar dos modelos: uno mantiene el rendimiento original y el otro se ajusta para tu tarea específica. De esta manera, puedes combinar las salidas de ambos modelos. Existen otras opciones como congelar capas, utilizar el modelo preentrenado como extractor de características y bifurcación específica de la tarea, pero son soluciones más complejas y requieren más experiencia.

Link to this section¿Cómo afectan las opciones de despliegue a mi proyecto de visión artificial?#

Las opciones de despliegue determinan qué tamaños y formatos de modelo son viables, por lo que dan forma a tu proyecto desde el principio. Los dispositivos de borde necesitan modelos ligeros servidos a través de formatos y tiempos de ejecución como TensorFlow Lite u ONNX Runtime, los servidores en la nube manejan modelos complejos en hardware escalable, los servidores locales proporcionan un control total de los datos para proyectos sensibles a la privacidad, y las configuraciones híbridas equilibran ambos. Compáralos en la tabla de opciones de despliegue, o consulta la guía de opciones de despliegue de modelos para obtener detalles.

Link to this section¿Cuáles son los desafíos más comunes al definir un problema de visión artificial?#

Los desafíos comunes incluyen:

  • Enunciados del problema vagos o demasiado amplios.
  • Objetivos poco realistas.
  • Falta de alineación con las partes interesadas.
  • Comprensión insuficiente de las restricciones técnicas.
  • Subestimar los requisitos de datos.

Aborda estos desafíos mediante una investigación inicial exhaustiva, una comunicación clara con las partes interesadas y un refinamiento iterativo del planteamiento del problema y los objetivos. Para conocer el flujo de trabajo completo del proyecto, consulta los pasos clave en un proyecto de visión artificial.

Comentarios