Tareas de visión artificial compatibles con Ultralytics YOLO11
Ultralytics YOLO11 es un framework de IA versátil que admite múltiples tareas de visión artificial . El framework se puede utilizar para realizar detección, segmentación, OBB, clasificación y estimación de pose. Cada una de estas tareas tiene un objetivo y un caso de uso diferentes, lo que le permite abordar diversos desafíos de visión artificial con un solo framework.
Ver: Explore las tareas de Ultralytics YOLO: Detección de objetos, Segmentación, OBB, Seguimiento y Estimación de Pose.
Detección
La detección es la tarea principal que admite YOLO11. Implica identificar objetos en una imagen o fotograma de vídeo y dibujar cuadros delimitadores a su alrededor. Los objetos detectados se clasifican en diferentes categorías según sus características. YOLO11 puede detectar múltiples objetos en una sola imagen o fotograma de vídeo con alta precisión y velocidad, lo que lo hace ideal para aplicaciones en tiempo real como sistemas de vigilancia y vehículos autónomos.
Segmentación de imágenes
La segmentación lleva la detección de objetos un paso más allá al segmentar una imagen en diferentes regiones según el contenido. A cada región se le asigna una etiqueta, lo que proporciona precisión a nivel de píxel para aplicaciones como imágenes médicas, análisis agrícola y control de calidad de fabricación. YOLO11 implementa una variante de la arquitectura U-Net para realizar una segmentación eficiente y precisa.
Clasificación
La clasificación implica categorizar imágenes completas según su contenido. Las capacidades de clasificación de YOLO11 aprovechan una variante de la arquitectura EfficientNet para ofrecer una clasificación de imágenes de alto rendimiento. Esta tarea es esencial para aplicaciones como la categorización de productos en el comercio electrónico, la moderación de contenido y el monitoreo de vida silvestre.
Estimación de pose
La estimación de pose detecta puntos clave específicos en imágenes o fotogramas de video para rastrear movimientos o estimar poses. Estos puntos clave pueden representar articulaciones humanas, rasgos faciales u otros puntos de interés importantes. YOLO11 destaca en la detección de puntos clave con alta precisión y velocidad, lo que lo hace valioso para aplicaciones de fitness, análisis deportivo e interacción persona-ordenador.
OBB
La detección de cajas delimitadoras orientadas (OBB, por sus siglas en inglés) mejora la detección de objetos tradicional al añadir un ángulo de orientación para localizar mejor los objetos rotados. Esta capacidad es particularmente valiosa para el análisis de imágenes aéreas, el procesamiento de documentos y las aplicaciones industriales donde los objetos aparecen en varios ángulos. YOLO11 ofrece alta precisión y velocidad para detectar objetos rotados en diversos escenarios.
Conclusión
Ultralytics YOLO11 admite múltiples tareas de visión artificial, incluyendo la detección, la segmentación, la clasificación, la detección de objetos orientados y la detección de puntos clave. Cada tarea aborda necesidades específicas en el panorama de la visión artificial, desde la identificación básica de objetos hasta el análisis detallado de la pose. Al comprender las capacidades y aplicaciones de cada tarea, puede seleccionar el enfoque más apropiado para sus desafíos específicos de visión artificial y aprovechar las potentes funciones de YOLO11 para construir soluciones eficaces.
Preguntas frecuentes
¿Qué tareas de visión artificial puede realizar Ultralytics YOLO11?
Ultralytics YOLO11 es un framework de IA versátil capaz de realizar diversas tareas de visión artificial con alta precisión y velocidad. Estas tareas incluyen:
- Detección de objetos: Identificar y localizar objetos en imágenes o fotogramas de video dibujando cuadros delimitadores a su alrededor.
- Segmentación de imágenes: Segmentar imágenes en diferentes regiones según su contenido, útil para aplicaciones como la imagenología médica.
- Clasificación: Categorización de imágenes completas según su contenido, aprovechando variantes de la arquitectura EfficientNet.
- Estimación de pose: Detección de puntos clave específicos en un fotograma de imagen o video para rastrear movimientos o poses.
- Detección de objetos orientados (OBB): Detección de objetos rotados con un ángulo de orientación añadido para una mayor precisión.
¿Cómo uso Ultralytics YOLO11 para la detección de objetos?
Para usar Ultralytics YOLO11 para la detección de objetos, siga estos pasos:
- Prepare su conjunto de datos en el formato adecuado.
- Entrene el modelo YOLO11 utilizando la tarea de detección.
- Utilice el modelo para hacer predicciones alimentándolo con nuevas imágenes o fotogramas de vídeo.
Ejemplo
from ultralytics import YOLO
# Load a pre-trained YOLO model (adjust model type as needed)
model = YOLO("yolo11n.pt") # n, s, m, l, x versions available
# Perform object detection on an image
results = model.predict(source="image.jpg") # Can also use video, directory, URL, etc.
# Display the results
results[0].show() # Show the first image results
# Run YOLO detection from the command line
yolo detect model=yolo11n.pt source="image.jpg" # Adjust model and source as needed
Para obtener instrucciones más detalladas, consulte nuestros ejemplos de detección.
¿Cuáles son los beneficios de usar YOLO11 para tareas de segmentación?
El uso de YOLO11 para tareas de segmentación ofrece varias ventajas:
- Alta Precisión: La tarea de segmentación aprovecha una variante de la arquitectura U-Net para lograr una segmentación precisa.
- Velocidad: YOLO11 está optimizado para aplicaciones en tiempo real, ofreciendo un procesamiento rápido incluso para imágenes de alta resolución.
- Múltiples Aplicaciones: Es ideal para imágenes médicas, conducción autónoma y otras aplicaciones que requieren una segmentación de imagen detallada.
Obtenga más información sobre las ventajas y los casos de uso de YOLO11 para la segmentación en la sección de segmentación de imágenes.
¿Puede Ultralytics YOLO11 manejar la estimación de pose y la detección de puntos clave?
Sí, Ultralytics YOLO11 puede realizar eficazmente la estimación de poses y la detección de puntos clave con alta precisión y velocidad. Esta característica es particularmente útil para rastrear movimientos en análisis deportivos, atención médica y aplicaciones de interacción persona-ordenador. YOLO11 detecta puntos clave en una imagen o fotograma de vídeo, lo que permite una estimación precisa de la pose.
Para obtener más detalles y consejos de implementación, visite nuestros ejemplos de estimación de pose.
¿Por qué debería elegir Ultralytics YOLO11 para la detección de objetos orientados (OBB)?
La detección de objetos orientados (OBB) con YOLO11 proporciona una precisión mejorada al detectar objetos con un parámetro de ángulo adicional. Esta característica es beneficiosa para aplicaciones que requieren una localización precisa de objetos rotados, como el análisis de imágenes aéreas y la automatización de almacenes.
- Mayor Precisión: El componente de ángulo reduce los falsos positivos para objetos rotados.
- Aplicaciones Versátiles: Útil para tareas en análisis geoespacial, robótica, etc.
Consulte la sección de Detección de Objetos Orientados para obtener más detalles y ejemplos.