Recorte de objetos mediante Ultralytics YOLO11

Q: What are the hardware requirements for efficiently running YOLO11 for object cropping?

Ultralytics YOLO11 está optimizado tanto para entornos CPU como GPU , pero para lograr un rendimiento óptimo, especialmente para inferencia en tiempo real o de gran volumen, se recomienda un GPU dedicado (por ejemplo, NVIDIA Tesla, serie RTX). Para el despliegue en dispositivos ligeros, considere el uso de CoreML para iOS o TFLite para Android. Encontrará más información sobre los dispositivos y formatos compatibles en nuestras opciones de despliegue de modelos.

¿Qué es el recorte de objetos?

El recorte de objetos con Ultralytics YOLO11 consiste en aislar y extraer objetos específicos detectados en una imagen o un vídeo. Las capacidades del modelo YOLO11 se utilizan para identificar y delinear con precisión los objetos, lo que permite un recorte preciso para su posterior análisis o manipulación.

Observa: Recorte de objetos mediante Ultralytics YOLO

Ventajas del recorte de objetos

Análisis focalizado: YOLO11 facilita el recorte focalizado de objetos, lo que permite examinar o procesar en profundidad elementos individuales de una escena.
Reducción del volumen de datos: Al extraer sólo los objetos relevantes, el recorte de objetos ayuda a minimizar el tamaño de los datos, haciéndolos eficientes para su almacenamiento, transmisión o tareas computacionales posteriores.
Mayor precisión: la precisión de detección de objetos de YOLO11 garantiza que los objetos recortados mantengan sus relaciones espaciales, preservando la integridad de la información visual para un análisis detallado.

Visuales

Equipaje de aeropuerto

Recorte de maletas en la cinta transportadora de un aeropuerto mediante Ultralytics YOLO11

Recorte de objetos mediante Ultralytics YOLO

CLIPython

# Crop the objects
yolo solutions crop show=True

# Pass a source video
yolo solutions crop source="path/to/video.mp4"

# Crop specific classes
yolo solutions crop classes="[0, 2]"

import cv2

from ultralytics import solutions

cap = cv2.VideoCapture("path/to/video.mp4")
assert cap.isOpened(), "Error reading video file"

# Initialize object cropper object
cropper = solutions.ObjectCropper(
    show=True,  # display the output
    model="yolo11n.pt",  # model for object cropping i.e yolo11x.pt.
    classes=[0, 2],  # crop specific classes i.e. person and car with COCO pretrained model.
    # conf=0.5,  # adjust confidence threshold for the objects.
    # crop_dir="cropped-detections",  # set the directory name for cropped detections
)

# Process video
while cap.isOpened():
    success, im0 = cap.read()

    if not success:
        print("Video frame is empty or processing is complete.")
        break

    results = cropper(im0)

    # print(results)  # access the output

cap.release()
cv2.destroyAllWindows()  # destroy all opened windows

`ObjectCropper` Argumentos

Aquí tiene una tabla con los ObjectCropper argumentos:

Argumento	Tipo	Por defecto	Descripción
`model`	`str`	`None`	Ruta al archivo del modeloYOLO Ultralytics .
`crop_dir`	`str`	`"cropped-detections"`	Nombre del directorio para almacenar las detecciones recortadas.

Además, se pueden utilizar los siguientes argumentos de visualización:

Argumento	Tipo	Por defecto	Descripción
`show`	`bool`	`False`	Si `True`muestra las imágenes o vídeos anotados en una ventana. Resulta útil para obtener información visual inmediata durante el desarrollo o las pruebas.
`line_width`	`None or int`	`None`	Especifica el ancho de línea de los cuadros delimitadores. Si `None`El ancho de línea se ajusta automáticamente en función del tamaño de la imagen. Proporciona personalización visual para mayor claridad.

PREGUNTAS FRECUENTES

¿Qué es el recorte de objetos en Ultralytics YOLO11 y cómo funciona?

El recorte de objetos mediante Ultralytics YOLO11 consiste en aislar y extraer objetos específicos de una imagen o vídeo basándose en las capacidades de detección de YOLO11. Este proceso permite centrar el análisis, reducir el volumen de datos y mejorar la precisión aprovechando YOLO11 para identificar objetos con gran precisión y recortarlos en consecuencia. Para ver un tutorial detallado, consulte el ejemplo de recorte de objetos.

¿Por qué debería utilizar Ultralytics YOLO11 para el recorte de objetos en lugar de otras soluciones?

Ultralytics YOLO11 destaca por su precisión, velocidad y facilidad de uso. Permite una detección y un recorte de objetos detallados y precisos, esenciales para análisis focalizados y aplicaciones que requieren una gran integridad de los datos. Además, YOLO11 se integra a la perfección con herramientas como OpenVINO y TensorRT para implantaciones que requieren capacidades en tiempo real y optimización en hardware diverso. Explore las ventajas en la guía sobre exportación de modelos.

¿Cómo puedo reducir el volumen de datos de mi conjunto de datos mediante el recorte de objetos?

Si utiliza Ultralytics YOLO11 para recortar sólo los objetos relevantes de sus imágenes o vídeos, podrá reducir significativamente el tamaño de los datos, haciéndolos más eficientes para su almacenamiento y procesamiento. Este proceso consiste en entrenar el modelo para que detecte objetos específicos y, a continuación, utilizar los resultados para recortar y guardar sólo estas partes. Para obtener más información sobre cómo aprovechar las posibilidades de Ultralytics YOLO11 , consulte nuestra guía de inicio rápido.

¿Puedo utilizar Ultralytics YOLO11 para el análisis de vídeo en tiempo real y el recorte de objetos?

Sí, Ultralytics YOLO11 puede procesar secuencias de vídeo en tiempo real para detectar y recortar objetos de forma dinámica. Las capacidades de inferencia de alta velocidad del modelo lo hacen ideal para aplicaciones en tiempo real como la vigilancia, el análisis deportivo y los sistemas de inspección automatizados. Echa un vistazo a los modos de seguimiento y predicción para saber cómo implementar el procesamiento en tiempo real.

¿Cuáles son los requisitos de hardware para ejecutar eficazmente YOLO11 para el recorte de objetos?

Ultralytics YOLO11 está optimizado tanto para entornos de CPU como GPU , pero para lograr un rendimiento óptimo, especialmente para inferencia en tiempo real o de gran volumen, se recomienda una GPU dedicada (por ejemplo, NVIDIA Tesla, serie RTX). Para la implantación en dispositivos ligeros, considere el uso de CoreML para iOS o TFLite para Android. Encontrará más información sobre los dispositivos y formatos compatibles en nuestras opciones de despliegue de modelos.

Creado hace 1 año ✏️ Actualizado hace 8 días