Ultralytics YOLO11

Descripción general

YOLO11 fue lanzado por Ultralytics el 10 de septiembre de 2024, ofreciendo una excelente precisión, velocidad y eficiencia. Aprovechando los impresionantes avances de las versiones anteriores de YOLO, YOLO11 introduce mejoras significativas en la arquitectura y los métodos de entrenamiento, lo que lo convierte en una opción versátil para una amplia gama de tareas de visión artificial. Para conocer el modelo más reciente de Ultralytics con inferencia integral sin NMS y despliegue optimizado en el borde, consulta YOLO26.

Gráficos comparativos de Ultralytics YOLO11

Ultralytics YOLO11 🚀 Podcast generated by NotebookLM



Watch: How to Use Ultralytics YOLO11 for Object Detection and Tracking | How to Benchmark | YOLO11 RELEASED🚀
Pruébalo en la plataforma de Ultralytics

Explora y ejecuta modelos YOLO11 directamente en la Plataforma Ultralytics.

Características clave

  • Extracción de características mejorada: YOLO11 emplea una arquitectura de backbone y cuello mejorada, lo que potencia las capacidades de extracción de características para una detección de objetos más precisa y un mejor rendimiento en tareas complejas.
  • Optimizado para la eficiencia y la velocidad: YOLO11 introduce diseños arquitectónicos refinados y pipelines de entrenamiento optimizados, ofreciendo velocidades de procesamiento más rápidas y manteniendo un equilibrio óptimo entre precisión y rendimiento.
  • Mayor precisión con menos parámetros: Con avances en el diseño de modelos, YOLO11m logra una precisión media media (mAP) más alta en el conjunto de datos COCO utilizando un 22% menos de parámetros que YOLOv8m, lo que lo hace computacionalmente eficiente sin comprometer la precisión.
  • Adaptabilidad en todos los entornos: YOLO11 se puede desplegar sin problemas en diversos entornos, incluidos dispositivos de borde, plataformas en la nube y sistemas compatibles con NVIDIA GPUs, garantizando la máxima flexibilidad.
  • Amplia gama de tareas compatibles: Ya sea detección de objetos, segmentación de instancias, clasificación de imágenes, estimación de poses o detección de objetos orientados (OBB), YOLO11 está diseñado para cubrir un conjunto diverso de desafíos de visión artificial.

Tareas y modos admitidos

YOLO11 se basa en la gama de modelos versátiles establecida por lanzamientos anteriores de Ultralytics YOLO, ofreciendo un soporte mejorado en diversas tareas de visión artificial:

ModeloNombres de archivoTareaInferenciaValidaciónEntrenamientoExportar (Export)
YOLO11yolo11n.pt yolo11s.pt yolo11m.pt yolo11l.pt yolo11x.ptDetección
YOLO11-segyolo11n-seg.pt yolo11s-seg.pt yolo11m-seg.pt yolo11l-seg.pt yolo11x-seg.ptSegmentación de instancias
YOLO11-poseyolo11n-pose.pt yolo11s-pose.pt yolo11m-pose.pt yolo11l-pose.pt yolo11x-pose.ptPose/Puntos clave
YOLO11-obbyolo11n-obb.pt yolo11s-obb.pt yolo11m-obb.pt yolo11l-obb.pt yolo11x-obb.ptDetección orientada
YOLO11-clsyolo11n-cls.pt yolo11s-cls.pt yolo11m-cls.pt yolo11l-cls.pt yolo11x-cls.ptClasificación

Esta tabla proporciona una visión general de las variantes del modelo YOLO11, mostrando su aplicabilidad en tareas específicas y compatibilidad con modos operativos como Inferencia, Validación, Entrenamiento y Exportación. Esta flexibilidad hace que YOLO11 sea adecuado para una amplia gama de aplicaciones en visión artificial, desde la detección en tiempo real hasta tareas de segmentación complejas.

Métricas de rendimiento

Rendimiento

Consulta los Documentos de detección para ver ejemplos de uso con estos modelos entrenados en COCO, que incluyen 80 clases preentrenadas.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n64039.556.1 ± 0.81.5 ± 0.02.66.5
YOLO11s64047.090.0 ± 1.22.5 ± 0.09.421.5
YOLO11m64051.5183.2 ± 2.04.7 ± 0.120.168.0
YOLO11l64053.4238.6 ± 1.46.2 ± 0.125.386.9
YOLO11x64054.7462.8 ± 6.711.3 ± 0.256.9194.9

Ejemplos de uso

Esta sección proporciona ejemplos sencillos de entrenamiento e inferencia con YOLO11. Para obtener la documentación completa sobre estos y otros modos, consulta las páginas de documentación de Predict, Train, Val y Export.

Ten en cuenta que el ejemplo siguiente es para modelos Detect de YOLO11 para detección de objetos. Para otras tareas compatibles, consulta la documentación de Segment, Classify, OBB y Pose.

Ejemplo

Los modelos preentrenados de PyTorch *.pt, así como los archivos de configuración *.yaml, pueden pasarse a la clase YOLO() para crear una instancia de modelo en Python:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO11n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")

Citas y reconocimientos

Publicación de Ultralytics YOLO11

Ultralytics no ha publicado un artículo de investigación formal para YOLO11 debido a la naturaleza en rápida evolución de los modelos. Nos centramos en hacer avanzar la tecnología y facilitar su uso, en lugar de producir documentación estática. Para obtener la información más actualizada sobre la arquitectura, las funciones y el uso de YOLO, consulta nuestro repositorio de GitHub y nuestra documentación.

Si utilizas YOLO11 o cualquier otro software de este repositorio en tu trabajo, cítalo utilizando el siguiente formato:

Cita
@software{yolo11_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO11},
  version = {11.0.0},
  year = {2024},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

Ten en cuenta que el DOI está pendiente y se añadirá a la cita una vez que esté disponible. Los modelos YOLO11 se proporcionan bajo licencias AGPL-3.0 y Enterprise.

Preguntas frecuentes

¿Cuáles son las mejoras clave en Ultralytics YOLO11 en comparación con YOLOv8?

Ultralytics YOLO11 introduce varios avances significativos respecto a YOLOv8. Las mejoras clave incluyen:

  • Extracción de características mejorada: YOLO11 emplea una arquitectura de backbone y neck mejorada, lo que optimiza las capacidades de extracción de características para una detección de objetos más precisa.
  • Eficiencia y velocidad optimizadas: Los diseños arquitectónicos refinados y los pipelines de entrenamiento optimizados ofrecen velocidades de procesamiento más rápidas mientras mantienen un equilibrio entre precisión y rendimiento.
  • Mayor precisión con menos parámetros: YOLO11m logra una mayor precisión media (mAP) en el conjunto de datos COCO con un 22% menos de parámetros que YOLOv8m, lo que lo hace computacionalmente eficiente sin comprometer la precisión.
  • Adaptabilidad en distintos entornos: YOLO11 puede implementarse en diversos entornos, incluidos dispositivos edge, plataformas en la nube y sistemas compatibles con NVIDIA GPUs.
  • Amplia gama de tareas compatibles: YOLO11 admite diversas tareas de visión por ordenador, como la detección de objetos, la segmentación de instancias, la clasificación de imágenes, la estimación de poses y la detección de objetos orientados (OBB).

¿Cómo entreno un modelo YOLO11 para la detección de objetos?

Puedes entrenar un modelo YOLO11 para la detección de objetos utilizando Python o comandos CLI. A continuación, se muestran ejemplos de ambos métodos:

Ejemplo
from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Para obtener instrucciones más detalladas, consulta la documentación de Train.

¿Qué tareas pueden realizar los modelos YOLO11?

Los modelos YOLO11 son versátiles y admiten una amplia gama de tareas de visión por ordenador, entre ellas:

  • Detección de objetos: Identificar y localizar objetos dentro de una imagen.
  • Segmentación de instancias: Detectar objetos y delimitar sus bordes.
  • Clasificación de imágenes: Categorizar imágenes en clases predefinidas.
  • Estimación de poses: Detectar y realizar el seguimiento de puntos clave en cuerpos humanos.
  • Detección de objetos orientados (OBB): Detectar objetos con rotación para una mayor precisión.

Para obtener más información sobre cada tarea, consulta la documentación de Detection, Instance Segmentation, Classification, Pose Estimation y Oriented Detection.

¿Cómo consigue YOLO11 una mayor precisión con menos parámetros?

YOLO11 logra una mayor precisión con menos parámetros gracias a los avances en el diseño de modelos y técnicas de optimización. La arquitectura mejorada permite una extracción y un procesamiento de características eficientes, lo que da como resultado una mayor precisión media (mAP) en conjuntos de datos como COCO, utilizando un 22% menos de parámetros que YOLOv8m. Esto hace que YOLO11 sea computacionalmente eficiente sin comprometer la precisión, lo que lo hace adecuado para su implementación en dispositivos con recursos limitados.

¿Se puede implementar YOLO11 en dispositivos edge?

Sí, YOLO11 está diseñado para ser adaptable a diversos entornos, incluidos los dispositivos edge. Su arquitectura optimizada y sus capacidades de procesamiento eficiente lo hacen adecuado para su implementación en dispositivos edge, plataformas en la nube y sistemas compatibles con NVIDIA GPUs. Esta flexibilidad garantiza que YOLO11 pueda utilizarse en diversas aplicaciones, desde la detección en tiempo real en dispositivos móviles hasta tareas complejas de segmentación en entornos de nube. Para obtener más detalles sobre las opciones de implementación, consulta la documentación de Export.

Comentarios