Ir al contenido

YOLO11 vs YOLO11: una comparación técnica exhaustiva

En el panorama en rápida evolución de la visión por ordenador, elegir el modelo de detección de objetos adecuado es fundamental para el éxito del proyecto. Dos de los hitos más significativos en este campo son YOLOv5 y el recientemente publicado YOLO11. Mientras que YOLOv5 estableció un estándar legendario de facilidad de uso y rapidez, YOLO11 amplía los límites de la precisión y la eficacia, aprovechando años de investigación y desarrollo.

Esta guía proporciona un análisis técnico detallado de estas dos arquitecturas, ayudando a desarrolladores, investigadores e ingenieros a tomar decisiones informadas para sus aplicaciones de IA.

Ultralytics YOLOv5: el caballo de batalla fiable

Lanzado en 2020, YOLOv5 revolucionó la accesibilidad de la detección de objetos. Fue el primer modelo "Sólo se mira una vez" implementado de forma nativa en PyTorchpor lo que es increíblemente fácil de entrenar e implementar para los desarrolladores. Su equilibrio entre velocidad y precisión lo convirtió en la opción preferida para todo, desde la inspección industrial hasta los vehículos autónomos.

Detalles técnicos:

Características clave y arquitectura

YOLOv5 utiliza una arquitectura basada en anclajes. Introduce una red troncal CSPDarknet, que mejora significativamente el flujo de gradiente y reduce el coste computacional en comparación con iteraciones anteriores. El modelo emplea un cuello de red de agregación de rutas (PANet) para impulsar el flujo de información e integra el aumento de datos Mosaic durante el entrenamiento, una técnica que se ha convertido en un estándar para mejorar la robustez del modelo frente a objetos más pequeños.

Fortalezas

YOLOv5 es famoso por su estabilidad y madurez. Tras años de pruebas por parte de la comunidad, el ecosistema de tutoriales, integraciones de terceros y guías de implantación es muy amplio. Es una opción excelente para sistemas heredados o dispositivos periféricos en los que ya existen optimizaciones de hardware específicas para su arquitectura.

Más información sobre YOLOv5

Ultralytics YOLO11: La evolución del estado del arte

Lanzamiento a finales de 2024, YOLO11 representa la vanguardia de la IA visual. Se basa en las lecciones aprendidas de YOLOv5 y YOLOv8 para ofrecer un modelo más rápido, preciso y eficiente desde el punto de vista computacional.

Detalles técnicos:

Arquitectura y Características Clave

YOLO11 introduce importantes mejoras arquitectónicas, como el bloque C3k2 y los módulos C2PSA (Cross-Stage Partial with Spatial Attention). A diferencia de YOLOv5, YOLO11 utiliza un cabezal de detección sin anclajes, lo que simplifica el proceso de entrenamiento al eliminar la necesidad de calcular manualmente las cajas de anclaje. Este cambio de diseño mejora la generalización y permite que el modelo se adapte mejor a diversos conjuntos de datos.

Versatilidad sin igual

Una de las características definitorias de YOLO11 es su compatibilidad nativa con múltiples tareas de visión por ordenador dentro de un único marco. Mientras que YOLOv5 se centró principalmente en la detección (con posterior soporte para la segmentación), YOLO11 fue construido desde cero para manejar:

Esta versatilidad permite a los desarrolladores abordar problemas complejos de robótica y análisis sin cambiar de marco.

Más información sobre YOLO11

Comparación de rendimiento

La transición de YOLOv5 a YOLO11 se traduce en un aumento sustancial del rendimiento. Las métricas demuestran que YOLO11 ofrece una mejor relación entre velocidad y precisión.

Precisión frente a eficacia

YOLO11 consigue sistemáticamente una mayor precisión media (mAP ) en el conjunto de datos COCO que los modelos YOLOv5 de tamaño similar. Por ejemplo, el modelo YOLO11m supera al mucho más grande YOLOv5x en precisión (51,5 frente a 50,7 mAP) mientras funciona con una fracción de los parámetros (20,1M frente a 97,2M). Esta drástica reducción del tamaño del modelo se traduce en menores requisitos de memoria durante el entrenamiento y la inferencia, un factor crítico para el despliegue en hardware de IA de borde con recursos limitados.

Velocidad de Inferencia

Gracias a las opciones arquitectónicas optimizadas, YOLO11 brilla en velocidades de inferencia de CPU . El modelo YOLO11n crea una nueva referencia para las aplicaciones en tiempo real, con un tiempo de 56,1 ms en CPU con ONNX, significativamente más rápido que su predecesor.

Eficiencia de la memoria

Los modelosYOLO11 Ultralytics están diseñados para un uso óptimo de la memoria. En comparación con los detectores basados en transformadores como RT-DETRYOLO11 requiere mucha menos memoria CUDA durante el entrenamiento, lo que lo hace accesible a desarrolladores con GPU de consumo estándar.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Formación y experiencia de los desarrolladores

Ambos modelos se benefician del completo ecosistema de Ultralytics , conocido por su "Facilidad de uso".

Integración perfecta

YOLO11 se integra en el moderno ultralytics Paquete Python , que unifica todas las tareas bajo una sencilla API. Esto permite la formación, validación y despliegue en unas pocas líneas de código.

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

Aunque YOLOv5 tiene su propio repositorio dedicado, también puede cargarse fácilmente a través de PyTorch Hub o utilizarse dentro del ecosistema más reciente para determinadas tareas. La sólida documentación de ambos modelos garantiza que, tanto si se realiza el ajuste de hiperparámetros como si se exporta a OpenVINOel proceso sea ágil.

Beneficios para el ecosistema

Elegir un modelo Ultralytics significa acceder a un conjunto de herramientas bien mantenidas. Desde la integración con Comet para el seguimiento de experimentos hasta la gestión de conjuntos de datos sin fisuras, el ecosistema da soporte a todo el ciclo de vida de MLOps. Este desarrollo activo garantiza el suministro regular de parches de seguridad y mejoras de rendimiento.

Casos de Uso Ideales

Cuándo elegir YOLOv5

  • Hardware heredado: Si tiene dispositivos de borde existentes (como Raspberry Pis antiguas) con canalizaciones optimizadas específicamente para la arquitectura YOLOv5 .
  • Flujos de trabajo establecidos: Para proyectos en fase de mantenimiento en los que la actualización de la arquitectura del modelo central supondría importantes costes de refactorización.
  • Optimizaciones específicas de GPU : En raros casos en los que los motores TensorRT específicos están muy ajustados para la estructura de capas exacta de YOLOv5.

Cuándo elegir YOLO11

  • Nuevos desarrollos: Para prácticamente todos los nuevos proyectos, YOLO11 es el punto de partida recomendado debido a su superior relación precisión/cálculo.
  • Aplicaciones de CPU en tiempo real: Las aplicaciones que se ejecutan en procesadores estándar, como portátiles o instancias en la nube, se benefician enormemente de las optimizaciones de velocidad de CPU de YOLO11.
  • Tareas complejas: Proyectos que requieren segmentación de instancias o estimación de la pose junto con la detección.
  • Requisitos de alta precisión: Ámbitos como la imagen médica o el análisis de imágenes por satélite, en los que es primordial detectar objetos pequeños con gran precisión.

Conclusión

YOLOv5 sigue siendo un testimonio de diseño de IA eficiente y accesible, que ha impulsado innumerables innovaciones en los últimos años. Sin embargo, YOLO11 representa el futuro. Con su avanzada arquitectura sin anclajes, sus puntuaciones mAP superiores y su mayor versatilidad, proporciona a los desarrolladores un conjunto de herramientas más potente para resolver los retos de la visión por ordenador moderna.

Al adoptar YOLO11, no sólo obtendrá un mejor rendimiento, sino que sus aplicaciones estarán preparadas para el futuro dentro del próspero ecosistema Ultralytics .

Explorar Otros Modelos

Si le interesa comparar estas arquitecturas con otros modelos punteros, explore nuestras comparativas detalladas:


Comentarios