YOLOv7 vs YOLO11: Una Comparación Técnica Detallada
Seleccionar el modelo de detección de objetos óptimo requiere una comprensión profunda de las capacidades específicas y las concesiones de las diferentes arquitecturas. Esta página proporciona una comparación técnica exhaustiva entre YOLOv7 y Ultralytics YOLO11, dos modelos potentes en el linaje YOLO. Profundizaremos en sus diferencias arquitectónicas, puntos de referencia de rendimiento y casos de uso ideales para ayudarle a elegir el que mejor se adapte a sus proyectos de visión artificial.
YOLOv7: Detección de Objetos Eficiente y Precisa
YOLOv7 se introdujo como un avance significativo en la detección de objetos en tiempo real, centrándose en la optimización de la eficiencia y la precisión del entrenamiento sin aumentar los costes de inferencia. Estableció un nuevo estado del arte para los detectores en tiempo real tras su lanzamiento.
Autores: Chien-Yao Wang, Alexey Bochkovskiy y Hong-Yuan Mark Liao
Organización: Instituto de Ciencias de la Información, Academia Sinica, Taiwán
Fecha: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Documentación: https://docs.ultralytics.com/models/yolov7/
Arquitectura y Características Clave
YOLOv7 se basa en arquitecturas YOLO anteriores introduciendo varias innovaciones clave. Emplea técnicas como las redes de agregación de capas eficientes extendidas (E-ELAN) en el backbone para mejorar la extracción y el aprendizaje de características. Una contribución importante es el concepto de "bag-of-freebies entrenable", que implica estrategias de optimización aplicadas durante el entrenamiento, como el uso de un cabezal de detección auxiliar y una guía de lo general a lo particular, para aumentar la precisión final del modelo sin añadir sobrecarga computacional durante la inferencia. Aunque se centra principalmente en la detección de objetos, el repositorio oficial muestra extensiones de la comunidad para tareas como la estimación de la pose y la segmentación de instancias.
Rendimiento y casos de uso
YOLOv7 demostró un rendimiento de última generación tras su lanzamiento, ofreciendo un equilibrio convincente entre velocidad y precisión. Por ejemplo, el modelo YOLOv7x alcanza un 53,1% de mAPtest en el conjunto de datos MS COCO con un tamaño de imagen de 640. Su eficiencia lo hace adecuado para aplicaciones en tiempo real, como los sistemas de seguridad avanzados y los sistemas autónomos que requieren una detección rápida y precisa.
Fortalezas
- Equilibrio entre Alta Precisión y Velocidad: Ofrece una sólida combinación de mAP y velocidad de inferencia para tareas en tiempo real en GPU.
- Entrenamiento eficiente: Utiliza técnicas de entrenamiento avanzadas ("bag-of-freebies") para mejorar la precisión sin aumentar el coste de la inferencia.
- Rendimiento Establecido: Resultados probados en benchmarks estándar como MS COCO.
Debilidades
- Complejidad: La arquitectura y las técnicas de entrenamiento pueden ser complejas de comprender y optimizar completamente.
- Uso intensivo de recursos: Los modelos YOLOv7 más grandes requieren importantes recursos de GPU para el entrenamiento.
- Versatilidad de tareas limitada: Se centra principalmente en la detección de objetos, lo que requiere implementaciones separadas para otras tareas como la segmentación o la clasificación, a diferencia de los modelos integrados como YOLO11.
- Menos mantenimiento: El framework no se desarrolla ni se mantiene tan activamente como el ecosistema de Ultralytics, lo que se traduce en menos actualizaciones y menos soporte de la comunidad.
Ultralytics YOLO11: Eficiencia y versatilidad de última generación
Ultralytics YOLO11 representa la última evolución en la serie YOLO de Ultralytics, diseñado para una precisión superior, una eficiencia mejorada y una mayor versatilidad de tareas dentro de un marco fácil de usar. Se basa en los éxitos de sus predecesores como YOLOv8 para ofrecer una experiencia de última generación.
Autores: Glenn Jocher y Jing Qiu
Organización: Ultralytics
Fecha: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Documentación: https://docs.ultralytics.com/models/yolo11/
Arquitectura y Características Clave
La arquitectura de YOLO11 incorpora técnicas avanzadas de extracción de características y un diseño de red optimizado, lo que resulta en una mayor precisión, a menudo con un recuento de parámetros reducido en comparación con sus predecesores. Esta optimización conlleva velocidades de inferencia más rápidas y menores demandas computacionales, lo cual es crucial para su implementación en diversas plataformas, desde dispositivos periféricos hasta infraestructura en la nube.
Una ventaja clave de YOLO11 es su versatilidad. Soporta de forma nativa múltiples tareas de visión artificial, incluyendo la detección de objetos, la segmentación de instancias, la clasificación de imágenes, la estimación de poses y las cajas delimitadoras orientadas (OBB). Se integra perfectamente en el ecosistema Ultralytics, ofreciendo una experiencia de usuario optimizada a través de interfaces simples de Python y CLI, una extensa documentación y pesos pre-entrenados disponibles para un entrenamiento eficiente.
Rendimiento y casos de uso
YOLO11 demuestra impresionantes puntuaciones de Precisión Media Promedio (mAP) en diferentes tamaños de modelo, logrando una compensación favorable entre velocidad y precisión. Por ejemplo, YOLO11m logra un mAPval de 51.5 a un tamaño de imagen de 640 con significativamente menos parámetros que YOLOv7l. Las variantes más pequeñas como YOLO11n ofrecen una inferencia excepcionalmente rápida, mientras que los modelos más grandes como YOLO11x maximizan la precisión. En particular, los modelos YOLO11 a menudo exhiben un menor uso de memoria durante el entrenamiento y la inferencia en comparación con otras arquitecturas.
La precisión y eficiencia mejoradas de YOLO11 lo hacen ideal para aplicaciones que requieren un procesamiento preciso y en tiempo real:
- Robótica: Permite una navegación precisa y la interacción con objetos, como se explora en el papel de la IA en la robótica.
- Sistemas de seguridad: Impulsa sistemas de alarma de seguridad avanzados para la detección de intrusiones.
- Análisis minorista: Mejora de la gestión de inventario y el análisis del comportamiento del cliente.
- Automatización Industrial: Soporte para el control de calidad en la fabricación.
Fortalezas
- Rendimiento de última generación: Altas puntuaciones mAP con una arquitectura optimizada y sin anclajes.
- Inferencia eficiente: Excelente velocidad, especialmente en CPU, adecuado para necesidades en tiempo real.
- Soporte Versátil de Tareas: Gestiona de forma nativa la detección, la segmentación, la clasificación, la pose y el OBB en un único framework.
- Facilidad de uso: API sencilla, documentación extensa y soporte integrado para Ultralytics HUB para entrenamiento e implementación sin código.
- Ecosistema bien mantenido: Desarrollo activo, comunidad sólida, actualizaciones frecuentes y procesos de capacitación eficientes.
- Escalabilidad: Funciona eficazmente en todo tipo de hardware, desde el edge hasta la nube, con menores requisitos de memoria.
Debilidades
- Como modelo más nuevo, algunas integraciones específicas de herramientas de terceros podrían estar aún en evolución en comparación con los modelos más antiguos y establecidos.
- Los modelos más grandes pueden exigir importantes recursos computacionales para el entrenamiento, aunque siguen siendo muy eficientes para su clase de rendimiento.
Comparación de rendimiento: YOLOv7 vs. YOLO11
La siguiente tabla proporciona una comparación detallada del rendimiento entre los modelos YOLOv7 y YOLO11 en el conjunto de datos COCO. Los modelos YOLO11 demuestran un equilibrio superior de precisión, velocidad y eficiencia. Por ejemplo, YOLO11l logra un mAP más alto que YOLOv7x con menos de la mitad de los parámetros y FLOPs, y es significativamente más rápido en GPU. De manera similar, YOLO11m coincide con la precisión de YOLOv7l con aproximadamente la mitad de los parámetros y el costo computacional. El modelo más pequeño, YOLO11n, proporciona una velocidad notable tanto en CPU como en GPU con un uso mínimo de recursos, lo que lo hace ideal para aplicaciones en el borde.
Modelo | tamaño (píxeles) |
mAPval 50-95 |
Velocidad CPU ONNX (ms) |
Velocidad T4 TensorRT10 (ms) |
parámetros (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Conclusión: ¿Qué modelo debería elegir?
Si bien YOLOv7 fue un modelo potente para su época y todavía ofrece un sólido rendimiento para la detección de objetos en tiempo real, Ultralytics YOLO11 representa un avance significativo. YOLO11 no solo supera a YOLOv7 en las métricas clave de rendimiento, sino que también ofrece un marco de trabajo mucho más versátil, fácil de usar y bien respaldado.
Para desarrolladores e investigadores que buscan una solución moderna y todo en uno, YOLO11 es la opción más clara. Sus ventajas incluyen:
- Balance de rendimiento superior: YOLO11 proporciona un mejor equilibrio entre precisión, velocidad y coste computacional.
- Versatilidad Multi-Tarea: El soporte nativo para la detección, segmentación, clasificación, pose y OBB elimina la necesidad de múltiples modelos y simplifica los flujos de trabajo de desarrollo.
- Facilidad de uso: La API optimizada, la documentación exhaustiva y los sencillos procedimientos de entrenamiento lo hacen accesible tanto para principiantes como para expertos.
- Desarrollo activo: Como parte del ecosistema Ultralytics, YOLO11 se beneficia de actualizaciones continuas, una sólida comunidad de código abierto e integración con herramientas como Ultralytics HUB para MLOps sin problemas.
En resumen, si tu prioridad es aprovechar los últimos avances en IA para una amplia gama de aplicaciones con un enfoque en la facilidad de implementación y la preparación para el futuro, Ultralytics YOLO11 es el modelo recomendado.
Explorar Otros Modelos
Para una exploración más exhaustiva, considere estas comparaciones que involucran a YOLOv7, YOLO11 y otros modelos relevantes en la documentación de Ultralytics:
- YOLO11 vs YOLOv8
- YOLO11 vs YOLOv10
- YOLOv7 vs YOLOv8
- YOLOv7 vs YOLOv5
- Explore los últimos modelos como YOLOv9 y YOLOv10.