Ir al contenido

YOLOv8 frente a YOLOv7: comparación técnica exhaustiva

La evolución de los modelos de detección de objetos ha sido rápida, con la familia YOLO (You Only Look Once) a la cabeza en rendimiento en tiempo real. Elegir entre YOLOv8 y YOLOv7 implica comprender no sólo sus métricas en bruto, sino también las filosofías arquitectónicas, la experiencia de los desarrolladores y el apoyo del ecosistema que los rodea. Mientras que YOLOv7 marcó unos hitos impresionantes en su lanzamiento, Ultralytics YOLOv8 introdujo un cambio de paradigma en cuanto a usabilidad y versatilidad.

Esta guía ofrece un análisis técnico detallado para ayudar a desarrolladores e investigadores a seleccionar la herramienta adecuada para sus proyectos de visión por ordenador.

Análisis de rendimiento

A la hora de comparar el rendimiento, es fundamental tener en cuenta el equilibrio entre la velocidad de inferencia y la precisión de detección (mAP). En general, YOLOv8 ofrece un equilibrio superior, ya que proporciona una mayor precisión para tamaños de modelo similares y velocidades de inferencia más rápidas en hardware moderno.

La siguiente tabla muestra las diferencias de rendimiento en el conjunto de datosCOCO .

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Puntos clave

  • Eficacia: La YOLOv8n (nano) alcanza velocidades extraordinarias (1,47 ms en GPU), lo que lo hace ideal para aplicaciones de IA en los bordes donde la latencia es crítica.
  • Precisión:YOLOv8x supera a YOLOv7x en precisión (53,9% frente a 53,1% mAP) manteniendo un recuento de parámetros competitivo.
  • Optimización: Los modelos YOLOv8 demuestran una mayor eficiencia de los parámetros, ofreciendo un mayor rendimiento por FLOP, lo que se traduce en un menor consumo de energía durante la inferencia.

Ultralytics YOLOv8: el estándar moderno

Publicado por Ultralytics a principios de 2023, YOLOv8 ha sido diseñado para estar a la vanguardia (SOTA) no sólo en rendimiento, sino también en flexibilidad y facilidad de uso. Unifica múltiples tareas de visión por ordenador en un único marco simplificado.

Arquitectura e innovación

YOLOv8 introduce un mecanismo de detección sin anclaje, que simplifica el proceso de formación al eliminar la necesidad de cálculos manuales de cajas de anclaje. Esto reduce el número de predicciones de cajas y acelera la Supresión No Máxima (NMS).

La arquitectura incorpora el módulo C2f (cuello de botella parcial de etapas cruzadas con dos convoluciones), que combina características de alto nivel con información contextual de forma más eficaz que las iteraciones anteriores. Esto da lugar a un flujo de gradiente más rico y a una mejora de la convergencia del aprendizaje. Además, YOLOv8 emplea un cabezal desacoplado que procesa las tareas de objetividad, clasificación y regresión de forma independiente para obtener una mayor precisión.

Fortalezas

Más información sobre YOLOv8

YOLOv7: un referente en eficiencia

YOLOv7 causó sensación con su lanzamiento al introducir optimizaciones arquitectónicas centradas en los métodos "bag-of-freebies" para aumentar la precisión sin incrementar el coste de la inferencia.

Arquitectura y enfoque

YOLOv7 utiliza la Red de Agregación de Capas Eficiente Ampliada (E-ELAN), que controla las rutas de gradiente más corta y más larga para permitir que la red aprenda más características de forma eficiente. Enfatiza en gran medida el escalado del modelo (alterando la profundidad y la anchura simultáneamente) e introduce técnicas de re-parametrización para fusionar capas durante la inferencia, acelerando el modelo sin perder precisión en el entrenamiento.

Puntos fuertes y limitaciones

YOLOv7 es un potente modelo que ofrece una excelente relación velocidad-precisión, especialmente en dispositivos GPU . Su enfoque "bag-of-freebies" garantiza la ligereza del modelo durante su despliegue. Sin embargo, en comparación con YOLOv8, carece de soporte multitarea unificado y requiere procedimientos de configuración más complejos que implican la clonación de repositorios y la gestión manual de dependencias. Es principalmente un especialista en detección de objetos, y otras tareas suelen requerir ramas o implementaciones separadas.

Más información sobre YOLOv7

Comparación técnica detallada

Usabilidad y ecosistema

Una de las diferencias más claras radica en la facilidad de uso. Ultralytics YOLOv8 está empaquetado como una biblioteca estándar Python . Esto significa que los desarrolladores pueden integrarlo en los pipelines existentes con un código mínimo. En cambio, YOLOv7 funciona normalmente como una base de código independiente que debe clonarse y modificarse.

Experiencia de los desarrolladores

YOLOv8 permite entrenar un modelo en sólo tres líneas de código Python . Esta experiencia de usuario simplificada reduce significativamente el tiempo de comercialización de las soluciones de IA.

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model

# Train the model
results = model.train(data="coco8.yaml", epochs=100)

Versatilidad de tareas

Los proyectos modernos de visión por ordenador suelen requerir algo más que cajas delimitadoras.

  • YOLOv8: Un verdadero modelo multitarea. Puede cambiar de detección a segmentación o estimación de la pose simplemente cambiando el archivo de peso del modelo (por ejemplo, yolov8n-seg.pt).
  • YOLOv7: Centrado principalmente en la detección. Aunque existen extensiones, no están tan estrechamente integradas o mantenidas dentro de un único marco unificado.

Eficacia del entrenamiento y memoria

YOLOv8 optimiza los requisitos de memoria durante el entrenamiento. Implementa estrategias inteligentes de aumento de datos que se desactivan hacia el final del entrenamiento para afinar la precisión. Además, el marco de Ultralytics admite diversos formatos de conjuntos de datos y gestiona la descarga automática de conjuntos de datos estándar, lo que aumenta significativamente la eficiencia del entrenamiento.

Los modelos basados en transformadores suelen requerir grandes cantidades de memoria CUDA y se entrenan con lentitud. En comparación, tanto YOLOv7 como YOLOv8 se basan en CNN y son eficientes, pero las modernas opciones arquitectónicas de YOLOv8(como el bloque C2f) suelen dar como resultado una convergencia más rápida y una mayor eficiencia de memoria en hardware de consumo.

Casos de uso en el mundo real

Venta al por menor y gestión de inventarios

Para el análisis de los comercios, la velocidad es primordial. YOLOv8n puede ejecutarse en dispositivos periféricos como cámaras o módulos NVIDIA Jetson para track del inventario en tiempo real. Su alta velocidad de inferencia garantiza un recuento preciso y sin retrasos de los productos en movimiento.

Sistemas autónomos y robótica

La robótica requiere una comprensión espacial precisa. Las capacidades de segmentación de YOLOv8 permiten a los robots distinguir la forma exacta de los obstáculos en lugar de un simple cuadro delimitador. Esta versatilidad mejora la seguridad de la navegación. Aunque YOLOv7 es capaz, la implementación de la segmentación requiere más esfuerzo y bases de código dispares.

Agricultura

En la agricultura de precisión, los modelos detect enfermedades de los cultivos o controlan su crecimiento. El ecosistema bien mantenido de Ultralytics significa que los investigadores tienen acceso a pesos preentrenados y tutoriales de la comunidad específicos para estos conjuntos de datos nicho, lo que reduce la barrera de entrada.

Conclusión

Aunque YOLOv8 sigue siendo una arquitectura respetable y potente en la historia de la visión por ordenador, Ultralytics YOLOv8 representa la opción superior para el desarrollo moderno. Su combinación de rendimiento de última generación, versatilidad inigualable y un ecosistema orientado al desarrollador lo convierten en la solución ideal tanto para la investigación académica como para la implantación empresarial.

Para aquellos que buscan lo último en eficiencia y refinamiento arquitectónico, Ultralytics también ha lanzado YOLO11que va aún más allá. Sin embargo, en comparación directa con la generación v7, YOLOv8 destaca por su robustez, fiabilidad y facilidad de uso.

Lecturas adicionales

Explore otras comparaciones de modelos para profundizar en su comprensión del panorama YOLO :


Comentarios