Ir al contenido

YOLOv7 YOLOv5: equilibrio entre precisión de alta gama y versatilidad de producción

Elegir la arquitectura adecuada para la detección de objetos a menudo implica encontrar un equilibrio entre el rendimiento académico puro y la facilidad práctica de implementación. Esta comparación detallada explora dos hitos importantes en la YOLO : YOLOv7, conocida por sus optimizaciones arquitectónicas «bag-of-freebies», y YOLOv5, el legendario Ultralytics famoso por su facilidad de uso, velocidad y adopción masiva en entornos de producción.

Resumen Ejecutivo

Mientras YOLOv7 alcanza una mayor precisión máxima (mAP) en el COCO gracias a opciones arquitectónicas complejas como E-ELAN, YOLOv5 sigue siendo el estándar del sector en cuanto a facilidad de uso, ya que ofrece una experiencia de entrenamiento más optimizada, un menor consumo de recursos y una mayor compatibilidad de implementación. Para los desarrolladores que inician nuevos proyectos en 2026, el debate ha evolucionado naturalmente hacia Ultralytics , que combina las ventajas de precisión de la v7 con la facilidad de uso de la v5, además de una inferencia nativa de extremo a extremo NMS.

Comparación de métricas de rendimiento

La siguiente tabla destaca las diferencias de rendimiento entre las variantes clave. YOLOv7 GPU de gama alta, mientras que YOLOv5 una gama granular de modelos adecuados para todo, desde dispositivos móviles hasta servidores en la nube.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOv7: La potencia arquitectónica

Publicado en julio de 2022 por los autores de YOLOv4, YOLOv7 introdujo varios conceptos avanzados destinados a ampliar los límites de la precisión de la detección de objetos en tiempo real.

Más información sobre YOLOv7

Características arquitectónicas clave

  1. E-ELAN (Extended Efficient Layer Aggregation Network): esta estructura permite a la red aprender características más diversas mediante el control de las rutas de gradiente más cortas y más largas. Mejora la capacidad de aprendizaje de la red sin destruir la ruta de gradiente original, lo que conduce a una mayor precisión en escenas complejas.
  2. Escalado del modelo: a diferencia del escalado compuesto estándar, YOLOv7 la profundidad y la anchura del bloque simultáneamente, lo que garantiza una arquitectura óptima para diferentes restricciones de recursos (por ejemplo, YOLOv7 frente a YOLOv7).
  3. Bolsa de regalos entrenable: el modelo incorpora técnicas de reparametrización planificadas, que optimizan la estructura del modelo durante el entrenamiento, pero la simplifican durante la inferencia, lo que aumenta eficazmente la velocidad sin pérdida de precisión.

Casos de uso ideales para YOLOv7

YOLOv7 en la investigación académica y en aplicaciones industriales de alta gama en las que cada punto porcentual de mAP , como los sistemas de seguridad para la conducción autónoma o la detección de pequeños defectos en imágenes de fabricación de alta resolución.

YOLOv5: El estándar de producción

YOLOv5, desarrollado por Ultralytics, revolucionó el campo no solo por su arquitectura, sino también por dar prioridad a la experiencia del desarrollador. Fue el primer YOLO implementado de forma nativa en PyTorch, lo que lo hizo accesible a una enorme comunidad de Python .

Más información sobre YOLOv5

Por qué los desarrolladores eligen YOLOv5

  • Versatilidad sin igual: mientras que YOLOv7 principalmente en la detección, YOLOv5 la segmentación de instancias y la clasificación de imágenes desde el primer momento.
  • Bajo consumo de memoria: YOLOv5 muy eficiente con CUDA , lo que permite tamaños de lotes más grandes en hardware de consumo en comparación con los modelos basados en transformadores o arquitecturas más pesadas.
  • Ecosistema de implementación: ofrece una exportación fluida a ONNX, CoreML, TFLite y TensorRT, lo que lo convierte en la opción ideal para aplicaciones móviles y dispositivos periféricos como NVIDIA .

La ventaja de Ultralytics: Ecosistema y usabilidad

Al comparar estos modelos, el ecosistema circundante suele ser tan importante como la propia arquitectura. Ultralytics (YOLOv5 el más reciente YOLO26) se benefician de una plataforma unificada y bien mantenida.

Facilidad de uso y eficiencia en el entrenamiento

Para entrenar un modelo no hace falta tener un doctorado en informática. Ultralytics una Python sencilla que estandariza el flujo de trabajo. Puedes pasar de entrenar un YOLOv5 a un YOLO11 o YOLO26 simplemente cambiando un único argumento de cadena.

from ultralytics import YOLO

# Load a model (YOLOv5 or the newer YOLO26)
model = YOLO("yolo26n.pt")

# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

La plataforma integrada

Los usuarios de Ultralytics obtienen acceso a la Ultralytics , un centro basado en la web para la gestión de conjuntos de datos, la anotación automatizada y la implementación de modelos con un solo clic. Esta integración del ecosistema reduce significativamente el tiempo de comercialización de los productos de visión artificial en comparación con la gestión de repositorios sin procesar.

Preparados para el futuro con YOLO26

Aunque YOLOv7 YOLOv5 eficaces, el campo de la visión artificial avanza rápidamente. Para los nuevos proyectos, Ultralytics ofrece ventajas significativas con respecto a sus dos predecesores.

Lanzado en enero de 2026, YOLO26 aborda las limitaciones específicas de las generaciones anteriores:

  • NMS de extremo a extremo: a diferencia de YOLOv5 v7, que requieren un posprocesamiento de supresión no máxima (NMS), YOLO26 es nativamente de extremo a extremo. Esto da como resultado un código más limpio y una inferencia más rápida, especialmente en dispositivos periféricos donde NMS un cuello de botella.
  • Optimizador MuSGD: inspirado en la estabilidad del entrenamiento LLM, este nuevo optimizador garantiza una convergencia más rápida que el SGD estándar SGD en v5/v7.
  • Optimización de bordes: al eliminar la pérdida focal de distribución (DFL), YOLO26 es hasta un 43 % más rápido en CPU, lo que lo hace superior para implementaciones móviles.
  • Detección mejorada de objetos pequeños: gracias a ProgLoss y STAL (autoaprendizaje con aprendizaje de anclaje), supera a YOLOv7 objetos pequeños, un factor crítico para las tareas de imágenes aéreas y con drones.

Más información sobre YOLO26

Conclusión

YOLOv7 es un potente logro arquitectónico que ofrece una gran precisión a los investigadores y GPU específicos GPU de alto rendimiento. Sin embargo, su enfoque en la complejidad «bag-of-freebies» puede dificultar su modificación e implementación en comparación con Ultralytics .

YOLOv5 sigue siendo una leyenda en el sector por su equilibrio en cuanto a rendimiento, facilidad de uso y increíble versatilidad en tareas como la detección, la segmentación y la clasificación. Es la opción segura y fiable para muchos sistemas de producción heredados.

Para aquellos que buscan lo mejor de ambos mundos, alta precisión y facilidad de uso, recomendamos YOLO26. Combina el Ultralytics , fácil de usar, con innovaciones de vanguardia como la inferencia NMS y la optimización MuSGD, lo que garantiza que sus aplicaciones sean rápidas, precisas y preparadas para el futuro.

Lecturas adicionales


Comentarios