Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 vs YOLOv7#

El panorama de la visión artificial ha evolucionado rápidamente en los últimos años, impulsado por la necesidad de una detección de objetos en tiempo real más rápida y precisa. Al elegir la arquitectura adecuada para tu proyecto de visión artificial, es crucial entender los matices entre modelos populares como Ultralytics YOLOv5 y YOLOv7. Esta comparativa técnica exhaustiva profundiza en sus arquitecturas, metodologías de entrenamiento, métricas de rendimiento y escenarios de despliegue ideales para ayudarte a tomar una decisión informada.

Link to this sectionDe un vistazo: Orígenes de los modelos#

Entender los orígenes y las filosofías de diseño detrás de estos modelos proporciona contexto para sus decisiones arquitectónicas.

Detalles de YOLOv5:

Más información sobre YOLOv5

Detalles de YOLOv7:

Más información sobre YOLOv7

Explora más arquitecturas

¿Te interesa saber cómo se comparan estos modelos con otros? Echa un vistazo a nuestras comparativas como YOLOv5 vs YOLO11 o YOLOv7 vs EfficientDet para ampliar tu comprensión del ecosistema de detección de objetos.

Link to this sectionInnovaciones arquitectónicas y diferencias#

Link to this sectionYOLOv5: El estándar de accesibilidad#

Presentado por Ultralytics en 2020, YOLOv5 supuso un cambio de paradigma al utilizar de forma nativa el framework PyTorch, lo que redujo significativamente la barrera de entrada para investigadores y desarrolladores. Su arquitectura se basa en una estructura 'backbone' Modified CSPDarknet53, integrando redes Cross Stage Partial (CSP) para reducir el número de parámetros manteniendo el flujo de gradiente.

Uno de sus mayores puntos fuertes son sus requisitos de memoria. En comparación con detectores antiguos de dos etapas o modelos pesados tipo Transformer como RT-DETR, YOLOv5 requiere sustancialmente menos memoria CUDA durante el entrenamiento, lo que permite tamaños de lote (batch sizes) mayores en GPUs comerciales estándar. Además, su versatilidad integrada de forma nativa admite clasificación de imágenes, detección de objetos y segmentación de imágenes sin problemas.

Link to this sectionYOLOv7: Superando los límites de la precisión en tiempo real#

Lanzado a mediados de 2022, YOLOv7 se centró en ampliar los límites del estado del arte para la detección en tiempo real en los benchmarks de MS COCO. Los autores introdujeron la red Extended Efficient Layer Aggregation Network (E-ELAN), que mejora la capacidad de aprendizaje de la red sin destruir la ruta de gradiente original.

YOLOv7 también es famoso por su "bolsa de obsequios entrenables" (trainable bag-of-freebies), en particular sus técnicas de re-parametrización durante el entrenamiento que convierten múltiples módulos en una sola capa convolucional para la inferencia, aumentando la velocidad sin sacrificar precisión. Sin embargo, esta compleja metodología de entrenamiento suele resultar en curvas de aprendizaje más pronunciadas y pipelines de exportación menos directos en comparación con el ecosistema nativo de Ultralytics.

Link to this sectionComparación de rendimiento#

Al evaluar estos modelos, el equilibrio de rendimiento entre velocidad, precisión y coste computacional es primordial. A continuación se presenta una comparación detallada de sus métricas de rendimiento basadas en el dataset MS COCO val2017.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Aunque YOLOv7 alcanza puntuaciones mAP absolutas más altas en variantes más grandes, YOLOv5 ofrece un espectro inigualable de modelos, desde el Nano (YOLOv5n) ultraligero para dispositivos de borde (edge devices) extremos, hasta el Extra-Large (YOLOv5x) para inferencia en la nube.

Link to this sectionLa ventaja del ecosistema Ultralytics#

La utilidad de un modelo va más allá de su arquitectura básica; el ecosistema que lo rodea determina la rapidez con la que puede llevarse a producción. Aquí es donde brillan los modelos de Ultralytics.

  • Facilidad de uso: La Plataforma Ultralytics y su API de Python unificada ofrecen una experiencia de usuario optimizada, una sintaxis sencilla y una amplia documentación. Entrenar un dataset personalizado no requiere ningún código estándar (boilerplate).
  • Ecosistema bien mantenido: Ultralytics se beneficia de un desarrollo activo, actualizaciones frecuentes y un fuerte apoyo de la comunidad. Las integraciones con herramientas como Comet ML y Weights & Biases vienen integradas de serie.
  • Eficiencia de entrenamiento: Los cargadores de datos, el almacenamiento en caché inteligente y el soporte para múltiples GPUs hacen que los modelos de Ultralytics sean excepcionalmente eficientes de entrenar. Los pesos pre-entrenados disponibles aceleran drásticamente el aprendizaje por transferencia.

Link to this sectionEjemplo de código: Cómo empezar#

Usando Ultralytics, desplegar un modelo requiere solo unas pocas líneas de código. El siguiente fragmento de Python demuestra lo sencillo que es cargar, entrenar y ejecutar una inferencia utilizando el paquete recomendado ultralytics.

from ultralytics import YOLO

# Load a pretrained YOLOv5s model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 example dataset
# Ultralytics automatically handles data downloading and augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the predictions
predictions[0].show()

Por el contrario, utilizar el repositorio original de YOLOv7 generalmente implica clonar repositorios complejos, gestionar dependencias manualmente y utilizar largos argumentos en la línea de comandos.

Link to this sectionAplicaciones del mundo real y casos de uso ideales#

Link to this sectionCuándo elegir YOLOv7#

YOLOv7 sigue siendo un candidato sólido para benchmarks académicos o pipelines de GPUs heredadas específicas donde el mAP máximo es el único objetivo y el sistema ya está adaptado a sus tensores de salida basados en anclas. Los investigadores que exploran el análisis de rutas de gradiente suelen utilizar YOLOv7 como línea base.

Link to this sectionCuándo elegir YOLOv5#

YOLOv5 es muy apreciado en entornos de producción debido a su excepcional estabilidad. Es la opción preferida para:

  • Computación móvil y Edge: Desplegar YOLOv5n en iOS a través de CoreML o en Android mediante TFLite.
  • Startups ágiles: Los equipos que necesitan ciclos de iteración rápidos se benefician de la integración fluida con la Plataforma Ultralytics para la gestión de datasets y el entrenamiento en la nube.
  • Entornos multitarea: Sistemas que requieren detección de objetos, clasificación y segmentación simultáneas.

Link to this sectionEl futuro: pasarse a YOLO26#

Aunque comparar YOLOv5 y YOLOv7 es un ejercicio excelente para entender la evolución de la IA de visión, el estado del arte ha seguido avanzando. Lanzado en enero de 2026, Ultralytics YOLO26 representa un salto monumental, dejando arquitecturas más antiguas prácticamente obsoletas para nuevos proyectos.

Para los desarrolladores que buscan la máxima precisión, YOLO26 ofrece varias ventajas revolucionarias sobre YOLOv5 y YOLOv7:

  • Diseño de extremo a extremo sin NMS: Al eliminar el post-procesamiento Non-Maximum Suppression, YOLO26 ofrece un despliegue mucho más sencillo y una latencia más rápida y consistente.
  • Optimizador MuSGD: Inspirado en las innovaciones de LLM de Moonshot AI, este optimizador híbrido ofrece un entrenamiento altamente estable y una convergencia rápida.
  • Velocidad de borde sin precedentes: Optimizado específicamente para entornos de borde, la variante nano cuenta con una inferencia en CPU hasta un 43% más rápida al eliminar la función Distribution Focal Loss (DFL).
  • Precisión superior: Nuevas funciones de pérdida como ProgLoss + STAL mejoran significativamente el reconocimiento de objetos pequeños, lo que lo hace ideal para imágenes de drones y robótica.

Tanto si mantienes un pipeline de YOLOv5 existente como si buscas implementar el vanguardista YOLO26, la Plataforma Ultralytics te proporciona todas las herramientas necesarias para tener éxito en la visión artificial moderna.

Colaboradores

Comentarios