Link to this sectionYOLOv7 frente a YOLOv5#
Al crear pipelines modernos de visión artificial, seleccionar la arquitectura de detección de objetos adecuada es fundamental para equilibrar la precisión, la velocidad de inferencia y la utilización de recursos. Esta comparativa exhaustiva analiza dos modelos de gran influencia en el espacio de la visión artificial: YOLOv7 y Ultralytics YOLOv5.
Mediante el análisis de sus diferencias arquitectónicas, métricas de rendimiento y escenarios de despliegue ideales, nuestro objetivo es ayudar a desarrolladores e investigadores a elegir el mejor modelo para sus requisitos específicos.
Link to this sectionAntecedentes y orígenes de los modelos#
Comprender los orígenes de estos modelos proporciona contexto sobre sus filosofías de diseño y casos de uso previstos.
Link to this sectionYOLOv5#
Lanzado por Glenn Jocher y el equipo de Ultralytics el 26 de junio de 2020, YOLOv5 revolucionó el campo al proporcionar una implementación nativa de PyTorch que priorizaba la usabilidad sin sacrificar el rendimiento. Rápidamente se convirtió en un estándar de la industria debido a su ecosistema increíblemente optimizado y a sus dinámicas de entrenamiento fiables. Puedes explorar el código fuente en el repositorio de GitHub de YOLOv5 o acceder al modelo directamente a través de la plataforma de Ultralytics.
Link to this sectionYOLOv7#
Presentado por Chien-Yao Wang, Alexey Bochkovskiy y Hong-Yuan Mark Liao del Instituto de Ciencias de la Información, Academia Sínica, Taiwán, el 6 de julio de 2022. YOLOv7 se centró intensamente en innovaciones arquitectónicas como las redes de agregación de capas eficientes extendidas (E-ELAN) y un "bag-of-freebies" entrenable para impulsar el estado del arte en precisión. Los detalles se pueden encontrar en su artículo oficial de Arxiv y en el repositorio de GitHub de YOLOv7. Para una integración perfecta, echa un vistazo a la documentación de Ultralytics YOLOv7.
Ambos modelos están totalmente integrados en el paquete de Python de Ultralytics, lo que te permite cambiar entre ellos simplemente modificando la cadena del modelo en tu código.
Link to this sectionInnovaciones arquitectónicas#
Link to this sectionDiseño de Ultralytics YOLOv5#
YOLOv5 utiliza un backbone CSPDarknet53 modificado junto con un cuello de red de agregación de rutas (PANet). Este diseño está altamente optimizado para la extracción de características rápida y la eficiencia de memoria. A diferencia de arquitecturas más antiguas o modelos transformer pesados, YOLOv5 requiere mucha menos memoria CUDA durante el entrenamiento, lo que permite tamaños de lote mayores en GPUs de consumo estándar. Además, el framework de Ultralytics admite de forma inherente una amplia variedad de tareas más allá de los cuadros delimitadores estándar, incluyendo la segmentación de imágenes y la clasificación de imágenes.
Link to this sectionDiseño de YOLOv7#
YOLOv7 introdujo varias reparametrizaciones estructurales y la arquitectura E-ELAN, que permite a la red aprender características más diversas sin destruir la ruta de gradiente original. También implementa una cabeza auxiliar para la supervisión intermedia durante el entrenamiento. Aunque estos avances producen una media de precisión promedio (mAP) alta, a menudo introducen estructuras de tensores complejas que pueden hacer que la exportación a formatos de borde como ONNX o TensorRT sea ligeramente más difícil en comparación con las exportaciones optimizadas nativas de los modelos de Ultralytics.
Link to this sectionAnálisis de rendimiento#
Al comparar estos modelos, los desarrolladores deben equilibrar el mAPval, la velocidad de inferencia y la complejidad computacional (FLOPs). La siguiente tabla demuestra el rendimiento de ambas arquitecturas evaluadas en el dataset COCO.
| Modelo | tamaño (píxeles) | mAPval 50-95 | Velocidad CPU ONNX (ms) | Velocidad T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Link to this sectionPuntos clave#
- Techo de precisión: YOLOv7x logra la mayor precisión general con un impresionante 53.1 mAPval, lo que lo hace altamente competitivo para escenarios donde maximizar el rendimiento de la detección es el objetivo principal.
- Velocidad y eficiencia: Ultralytics YOLOv5n es una maravilla de la eficiencia, ofreciendo una latencia de inferencia ultrarrápida (1.12 ms en T4 TensorRT) con una huella de memoria minúscula de solo 2.6M de parámetros. Esto lo convierte en una opción inigualable para despliegues en el borde altamente restringidos.
- Equilibrio de rendimiento: La serie YOLOv5 proporciona un gradiente excepcional de modelos. YOLOv5l ofrece un punto medio fantástico, situándose ligeramente por detrás de YOLOv7l en margen de precisión pero ofreciendo un pipeline de despliegue altamente maduro.
Link to this sectionLa ventaja del ecosistema Ultralytics#
La arquitectura de un modelo es solo la mitad de la ecuación; el ecosistema que lo rodea dicta su viabilidad en el mundo real. Aquí es donde los modelos de Ultralytics realmente brillan.
Facilidad de uso: Ultralytics proporciona una API de Python unificada y altamente intuitiva. Puedes entrenar, validar y desplegar modelos con un boilerplate mínimo, respaldado por una extensa documentación oficial. Ecosistema bien mantenido: El desarrollo activo garantiza actualizaciones constantes, correcciones de errores y una integración perfecta con modernas herramientas de seguimiento como Weights & Biases. Eficiencia de entrenamiento: Al utilizar cargadores de datos optimizados y caché inteligente, YOLOv5 reduce drásticamente los tiempos de entrenamiento. Además, los pesos preentrenados listos para usar aceleran el aprendizaje por transferencia en varios dominios.
Link to this sectionEjemplo de código: Entrenamiento simplificado#
Con el paquete de Ultralytics, iniciar una ejecución de entrenamiento es prácticamente idéntico independientemente de la arquitectura que elijas.
from ultralytics import YOLO
# Load a pre-trained YOLOv5 model (can easily swap to "yolov7.pt")
model = YOLO("yolov5s.pt")
# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to ONNX format for deployment
success = model.export(format="onnx")Link to this sectionCasos de uso ideales#
Link to this sectionCuándo elegir YOLOv7#
- Benchmarking académico: Perfecto para investigadores que necesitan comparar técnicas novedosas con una línea base de 2022 bien documentada.
- Procesamiento en la nube con GPU de gama alta: Al desplegar en servidores potentes donde lograr el mAP absoluto más alto en escenas densas compensa la simplicidad de exportación.
Link to this sectionCuándo elegir YOLOv5#
- Despliegues en producción: Ideal para aplicaciones comerciales que requieren alta estabilidad, opciones de despliegue de modelos directas y amplia compatibilidad multiplataforma.
- Dispositivos de borde: Las variantes más pequeñas (YOLOv5n y YOLOv5s) funcionan excepcionalmente bien en teléfonos móviles y sistemas integrados.
- Requisitos de multitarea: Si tu proyecto necesita evolucionar de una detección simple a estimación de pose o segmentación utilizando un framework unificado.
¿Buscas iteraciones más recientes? Considera explorar Ultralytics YOLOv8 o Ultralytics YOLO11 para más avances en detección sin anclas y capacidades de aprendizaje multitarea.
Link to this sectionLa próxima generación: Ultralytics YOLO26#
Aunque YOLOv5 y YOLOv7 ocupan lugares vitales en la historia de la IA de visión, el panorama evoluciona constantemente. Lanzado en enero de 2026, Ultralytics YOLO26 representa la tecnología de vanguardia absoluta en detección de objetos, superando a generaciones anteriores en todas las métricas.
YOLO26 introduce varias características que cambian el paradigma:
- Diseño integral sin NMS: Sobre la base de conceptos iniciados en iteraciones anteriores, YOLO26 es nativamente integral. Esto elimina por completo el postprocesamiento de supresión no máxima (NMS), reduciendo los cuellos de botella de latencia y simplificando drásticamente la lógica de despliegue.
- Optimizador MuSGD: Inspirado en Kimi K2 de Moonshot AI, este revolucionario optimizador combina la estabilidad del SGD estándar con el momento acelerado de Muon, incorporando innovaciones avanzadas de entrenamiento de LLM directamente en la visión artificial.
- Velocidad de CPU mejorada: Al eliminar estratégicamente la pérdida focal de distribución (DFL), YOLO26 logra hasta un 43% más de rapidez en la inferencia de CPU, convirtiéndose en el campeón indiscutible para el despliegue en el borde y dispositivos IoT de bajo consumo.
- ProgLoss + STAL: Estas funciones de pérdida avanzadas producen mejoras masivas en el reconocimiento de objetos pequeños, lo cual es crítico para la fotografía aérea y la robótica de precisión.
- Mejoras específicas de la tarea: Incluye pérdida de segmentación semántica para la generación de máscaras, estimación de log-verosimilitud residual (RLE) para el seguimiento de pose y pérdida de ángulo especializada para resolver problemas complejos de límites de cuadros delimitadores orientados (OBB).
Link to this sectionConclusión#
Tanto YOLOv5 como YOLOv7 ofrecen soluciones sólidas para la detección de objetos en tiempo real. YOLOv7 sigue siendo una opción fuerte para la precisión pura en hardware de alta computación, mientras que YOLOv5 destaca como la herramienta definitiva orientada al desarrollador, ofreciendo un equilibrio excepcional de velocidad, eficiencia y un ecosistema de clase mundial.
Sin embargo, para los desarrolladores que buscan preparar sus pipelines para el futuro y lograr la combinación definitiva de velocidad, simplicidad y precisión de vanguardia, recomendamos encarecidamente migrar a Ultralytics YOLO26. Encapsula la legendaria facilidad de uso de la plataforma Ultralytics mientras ofrece innovaciones arquitectónicas revolucionarias.