Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 frente a YOLOv8#

Al crear aplicaciones escalables y eficientes de visión artificial, seleccionar la arquitectura adecuada es fundamental. La evolución del ecosistema de Ultralytics ha superado constantemente los límites de velocidad y precisión, proporcionando a los desarrolladores herramientas robustas para implementaciones en el mundo real. Esta comparativa técnica profundiza en las diferencias entre YOLOv5 y YOLOv8, explorando sus arquitecturas, compromisos de rendimiento y casos de uso ideales para ayudarte a tomar una decisión informada para tu próximo proyecto de IA.

Ambos modelos representan hitos significativos en la historia de la detección de objetos en tiempo real, y ambos se benefician de los requisitos de memoria altamente optimizados y la facilidad de uso que caracterizan al ecosistema de Ultralytics.

Link to this sectionYOLOv5: El estándar de la industria fiable#

Presentado en 2020, YOLOv5 se convirtió rápidamente en el estándar de la industria para una detección de objetos rápida, accesible y fiable. Al aprovechar una implementación nativa de PyTorch, agilizó el ciclo de vida de entrenamiento e implementación para ingenieros de todo el mundo.

Link to this sectionFortalezas arquitectónicas#

YOLOv5 opera bajo un paradigma de detección basado en anclas, que depende de anchor boxes predefinidas para predecir los límites de los objetos. Su arquitectura incorpora un backbone de red de etapa parcial cruzada (CSP), optimizando el flujo de gradientes y reduciendo la redundancia computacional. Esto resulta en una huella de memoria increíblemente ligera, lo que lo hace excepcionalmente rápido de entrenar incluso en GPUs estándar de consumo.

Link to this sectionCasos de uso ideales#

YOLOv5 es altamente recomendado para proyectos donde el rendimiento máximo y la utilización mínima de recursos son primordiales. Destaca en entornos de edge AI, como implementaciones en Raspberry Pi o dispositivos móviles. Su madurez significa que ha sido probado exhaustivamente en miles de implementaciones comerciales, ofreciendo una estabilidad inigualable para flujos de trabajo de detección de objetos tradicionales.

Ventaja de implementación heredada

Debido a su adopción generalizada, YOLOv5 cuenta con rutas de exportación increíblemente estables a marcos de implementación heredados como TensorRT y ONNX, lo que hace que la integración en pilas tecnológicas antiguas sea fluida.

Más información sobre YOLOv5

Link to this sectionYOLOv8: El marco de visión unificado#

Lanzado en enero de 2023, YOLOv8 representó un cambio arquitectónico monumental, evolucionando de un detector de objetos dedicado a un marco de visión versátil y multitarea.

Link to this sectionInnovaciones arquitectónicas#

A diferencia de su predecesor, YOLOv8 introduce una cabecera de detección sin anclas (anchor-free). Esto elimina la necesidad de ajustar manualmente las configuraciones de anclas basadas en las distribuciones de los conjuntos de datos, mejorando la generalización a través de diversos conjuntos de datos personalizados como el popular COCO dataset.

La arquitectura también mejora el backbone con un módulo C2f (cuello de botella de etapa parcial cruzada con dos convoluciones), reemplazando el módulo C3 anterior. Esta mejora perfecciona la representación de características sin gravar excesivamente la memoria. Además, la implementación de una cabecera desacoplada —separando las tareas de objetividad, clasificación y regresión— mejora drásticamente la convergencia durante el model training.

Link to this sectionVersatilidad y API de Python#

YOLOv8 introdujo la moderna API de Python ultralytics, estandarizando el flujo de trabajo en varias tareas de visión artificial. Tanto si realizas image segmentation, image classification o pose estimation, la API unificada solo requiere cambios mínimos de configuración.

from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train on a custom dataset with built-in memory efficiency
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference and easily parse results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Más información sobre YOLOv8

Link to this sectionComparativa detallada de rendimiento#

Al comparar ambas generaciones, observamos un compromiso clásico: YOLOv8 logra una precisión media promedio (mAP) superior en todos los ámbitos, mientras que YOLOv5 mantiene una ligera ventaja en la velocidad de inferencia absoluta en bruto y en el recuento de parámetros para sus variantes más pequeñas.

A continuación se muestra la comparación detallada de sus métricas de rendimiento en el conjunto de datos COCO con un tamaño de imagen de 640 píxeles.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Los datos revelan que YOLOv8 proporciona un aumento sustancial en la precisión. Por ejemplo, YOLOv8s logra un 44.9 mAP en comparación con el 37.4 mAP de YOLOv5s, un salto enorme que mejora significativamente el rendimiento en entornos densos o al identificar objetos pequeños. Sin embargo, para entornos extremadamente limitados, YOLOv5n sigue siendo increíblemente eficiente, presumiendo del recuento de parámetros y FLOPs más bajo.

Requisitos de memoria

Ambos modelos están altamente optimizados para un menor uso de memoria CUDA durante el entrenamiento en comparación con arquitecturas más pesadas como los transformer models. Esto permite a los profesionales utilizar tamaños de lote más grandes en GPUs estándar, acelerando el ciclo de vida de la investigación.

Link to this sectionLa ventaja del ecosistema#

Elegir tanto YOLOv5 como YOLOv8 otorga a los desarrolladores acceso a la bien mantenida Ultralytics Platform. Este entorno integrado ofrece herramientas sencillas para el etiquetado de conjuntos de datos, hyperparameter tuning, entrenamiento en la nube y monitorización de modelos. El desarrollo activo y el fuerte apoyo de la comunidad aseguran que los desarrolladores puedan resolver problemas rápidamente e integrarse con herramientas externas como Weights & Biases y ClearML.

Mientras que otros marcos pueden sufrir curvas de aprendizaje pronunciadas, Ultralytics prioriza una experiencia de usuario optimizada, asegurando un compromiso favorable entre velocidad y precisión adecuado para diversos escenarios de implementación en el mundo real.

Link to this sectionMás allá de v8: Explorando YOLO11 y YOLO26#

Aunque YOLOv8 es un marco altamente capaz, el campo de la inteligencia artificial evoluciona rápidamente. Los desarrolladores interesados en un rendimiento de vanguardia también deberían explorar YOLO11, que se basa en la v8 con mayor precisión y velocidad.

Para aquellos que buscan lo último en tecnología de visión artificial, recomendamos encarecidamente Ultralytics YOLO26. Lanzado en 2026, YOLO26 representa un salto masivo hacia adelante:

  • Diseño de extremo a extremo sin NMS: Pionero originalmente en arquitecturas experimentales, YOLO26 elimina de forma nativa el post-procesamiento de Non-Maximum Suppression, lo que conduce a conductos de implementación drásticamente más sencillos y rápidos.
  • Optimizador MuSGD: Inspirado en las innovaciones de entrenamiento de LLM vistas en modelos como Kimi K2, YOLO26 utiliza un optimizador híbrido para un entrenamiento más estable y una convergencia rápida.
  • Dominio de la computación Edge: Con hasta un 43% más de velocidad de inferencia en CPU en comparación con generaciones anteriores, es el modelo definitivo para dispositivos que carecen de GPUs dedicadas.
  • Precisión mejorada: Utilizando las nuevas funciones de pérdida ProgLoss + STAL, mejora drásticamente el reconocimiento de objetos pequeños, lo cual es fundamental para la robótica y las imágenes de drones aéreos.

Ya sea manteniendo un sistema heredado con YOLOv5, escalando una aplicación versátil con YOLOv8, o innovando con las capacidades de vanguardia de YOLO26, la suite Ultralytics proporciona las herramientas integrales necesarias para el éxito en la IA de visión moderna.

Colaboradores

Comentarios