Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 vs YOLOv10#

El campo de la visión artificial en tiempo real ha experimentado un crecimiento exponencial en los últimos años, con diversas arquitecturas superando los límites de lo posible en el hardware moderno. Al evaluar arquitecturas de vanguardia, la comparación entre YOLOv5 y YOLOv10 destaca un paso evolutivo significativo en el dominio de la detección de objetos. Este análisis técnico explora sus paradigmas arquitectónicos, las ventajas y desventajas de su rendimiento y cómo puedes aprovechar estas herramientas en entornos de producción.

Link to this sectionAnálisis arquitectónico en profundidad#

Entender las diferencias estructurales entre estos modelos es fundamental para implementarlos de manera eficiente en el mundo real.

Link to this sectionUltralytics YOLOv5: El estándar de la industria#

Presentado por Ultralytics, YOLOv5 ha sido reconocido durante mucho tiempo por su equilibrio inigualable de velocidad, precisión y accesibilidad.

Más información sobre YOLOv5

YOLOv5 depende de un mecanismo de detección basado en anclas combinado con un backbone CSPDarknet profundamente optimizado. Esta arquitectura se apoya fuertemente en operaciones estándar soportadas en prácticamente todos los motores de inferencia, lo que la hace increíblemente versátil. Su mayor fortaleza reside en el SDK de Python de Ultralytics, que proporciona una experiencia de usuario optimizada, una API sencilla y documentación extensa. Además, los menores requisitos de memoria de YOLOv5 en comparación con los modelos basados en Transformer significan que se entrena rápidamente en GPUs de consumo sin la carga excesiva de VRAM.

Link to this sectionYOLOv10: Avanzando en el paradigma#

Desarrollado por investigadores de la Universidad de Tsinghua, YOLOv10 tuvo como objetivo abordar cuellos de botella específicos de latencia encontrados en arquitecturas anteriores.

Aprende más sobre YOLOv10

La característica definitoria de YOLOv10 es su diseño nativamente sin NMS (Non-Maximum Suppression). Al usar asignaciones duales consistentes durante el entrenamiento, el modelo elimina la necesidad de post-procesamiento de NMS durante la inferencia. Esta reducción teórica de la latencia es altamente beneficiosa para implementaciones que se ejecutan en hardware de gama alta con potente aceleración NVIDIA TensorRT, aunque puede introducir complejidades estructurales para dispositivos periféricos (edge devices).

Ventaja del ecosistema

Aunque YOLOv10 ofrece novedades arquitectónicas interesantes, los modelos de Ultralytics como YOLOv5 y el nuevo YOLO26 son compatibles de forma nativa dentro de la Plataforma Ultralytics, ofreciendo una eficiencia de entrenamiento superior, evolución automática de hiperparámetros y amplias opciones de exportación desde el primer momento.

Link to this sectionAnálisis de rendimiento#

Al comparar estos modelos, el equilibrio entre precisión (mAP) y coste computacional (latencia y parámetros) dicta el mejor caso de uso. A continuación, se muestra la comparación de rendimiento técnico en el conjunto de datos COCO.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

YOLOv10 logra claramente un mAP50-95 más alto en escalas de tamaño equivalentes, aprovechando su diseño de modelo modernizado orientado a la eficiencia y precisión. Sin embargo, YOLOv5 mantiene una latencia increíblemente competitiva, especialmente en los niveles Nano y Small, lo que lo hace altamente fiable para entornos embebidos restringidos como la línea NVIDIA Jetson o CPUs estándar mediante OpenVINO.

Link to this sectionMetodologías de entrenamiento y ecosistema#

El valor de un modelo está profundamente ligado al ecosistema que lo rodea. Ultralytics mantiene un ecosistema excepcionalmente bien cuidado que soporta una gama increíblemente amplia de tareas. Mientras que YOLOv10 se centra estrictamente en la detección de objetos 2D, Ultralytics soporta de forma nativa la segmentación de instancias, clasificación de imágenes, estimación de pose y cajas delimitadoras orientadas (OBB).

Además, entrenar un modelo de Ultralytics requiere una carga de memoria significativamente menor que los métodos basados en Transformer de la competencia, manteniendo el ciclo de desarrollo rápido y rentable.

Link to this sectionEjecución de código fluida#

El entrenamiento, la validación y la exportación de modelos están unificados bajo una única API. Puedes cambiar entre modelos simplemente alterando una cadena de texto.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model for baseline testing
model_v5 = YOLO("yolov5s.pt")

# Load a YOLOv10 model for comparison
model_v10 = YOLO("yolov10s.pt")

# Train the model on the COCO8 dataset efficiently
results = model_v5.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Automatically utilizes PyTorch CUDA acceleration
    batch=16,
)

# Export to ONNX for CPU inference deployment
model_v5.export(format="onnx", simplify=True)

Link to this sectionCasos de uso y recomendaciones#

Elegir entre YOLOv5 y YOLOv10 depende de los requisitos específicos de tu proyecto, las restricciones de despliegue y tus preferencias de ecosistema.

Link to this sectionCuándo elegir YOLOv5#

YOLOv5 es una opción sólida para:

  • Sistemas de producción probados: Despliegues existentes donde se valora la larga trayectoria de estabilidad, la extensa documentación y el enorme soporte de la comunidad de YOLOv5.
  • Entrenamiento con recursos limitados: Entornos con recursos de GPU limitados donde la eficiente canalización de entrenamiento de YOLOv5 y sus menores requisitos de memoria son ventajosos.
  • Amplio soporte de formatos de exportación: Proyectos que requieren despliegue en muchos formatos, incluidos ONNX, TensorRT, CoreML y TFLite.

Link to this sectionCuándo elegir YOLOv10#

YOLOv10 está recomendado para:

  • Detección en tiempo real sin NMS: Aplicaciones que se benefician de una detección integral (end-to-end) sin NMS, lo que reduce la complejidad de la implementación.
  • Equilibrio entre velocidad y precisión: Proyectos que requieren un buen equilibrio entre la velocidad de inferencia y la precisión de detección en varias escalas de modelo.
  • Aplicaciones de latencia constante: Escenarios de despliegue donde los tiempos de inferencia predecibles son críticos, como en robótica o sistemas autónomos.

Link to this sectionCuándo elegir Ultralytics (YOLO26)#

Para la mayoría de los proyectos nuevos, Ultralytics YOLO26 ofrece la mejor combinación de rendimiento y experiencia de desarrollo:

  • Implementación en el borde sin NMS: Aplicaciones que requieren una inferencia consistente y de baja latencia sin la complejidad del posprocesamiento de supresión de no máximos.
  • Entornos solo de CPU: Dispositivos sin aceleración de GPU dedicada, donde la inferencia en CPU hasta un 43% más rápida de YOLO26 proporciona una ventaja decisiva.
  • Detección de objetos pequeños: Escenarios desafiantes como imágenes de drones aéreos o análisis de sensores IoT donde ProgLoss y STAL aumentan significativamente la precisión en objetos pequeños.

Link to this sectionEl futuro: Ultralytics YOLO26#

Aunque YOLOv5 revolucionó la accesibilidad y YOLOv10 traspasó los límites de la arquitectura sin NMS, el estado del arte continúa evolucionando. Para nuevos proyectos, recomendamos encarecidamente el avanzado Ultralytics YOLO26, lanzado en enero de 2026.

YOLO26 fusiona la fiabilidad del ecosistema Ultralytics con avances revolucionarios:

  • Diseño integral sin NMS: Al incorporar el paradigma sin NMS directamente en el framework de Ultralytics, YOLO26 simplifica el despliegue y garantiza una menor latencia.
  • Inferencia en CPU hasta un 43% más rápida: Con la eliminación de Distribution Focal Loss (DFL), YOLO26 es notablemente más rápido en dispositivos periféricos sin GPUs.
  • Optimizador MuSGD: Inspirado en las innovaciones de entrenamiento de LLM de Moonshot AI, el optimizador MuSGD proporciona una estabilidad sin precedentes y una rápida convergencia.
  • ProgLoss + STAL: Estas novedosas funciones de pérdida mejoran drásticamente el reconocimiento de objetos pequeños, vital para campos como las imágenes de drones y la robótica.

Puedes gestionar, entrenar y desplegar YOLO26 directamente a través de la Plataforma Ultralytics.

Link to this sectionConclusión#

Elegir entre YOLOv5 y YOLOv10 a menudo se reduce a restricciones específicas del proyecto. YOLOv10 ofrece un excelente mAP para investigadores y aplicaciones que aprovechan el rendimiento bruto de la GPU. Por el contrario, YOLOv5 sigue siendo un caballo de batalla firme y altamente compatible para despliegues estándar.

Sin embargo, el campo de la visión artificial es dinámico. Para aprovechar el mejor equilibrio de rendimiento, versatilidad y facilidad de uso, los desarrolladores deben mirar hacia Ultralytics YOLO26. Encapsula la velocidad de la inferencia sin NMS con el ecosistema robusto y bien documentado de Ultralytics, asegurando que tus soluciones de IA de visión estén preparadas para el futuro. Para casos de uso especializados, los desarrolladores también pueden explorar YOLO11 para una robustez general, o RT-DETR para una precisión basada en Transformer.

Colaboradores

Comentarios