Ir al contenido

YOLOv10 YOLO26: una nueva era en la detección de objetos de extremo a extremo

La evolución de la detección de objetos en tiempo real ha experimentado rápidos avances en los últimos años, con un fuerte enfoque en equilibrar la velocidad, la precisión y la facilidad de implementación. Esta comparación explora dos hitos importantes en este viaje: YOLOv10, un avance académico que popularizó la detección NMS, y YOLO26, la última potencia lista para la producción de Ultralytics perfecciona estos conceptos para aplicaciones de nivel empresarial.

Descripción general del modelo

YOLOv10: El pionero académico

Lanzado en mayo de 2024 por investigadores de la Universidad de Tsinghua, YOLOv10 un cambio de paradigma al eliminar la necesidad de la supresión no máxima (NMS) durante la inferencia. Este enfoque «de extremo a extremo» abordó un cuello de botella que existía desde hacía mucho tiempo en los procesos de implementación, en los que la latencia del posprocesamiento solía variar de forma impredecible en función de la densidad de la escena.

Más información sobre YOLOv10

YOLO26: El estándar industrial

Basado en los cimientos establecidos por sus predecesores, YOLO26 (lanzado en enero de 2026) es la solución de vanguardia Ultralytics diseñada para tener un impacto en el mundo real. Adopta el diseño integral NMSsistema de gestión de red) pionero de YOLOv10 lo mejora con funciones de pérdida más simples, un optimizador novedoso y mejoras significativas en la velocidad del hardware de vanguardia.

Más información sobre YOLO26

Comparación Técnica

Ambos modelos tienen como objetivo resolver los problemas de latencia causados por NMS, pero toman caminos diferentes hacia la optimización. YOLOv10 principalmente en la búsqueda arquitectónica y las asignaciones duales para el entrenamiento, mientras que YOLO26 prioriza la simplicidad de implementación, CPU y la estabilidad del entrenamiento.

Arquitectura y Diseño

YOLOv10 introdujo asignaciones duales consistentes para el entrenamiento NMS. Este método combina un cabezal uno a muchos (para una supervisión rica durante el entrenamiento) con un cabezal uno a uno (para la inferencia), lo que garantiza que el modelo aprenda a generar un único cuadro óptimo por objeto. También utilizó un diseño de modelo holístico basado en la eficiencia y la precisión, que incluye cabezales de clasificación ligeros y submuestreo desacoplado de canales espaciales.

YOLO26 perfecciona esto eliminando por completo la pérdida focal de distribución (DFL). Si bien la DFL ayudó con la precisión de los recuadros en iteraciones anteriores, su eliminación simplifica significativamente el gráfico de exportación, lo que facilita la ejecución de los modelos YOLO26 en dispositivos periféricos restringidos y microcontroladores de baja potencia. Además, YOLO26 incorpora el optimizador MuSGD, un híbrido entre SGD el optimizador Muon (inspirado en el entrenamiento LLM), que proporciona por primera vez la estabilidad del entrenamiento de lotes grandes a las tareas de visión por ordenador.

Métricas de rendimiento

La siguiente tabla destaca las diferencias de rendimiento. YOLO26 demuestra una velocidad superior en las CPU y una mayor precisión en todas las escalas de modelos, especialmente en las variantes más grandes.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Avance revolucionario en CPU

YOLO26 está optimizado específicamente para entornos sin GPU dedicadas. Alcanza CPU hasta un 43 % más rápida en comparación con las generaciones anteriores, lo que lo convierte en un elemento revolucionario para Raspberry Pi y las implementaciones móviles.

Casos de Uso y Aplicaciones en el Mundo Real

Cuándo elegir YOLOv10

YOLOv10 una excelente opción para investigadores y escenarios específicos de solo detección.

  • Investigación académica: Su estrategia de doble asignación es un tema fascinante para seguir estudiando en el diseño de funciones de pérdida.
  • Tuberías heredadas NMS: si un proyecto ya se ha construido en torno a laONNX YOLOv10 ONNX , seguirá proporcionando una detección fiable y de baja latencia.

Por qué YOLO26 es la mejor opción para la producción

Para la mayoría de los desarrolladores, YOLO26 ofrece una solución más robusta y versátil.

La ventaja de Ultralytics

Elegir un Ultralytics como YOLO26 ofrece ventajas que van mucho más allá de las métricas básicas. El ecosistema integrado garantiza que tu proyecto cuente con asistencia desde la recopilación de datos hasta la implementación final.

Experiencia de Usuario Optimizada

La facilidad de uso que ofrece laPython Ultralytics es inigualable. Mientras que otros repositorios pueden requerir scripts de configuración complejos, Ultralytics se pueden cargar, entrenar e implementar con un código mínimo.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer
model.train(data="coco8.yaml", epochs=100, optimizer="MuSGD")

# Run inference without NMS post-processing
results = model("https://ultralytics.com/images/bus.jpg")

Soporte integral para el ecosistema

YOLO26 está totalmente integrado en la Ultralytics , lo que permite una gestión fluida de los conjuntos de datos, formación remota y exportación con un solo clic a formatos como TensorRT, CoreML y OpenVINO. Este ecosistema bien mantenido garantiza que tengas acceso a actualizaciones frecuentes, un foro comunitario dinámico y una amplia documentación para resolver cualquier problema.

Eficiencia del entrenamiento y memoria

Ultralytics son conocidos por su eficiencia en el entrenamiento. El uso del optimizador MuSGD por parte de YOLO26 permite un entrenamiento estable con menores requisitos de memoria en comparación con modelos basados en transformadores como RT-DETR. Esto significa que se pueden entrenar modelos de alta precisión en GPU de consumo sin agotar la VRAM, lo que democratiza el acceso a capacidades de IA de alta gama.

Conclusión

Ambas arquitecturas representan logros significativos en el campo de la visión artificial. YOLOv10 merece reconocimiento por popularizar el enfoque NMS, demostrando que la detección de extremo a extremo es viable para aplicaciones en tiempo real.

Sin embargo, YOLO26 toma este concepto y lo perfecciona para las necesidades prácticas de 2026. Con sus CPU superiores, su soporte especializado para objetos pequeños a través de ProgLoss y el respaldo del Ultralytics , YOLO26 es la opción recomendada para los desarrolladores que buscan crear soluciones de IA escalables y preparadas para el futuro. Tanto si trabaja en análisis minorista inteligente, robótica autónoma o fabricación de alta velocidad, YOLO26 ofrece el equilibrio de rendimiento necesario para alcanzar el éxito.

Otros Modelos para Explorar

  • YOLO11: El robusto predecesor de YOLO26, todavía muy utilizado en producción.
  • RT-DETR: Una alternativa basada en transformadores que ofrece una alta precisión para escenarios en los que GPU son abundantes.
  • YOLO: Ideal para tareas de detección de vocabulario abierto en las que las clases se definen mediante indicaciones de texto.

Comentarios