Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11 frente a YOLOX#

El campo de la visión artificial ha sido testigo de rápidos avances durante los últimos años, con modelos de detección de objetos en tiempo real que son cada vez más sofisticados. Al elegir una arquitectura para un entorno de producción o para la investigación académica, los desarrolladores a menudo sopesan las ventajas y desventajas entre hitos heredados e innovaciones de vanguardia. Esta comparativa exhaustiva explora las diferencias entre Ultralytics YOLO11 y YOLOX de Megvii, proporcionando un análisis profundo de sus arquitecturas, métricas de rendimiento y escenarios de despliegue ideales.

Link to this sectionVisión general de la arquitectura#

Ambos modelos representan saltos significativos en la detección de objetos, pero provienen de diferentes filosofías de diseño y se dirigen a diferentes experiencias de desarrollador.

Link to this sectionYOLO11: El motor multitarea versátil#

Lanzado en septiembre de 2024 por Glenn Jocher y Jing Qiu en Ultralytics, YOLO11 está diseñado como un marco unificado que equilibra una alta precisión con una eficiencia extrema.

YOLO11 va más allá de las cajas delimitadoras estándar, al admitir de forma nativa la segmentación de instancias, la clasificación de imágenes, la estimación de pose y la detección de Cajas Delimitadoras Orientadas (OBB). Su arquitectura refinada optimiza la extracción de características para asegurar una mejor retención de las mismas a través de complejas jerarquías espaciales.

Más información sobre YOLO11

Link to this sectionYOLOX: El pionero sin anclas (anchor-free)#

Desarrollado por investigadores en Megvii, YOLOX ganó una atención significativa en 2021 al cerrar la brecha entre la investigación y las aplicaciones industriales con un enfoque puramente sin anclas (anchor-free).

YOLOX introdujo un cabezal desacoplado y un paradigma sin anclas, lo que redujo significativamente el número de parámetros de diseño y mejoró el rendimiento en los puntos de referencia académicos en el momento de su lanzamiento.

Más información sobre YOLOX

¿Sabías que?

El diseño sin anclas popularizado por YOLOX inspiró muchas arquitecturas posteriores. Ultralytics incorporó y perfeccionó enormemente estos conceptos sin anclas en iteraciones posteriores como YOLOv8 y YOLO11 para proporcionar una precisión superior y flexibilidad en el despliegue.

Link to this sectionRendimiento y métricas#

Al evaluar modelos de detección, es crucial examinar el equilibrio de parámetros, el coste computacional (FLOPs) y la precisión media promedio (mAP) para el despliegue de modelos en el mundo real.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Como se puede ver en la tabla, YOLO11x supera significativamente a YOLOXx en precisión absoluta (54.7 mAP frente a 51.1 mAP), mientras requiere aproximadamente la mitad de los parámetros (56.9M frente a 99.1M). Esta eficiencia se traduce en menores requisitos de memoria durante el entrenamiento y la inferencia, una ventaja enorme para los entornos de producción.

Link to this sectionEcosistema y experiencia del desarrollador#

Link to this sectionLa ventaja de Ultralytics#

Una de las diferencias más profundas entre YOLO11 y YOLOX reside en su facilidad de uso. YOLOX opera principalmente como una base de código de investigación, que requiere una configuración compleja del entorno, la compilación manual de operadores de C++ y verbosos argumentos de línea de comandos para iniciar el entrenamiento con conjuntos de datos personalizados.

Por el contrario, YOLO11 está totalmente integrado en el paquete de Python de Ultralytics, proporcionando un flujo de trabajo optimizado y de "cero a cien". La Plataforma Ultralytics ofrece herramientas extensas para la anotación de datos, el seguimiento de experimentos y el entrenamiento basado en la nube, eliminando el trabajo repetitivo para que los ingenieros puedan centrarse en el rendimiento del modelo.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model effortlessly using the Ultralytics API
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")

Además, exportar un modelo de Ultralytics a formatos como TensorRT, CoreML o OpenVINO solo requiere un único comando, mientras que los repositorios antiguos a menudo exigen herramientas complejas de terceros o cirugías manuales de grafos.

Link to this sectionCasos de uso en el mundo real#

Link to this sectionCuándo considerar YOLOX#

YOLOX sigue siendo una opción válida para despliegues heredados especializados donde los desarrolladores ya han construido tuberías de inferencia de C++ altamente personalizadas en torno a sus salidas de tensor de cabezal desacoplado específicas. Además, los investigadores que realicen estudios comparativos frente a arquitecturas de última generación de 2021 seguirán utilizando YOLOX como una línea base de conjunto de datos de referencia.

Link to this sectionDonde YOLO11 destaca#

Para casi todos los escenarios de producción modernos, YOLO11 proporciona una experiencia muy superior:

  • Ciudades inteligentes y comercio minorista: Gracias a su excepcional relación velocidad-precisión, YOLO11 gestiona escenas concurridas sin esfuerzo, impulsando sistemas de análisis minorista automatizado y gestión del tráfico sin necesidad de enormes clústeres de GPU.
  • Edge Computing: The high memory efficiency and robust export options make YOLO11 perfect for edge AI deployments on devices like Raspberry Pi or NVIDIA Jetson platforms.
  • Tuberías complejas: Si un proyecto requiere combinar la detección de objetos con puntos clave de pose (por ejemplo, análisis deportivo) o una segmentación de instancias precisa (por ejemplo, imágenes médicas), YOLO11 maneja todas las tareas de forma nativa a través de una API unificada.

Link to this sectionCasos de uso y recomendaciones#

Elegir entre YOLO11 y YOLOX depende de los requisitos específicos de tu proyecto, las restricciones de despliegue y las preferencias del ecosistema.

Link to this sectionCuándo elegir YOLO11#

YOLO11 es una gran opción para:

  • Implementación en producción en el borde: Aplicaciones comerciales en dispositivos como Raspberry Pi o NVIDIA Jetson donde la fiabilidad y el mantenimiento activo son primordiales.
  • Aplicaciones de visión multitarea: Proyectos que requieren detección, segmentación, estimación de pose y OBB dentro de un único marco unificado.
  • Creación rápida de prototipos e implementación: Equipos que necesitan pasar rápidamente de la recopilación de datos a la producción utilizando la API de Python de Ultralytics optimizada.

Link to this sectionCuándo elegir YOLOX#

YOLOX se recomienda para:

  • Investigación en detección sin anclas: Investigación académica que utiliza la arquitectura limpia y sin anclas de YOLOX como base para experimentar con nuevas cabeceras de detección o funciones de pérdida.
  • Dispositivos de borde ultraligeros: Despliegue en microcontroladores o hardware móvil antiguo donde la huella extremadamente pequeña de la variante YOLOX-Nano (0.91M de parámetros) es crítica.
  • Estudios de asignación de etiquetas SimOTA: Proyectos de investigación que investigan estrategias de asignación de etiquetas basadas en transporte óptimo y su impacto en la convergencia del entrenamiento.

Link to this sectionCuándo elegir Ultralytics (YOLO26)#

Para la mayoría de los proyectos nuevos, Ultralytics YOLO26 ofrece la mejor combinación de rendimiento y experiencia de desarrollo:

  • Implementación en el borde sin NMS: Aplicaciones que requieren una inferencia consistente y de baja latencia sin la complejidad del posprocesamiento de supresión de no máximos.
  • Entornos solo de CPU: Dispositivos sin aceleración de GPU dedicada, donde la inferencia en CPU hasta un 43% más rápida de YOLO26 proporciona una ventaja decisiva.
  • Detección de objetos pequeños: Escenarios desafiantes como imágenes de drones aéreos o análisis de sensores IoT donde ProgLoss y STAL aumentan significativamente la precisión en objetos pequeños.

Link to this sectionMirando hacia el futuro: La potencia de YOLO26#

Si bien YOLO11 es una opción excepcional, el panorama de la IA se acelera continuamente. Para los equipos que buscan la máxima eficiencia y estabilidad, YOLO26 (lanzado en enero de 2026) es la recomendación definitiva para nuevos proyectos de visión artificial.

YOLO26 representa un gran salto adelante al implementar un Diseño de extremo a extremo sin NMS. Al eliminar el posprocesamiento de Supresión de No Máximos (NMS), elimina por completo la variabilidad de la latencia, simplificando drásticamente la lógica de despliegue; un concepto iniciado por primera vez en YOLOv10.

Además, YOLO26 cuenta con la eliminación de DFL (Distribution Focal Loss), lo que optimiza la arquitectura para lograr una inferencia en CPU hasta un 43% más rápida, convirtiéndolo en el campeón indiscutible para dispositivos de baja potencia y en el borde. La estabilidad del entrenamiento también está supercargada a través del Optimizador MuSGD, un híbrido inspirado en LLM de SGD y Muon que acelera la convergencia. Combinado con funciones de pérdida avanzadas como ProgLoss + STAL, YOLO26 destaca en la detección de objetos pequeños en entornos desafiantes como imágenes de drones y sensores de borde de IoT.

Exploración adicional

¿Buscas ampliar tu conocimiento sobre arquitecturas de detección de objetos? Explora las capacidades de vocabulario abierto de YOLO-World o sumérgete en el modelo RT-DETR basado en Transformer documentado en el ecosistema Ultralytics.

En conclusión, aunque YOLOX introdujo importantes conceptos arquitectónicos en 2021, el conjunto de herramientas integral, la eficiencia de memoria y el rendimiento de vanguardia de YOLO11—y especialmente la arquitectura revolucionaria de YOLO26—hacen del ecosistema de Ultralytics la opción clara para investigadores y desarrolladores empresariales hoy en día.

Comentarios