Ir al contenido

YOLOX frente a YOLO11: tendiendo puentes entre la investigación y la aplicación en el mundo real

En el panorama en rápida evolución de la detección de objetos, elegir el modelo adecuado a menudo implica encontrar el equilibrio entre la investigación de vanguardia y las necesidades prácticas de implementación. Esta comparación explora dos arquitecturas significativas: YOLOX, un detector sin anclajes de alto rendimiento lanzado en 2021, y YOLO11, un modelo versátil y robusto de Ultralytics para aplicaciones empresariales modernas. Aunque ambos modelos comparten el YOLO , difieren significativamente en sus filosofías arquitectónicas, el soporte del ecosistema y la facilidad de uso.

Comparación de métricas de rendimiento

A la hora de evaluar los detectores de objetos, son fundamentales métricas clave como la precisión media (mAP) y la velocidad de inferencia. La tabla siguiente destaca cómo la nueva arquitectura de YOLO11 una eficiencia superior, especialmente en lo que respecta al equilibrio entre velocidad y precisión.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

YOLOX: Una evolución sin anclajes

YOLOX fue presentado por Megvii en 2021 como una versión sin anclajes de la YOLO . Su objetivo era salvar la brecha entre la investigación académica y la aplicación industrial simplificando el cabezal de detección y eliminando la necesidad de cuadros de anclaje predefinidos.

Características principales:

  • Diseño sin anclajes: elimina el complejo proceso de agrupación de cajas de anclaje, simplificando el proceso de entrenamiento.
  • Cabezal desacoplado: Separa las tareas de clasificación y regresión en diferentes ramas, mejorando la velocidad de convergencia y la precisión.
  • SimOTA: una estrategia avanzada de asignación de etiquetas que asigna dinámicamente muestras positivas, lo que mejora la estabilidad del entrenamiento.

Si bien YOLOX representó un avance significativo en 2021, su implementación a menudo requiere una configuración más compleja y carece del soporte unificado y multitarea que se encuentra en los marcos más nuevos.

Detalles de YOLOX:

YOLO11: Versatilidad y potencia del ecosistema

YOLO11, lanzado por Ultralytics, se basa en el éxito de sus predecesores para ofrecer un modelo que no solo es preciso, sino también increíblemente fácil de usar e implementar. Está diseñado como una solución integral para una amplia gama de tareas de visión artificial.

Puntos Fuertes Clave:

  • Facilidad de uso: La Ultralytics es conocida por su simplicidad. La carga, el entrenamiento y la predicción se pueden realizar con solo unas pocas líneas de código, lo que reduce significativamente la barrera de entrada para los desarrolladores.
  • Ecosistema bien mantenido: YOLO11 con un mantenimiento activo, actualizaciones frecuentes y una comunidad dinámica. Esto garantiza la compatibilidad con las últimas versiones de PyTorch y una rápida corrección de errores.
  • Versatilidad: a diferencia de YOLOX, que es principalmente un detector de objetos, YOLO11 admite YOLO11 múltiples tareas, incluyendo la segmentación de instancias, la estimación de poses, la clasificación y la detección de cuadros delimitadores orientados (OBB).
  • Eficiencia de entrenamiento: YOLO11 optimizado para un uso eficiente de los recursos, y a menudo requiere menos memoria durante el entrenamiento en comparación con alternativas basadas en transformadores como RT-DETR.

Más información sobre YOLO11

YOLO11 :

¿Sabías que?

Si quieres lo último en rendimiento de vanguardia, echa un vistazo a YOLO26. Lanzado en enero de 2026, cuenta con un diseño nativo de extremo a extremo NMS, optimizador MuSGD y CPU hasta un 43 % más rápida, lo que lo convierte en la mejor opción para la IA de vanguardia.

Comparación Arquitectónica

Las diferencias arquitectónicas entre YOLOX y YOLO11 la evolución de las estrategias de detección de objetos a lo largo del tiempo.

Arquitectura de YOLOX

YOLOX utiliza una estructura CSPDarknet similar a YOLOv5 introduce una estructura de cabeza desacoplada. En YOLO tradicionales, la clasificación y la localización se realizaban de forma acoplada. YOLOX las divide en dos ramas separadas, lo que ayuda a resolver el conflicto entre la confianza en la clasificación y la precisión en la localización. Su mecanismo sin anclajes trata la detección de objetos como un problema de regresión puntual, lo que simplifica el diseño del modelo, pero a veces puede tener dificultades con escenarios de objetos extremadamente densos en comparación con los enfoques basados en anclajes.

Arquitectura de YOLO11

YOLO11 una arquitectura refinada de columna vertebral y cuello que mejora las capacidades de extracción de características en diferentes escalas. Integra módulos avanzados para una mejor atención espacial y fusión de características. Una ventaja fundamental del Ultralytics es la integración perfecta de la exportabilidad. La arquitectura está diseñada desde cero para poder exportarse fácilmente a formatos como ONNX, TensorRTy OpenVINO, lo que garantiza que la alta precisión observada durante el entrenamiento se traduzca directamente en una inferencia eficiente en dispositivos periféricos.

Casos de Uso Ideales

La elección entre estos modelos suele depender de los requisitos específicos de su proyecto.

Cuándo elegir YOLOX

  • Referencias de investigación: YOLOX es un excelente punto de referencia para la investigación académica centrada en métodos de detección sin anclajes o en la modificación de cabezales desacoplados.
  • Sistemas heredados: si ya dispone de un canal construido en torno al código base de Megvii o si necesita específicamente la estrategia de asignación SimOTA para un conjunto de datos especializado.

Cuándo elegir YOLO11

  • Desarrollo rápido: si necesita pasar rápidamente de un conjunto de datos a un modelo implementado, la Ultralytics optimizada y Python hacen que YOLO11 sea YOLO11 mejor opción.
  • Requisitos multitarea: los proyectos que pueden ampliarse desde la simple detección hasta la segmentación o el seguimiento se benefician del marco unificado YOLO11.
  • Implementación de la producción: Para aplicaciones comerciales en el comercio minorista, las ciudades inteligentes o la seguridad, la sólida compatibilidad con la exportación y la fiabilidad probada por la comunidad de YOLO11 los riesgos de implementación.
  • Computación periférica: con variantes optimizadas, YOLO11 excepcionalmente bien en dispositivos con recursos limitados, como Raspberry Pi o NVIDIA .

Comparación de códigos: facilidad de uso

La diferencia en cuanto a la facilidad de uso es notable cuando se comparan los flujos de trabajo de formación.

Formación con Ultralytics YOLO11: El Ultralytics elimina la complejidad, lo que le permite centrarse en sus datos.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

Entrenamiento con YOLOX: YOLOX normalmente requiere clonar el repositorio, configurar un entorno específico y ejecutar el entrenamiento mediante scripts de línea de comandos con numerosos argumentos, lo que puede resultar menos intuitivo para los flujos de trabajo Python.

Conclusión

Tanto YOLOX como YOLO11 modelos capaces que han contribuido significativamente al campo de la visión artificial. YOLOX desafió el dominio de los métodos basados en anclajes e introdujo conceptos importantes como los cabezales desacoplados. Sin embargo, para la mayoría de los desarrolladores y empresas actuales, YOLO11 ofrece un paquete más atractivo. Su combinación de alto rendimiento, versatilidad y un ecosistema inigualable lo convierte en la opción más pragmática para crear soluciones de IA para el mundo real.

Para aquellos que deseen ampliar aún más los límites, especialmente en implementaciones periféricas, recomendamos encarecidamente explorar YOLO26. Con su diseño integral NMS y la eliminación de la pérdida focal de distribución (DFL), YOLO26 representa el siguiente salto en eficiencia y velocidad.

Otros Modelos para Explorar

  • YOLO26: El último modelo de vanguardia de Ultralytics enero de 2026), con inferencia NMS y funciones de pérdida especializadas.
  • YOLOv8: Un clásico ampliamente adoptado en la YOLO , conocido por su equilibrio entre velocidad y precisión.
  • RT-DETR: Detector basado en transformador que ofrece una alta precisión, ideal para situaciones en las que la velocidad en tiempo real es menos importante que la precisión.
  • SAM : El modelo Segment Anything Model de Meta, perfecto para tareas de segmentación sin entrenamiento previo.

Comentarios