Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11 frente a DAMO-YOLO#

Elegir la arquitectura óptima es un paso crítico en cualquier proyecto de visión artificial. Esta guía técnica ofrece una comparación exhaustiva entre dos potentes modelos de detección de objetos: Ultralytics YOLO11 y DAMO-YOLO. Analizaremos sus innovaciones arquitectónicas, paradigmas de entrenamiento y aplicabilidad en el mundo real para ayudarte a seleccionar la mejor herramienta para tus necesidades de despliegue.

Link to this sectionResumen de modelos#

Link to this sectionUltralytics YOLO11#

Desarrollado por el equipo de Ultralytics, YOLO11 representa una iteración altamente refinada en la familia YOLO, que optimiza significativamente tanto la precisión como la eficiencia. Está diseñado para investigadores e ingenieros que buscan un ecosistema unificado y listo para producción que abarque desde la gestión de datasets hasta el despliegue en el borde (edge).

Más información sobre YOLO11

YOLO11 destaca por su versatilidad. Mientras que muchos modelos tradicionales se centran únicamente en cajas delimitadoras, YOLO11 admite de forma nativa detección de objetos, segmentación de instancias, clasificación de imágenes y estimación de poses. Esta capacidad multimodal permite a los desarrolladores consolidar sus flujos de trabajo de visión IA bajo un único marco de trabajo bien mantenido.

Link to this sectionDAMO-YOLO#

DAMO-YOLO fue desarrollado por investigadores de Alibaba Group. Aprovecha la Búsqueda de Arquitectura Neuronal (NAS) para descubrir backbones altamente eficientes adaptados para la inferencia en tiempo real en GPUs y otros aceleradores.

Más información sobre DAMO-YOLO

La filosofía central de DAMO-YOLO gira en torno a la rep-parameterization y la búsqueda automatizada. Mediante el uso de MAE-NAS (Multi-Objective Evolutionary Neural Architecture Search), los autores diseñaron un backbone personalizado que aumenta significativamente la velocidad de inferencia en hardware especializado. También incorpora una neck altamente optimizada llamada Efficient RepGFPN y una estructura ZeroHead simplificada para minimizar la latencia.

Otros modelos a considerar

Al comparar YOLO11 y DAMO-YOLO, considera echar un vistazo al nuevo Ultralytics YOLO26. Introduce inferencia end-to-end sin NMS de forma nativa y ofrece velocidades en CPU hasta un 43% más rápidas. También puedes explorar comparaciones que incluyan YOLOX o YOLOv8.

Link to this sectionComparación de rendimiento y arquitectura#

Comprender las compensaciones de rendimiento es vital al desplegar aplicaciones de IA en el borde. La siguiente tabla describe métricas clave como la precisión media (mAP), la latencia y el tamaño computacional.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Link to this sectionAnálisis arquitectónico en profundidad#

YOLO11 se basa en un backbone altamente eficiente y diseñado a medida que equilibra perfectamente el número de parámetros y la capacidad de representación. Está optimizado para funcionar magníficamente en una variedad de hardware, destacando de forma nativa con un uso mínimo de memoria CUDA tanto durante el entrenamiento como en la inferencia. Esto lo convierte en una opción excelente para hardware de consumo estándar o dispositivos IoT con recursos limitados.

Por el contrario, los backbones de DAMO-YOLO generados mediante MAE-NAS están ajustados para entornos de GPU de alto rendimiento. Su Efficient RepGFPN (Generalized Feature Pyramid Network) integra múltiples escalas de manera agresiva. Sin embargo, aunque la rep-parameterization acelera la inferencia, puede complicar el proceso de despliegue si tu stack de hardware no admite explícitamente estas operaciones de forma eficiente.

Link to this sectionUsabilidad y eficiencia de entrenamiento#

Al tener en cuenta el tiempo de desarrollo, la facilidad de uso de un modelo resulta tan importante como sus benchmarks brutos.

YOLO11 está construido sobre el principio de accesibilidad para el desarrollador. El paquete integral ultralytics abstrae el trabajo pesado del análisis de datasets, la aumentación y el ajuste de hiperparámetros. Exportar modelos a formatos de producción como ONNX, TensorRT y OpenVINO requiere solo un comando.

from ultralytics import YOLO

# Initialize YOLO11 object detection model
model = YOLO("yolo11s.pt")

# Train the model with mixed precision on COCO8
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to TensorRT for edge deployment
model.export(format="engine", device=0)

DAMO-YOLO, originado en un entorno académico y de investigación, presenta una curva de aprendizaje más pronunciada. Alcanzar su máxima precisión a menudo implica complejos pipelines de destilación de conocimiento, lo que significa que primero debes entrenar una red "maestra" masiva antes de pasar ese conocimiento a una red "estudiante" más pequeña. Esto aumenta drásticamente la sobrecarga de cómputo de GPU requerida y la duración total del entrenamiento en comparación con los bucles de entrenamiento ágiles de los modelos de Ultralytics.

Link to this sectionCasos de uso y recomendaciones#

Elegir entre YOLO11 y DAMO-YOLO depende de los requisitos específicos de tu proyecto, las limitaciones de despliegue y tus preferencias de ecosistema.

Link to this sectionCuándo elegir YOLO11#

YOLO11 es una gran opción para:

  • Implementación en producción en el borde: Aplicaciones comerciales en dispositivos como Raspberry Pi o NVIDIA Jetson donde la fiabilidad y el mantenimiento activo son primordiales.
  • Aplicaciones de visión multitarea: Proyectos que requieren detección, segmentación, estimación de pose y OBB dentro de un único marco unificado.
  • Creación rápida de prototipos e implementación: Equipos que necesitan pasar rápidamente de la recopilación de datos a la producción utilizando la API de Python de Ultralytics optimizada.

Link to this sectionCuándo elegir DAMO-YOLO#

DAMO-YOLO se recomienda para:

  • Analítica de vídeo de alto rendimiento: Procesamiento de flujos de vídeo de altos FPS en infraestructura de GPU NVIDIA fija, donde el rendimiento por lote (batch-1) es la métrica principal.
  • Líneas de fabricación industrial: Escenarios con restricciones estrictas de latencia de GPU en hardware dedicado, como la inspección de calidad en tiempo real en líneas de montaje.
  • Investigación en búsqueda de arquitectura neuronal: Estudio de los efectos de la búsqueda automatizada de arquitectura (MAE-NAS) y backbones reparametrizados eficientes en el rendimiento de detección.

Link to this sectionCuándo elegir Ultralytics (YOLO26)#

Para la mayoría de los proyectos nuevos, Ultralytics YOLO26 ofrece la mejor combinación de rendimiento y experiencia de desarrollo:

  • Implementación en el borde sin NMS: Aplicaciones que requieren una inferencia consistente y de baja latencia sin la complejidad del posprocesamiento de supresión de no máximos.
  • Entornos solo de CPU: Dispositivos sin aceleración de GPU dedicada, donde la inferencia en CPU hasta un 43% más rápida de YOLO26 proporciona una ventaja decisiva.
  • Detección de objetos pequeños: Escenarios desafiantes como imágenes de drones aéreos o análisis de sensores IoT donde ProgLoss y STAL aumentan significativamente la precisión en objetos pequeños.

Link to this sectionAplicaciones y casos de uso en el mundo real#

Link to this sectionSistemas autónomos y drones#

Para imágenes aéreas y despliegues con UAV, YOLO11 ofrece un equilibrio de rendimiento increíblemente favorable. La detección de objetos pequeños es un obstáculo importante en el análisis mediante drones, pero YOLO11 maneja diversas escalas de forma nativa. Además, los bajos requisitos de memoria permiten que las variantes Nano y Small de YOLO11 se ejecuten directamente en CPUs de borde ligeras o NPUs integradas en el dron.

Link to this sectionAutomatización industrial y control de calidad#

En fábricas inteligentes, la latencia es fundamental. Aunque DAMO-YOLO ofrece velocidades de inferencia sólidas en GPUs de servidor potentes debido a su neck RepGFPN, la rigidez de su integración puede ser excesiva. YOLO11 suele actuar como una alternativa superior para el control de calidad automatizado debido a sus sencillas APIs de seguimiento y la capacidad de pivotar sin problemas desde la detección pura a tareas de cajas delimitadoras orientadas (OBB) si los defectos requieren un reconocimiento de límites en ángulo.

Link to this sectionSalud inteligente e imágenes médicas#

Los datasets de imágenes médicas suelen ser relativamente pequeños y evitar el sobreajuste es un desafío. Las técnicas de aumentación activas, combinadas con los pipelines estándar de aprendizaje por transferencia proporcionados por el ecosistema bien mantenido de Ultralytics, ayudan a clínicos y desarrolladores a desplegar modelos precisos de detección de tumores de manera fiable. El amplio apoyo de la comunidad garantiza que los problemas en ámbitos complejos como la salud se resuelvan rápidamente.

Abrazando el futuro con YOLO26

Si estás construyendo una nueva aplicación desde cero, considera explorar YOLO26. Lanzado a principios de 2026, utiliza un optimizador MuSGD y funciones ProgLoss, ofreciendo una precisión excepcional en objetos diminutos y proporcionando un pipeline end-to-end sin NMS desde el primer momento.

En última instancia, mientras que DAMO-YOLO sigue siendo una potente demostración de la Búsqueda de Arquitectura Neuronal, YOLO11 y la familia extendida de Ultralytics siguen siendo la recomendación definitiva para tareas de visión artificial en el mundo real, dando prioridad al despliegue rápido, la facilidad para el desarrollador y un rendimiento multimodal de primer nivel.

Comentarios