Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv8 vs YOLO11: una comparativa técnica exhaustiva de modelos de visión en tiempo real#

La rápida evolución de la visión por computador ha estado impulsada principalmente por los continuos avances en los marcos de trabajo de detección de objetos en tiempo real. Para los desarrolladores e investigadores que navegan por el panorama actual, elegir el modelo adecuado es fundamental para equilibrar la precisión, la velocidad y la eficiencia de los recursos. En esta comparativa técnica, exploraremos las diferencias entre dos modelos fundamentales del ecosistema Ultralytics: Ultralytics YOLOv8 y Ultralytics YOLO11.

Ambos modelos demuestran las características distintivas de las arquitecturas de Ultralytics: facilidad de uso, un ecosistema bien mantenido y una eficiencia de entrenamiento inigualable con bajos requisitos de memoria. Profundicemos en sus diseños arquitectónicos, benchmarks de rendimiento y escenarios de despliegue ideales.

Link to this sectionResumen de modelos#

Antes de comparar sus méritos técnicos específicos, es útil establecer los orígenes y las especificaciones principales de ambos modelos.

Link to this sectionUltralytics YOLOv8#

Lanzado como un gran avance a principios de 2023, YOLOv8 introdujo la detección sin anclas y mejoras significativas en las funciones de pérdida, convirtiéndose rápidamente en el estándar de oro para una amplia variedad de tareas de machine learning.

Más información sobre YOLOv8

Link to this sectionUltralytics YOLO11#

Basándose en el éxito de sus predecesores, YOLO11 refinó la arquitectura central para impulsar aún más la frontera de Pareto de precisión y latencia, introduciendo un recuento de parámetros altamente optimizado sin sacrificar potencia predictiva.

Más información sobre YOLO11

Otras arquitecturas

Si estás explorando enfoques alternativos, Ultralytics también admite modelos basados en Transformer como RT-DETR y detectores de vocabulario abierto zero-shot como YOLO-World. Sin embargo, para una latencia y eficiencia de memoria óptimas, las arquitecturas YOLO estándar suelen seguir siendo la opción preferida.

Link to this sectionDiferencias arquitectónicas y metodológicas#

El cambio de YOLOv8 a YOLO11 representa una evolución cuidadosa en el diseño de redes neuronales más que una revisión completa, lo que garantiza que el ecosistema bien mantenido en torno a los modelos permanezca estable.

Link to this sectionOptimizaciones de backbone y neck#

YOLOv8 introdujo un backbone CNN optimizado que se alejó de los anchor boxes tradicionales, tratando la detección de objetos puramente como un problema de predicción de puntos centrales. Este enfoque sin anclas redujo significativamente la complejidad de la regresión de bbox. YOLO11 tomó esta base e introdujo una red de pirámide de características (FPN) optimizada y modificó los bloques C2f en módulos C3k2. Esta modificación permite a YOLO11 extraer características espaciales más ricas, lo que se traduce en una mejor precisión en objetos más pequeños que normalmente se encuentran en el COCO dataset.

Link to this sectionRequisitos de memoria y eficiencia de entrenamiento#

Una de las ventajas más notables tanto de YOLOv8 como de YOLO11 son sus bajos requisitos de memoria durante el entrenamiento. A diferencia de los vision transformers pesados que pueden agotar fácilmente la VRAM en hardware de consumo, estos modelos están optimizados para un entrenamiento accesible en PyTorch en GPUs estándar. YOLO11 logra una reducción sustancial en el total de parámetros (hasta un 42 % menos de parámetros en la variante grande (L) en comparación con YOLOv8) mientras aumenta simultáneamente su mAP. Esto significa épocas más rápidas y una menor huella de carbono para el entrenamiento del modelo.

Link to this sectionMétricas de rendimiento#

Para evaluar realmente el equilibrio de rendimiento de estos modelos, debemos observar los benchmarks objetivos. La siguiente tabla compara YOLOv8 y YOLO11 en las variantes de escala estándar (de nano a extra-large).

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Como se ha demostrado, YOLO11 supera constantemente a YOLOv8 en precisión mientras utiliza menos parámetros y FLOPs. La velocidad de inferencia en CPU, medida con ONNX Runtime, destaca la eficiencia superior de YOLO11 para despliegues en el borde (edge). Al exportar a NVIDIA TensorRT, ambos modelos ofrecen latencias excepcionales inferiores a 15 ms, esenciales para el análisis de secuencias de vídeo en el mundo real.

Link to this sectionEcosistema y facilidad de uso#

Ambos modelos se benefician enormemente del paquete de Python unificado ultralytics. Esta facilidad de uso permite a los ingenieros alternar sin problemas entre YOLOv8 y YOLO11. El entrenamiento, la validación y la exportación se pueden lograr en solo unas pocas líneas de código.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model (you can simply swap to "yolov8n.pt")
model = YOLO("yolo11n.pt")

# Train the model efficiently on a local dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the optimized model to ONNX
model.export(format="onnx")

La integración perfecta se extiende a la Ultralytics Platform, que simplifica el entrenamiento basado en la nube, la supervisión de modelos y el despliegue sin requerir conocimientos avanzados de DevOps.

Link to this sectionVersatilidad y aplicaciones en el mundo real#

Un sello distintivo importante del framework de Ultralytics es su versatilidad inherente. Tanto YOLOv8 como YOLO11 admiten una amplia gama de tareas de visión por computador más allá de la detección de objetos estándar:

YOLOv8, al haber estado disponible durante más tiempo, cuenta con un enorme repositorio de tutoriales de la comunidad y despliegues empresariales altamente probados. Si estás integrando con pipelines heredados que esperan estrictamente las formas de tensor de YOLOv8, sigue siendo una opción muy fiable. Sin embargo, para nuevos proyectos que priorizan la máxima eficiencia (como el despliegue en dispositivos edge integrados como una Raspberry Pi), YOLO11 es el claro ganador operativo debido a su relación superior de velocidad por parámetro.

Link to this sectionCasos de uso y recomendaciones#

Elegir entre YOLOv8 y YOLO11 depende de los requisitos específicos de tu proyecto, las limitaciones de despliegue y las preferencias del ecosistema.

Link to this sectionCuándo elegir YOLOv8#

YOLOv8 es una opción sólida para:

  • Despliegue multitarea versátil: Proyectos que requieren un modelo probado para detection, segmentation, classification y pose estimation dentro del ecosistema de Ultralytics.
  • Sistemas de producción establecidos: Entornos de producción existentes ya construidos sobre la arquitectura de YOLOv8 con pipelines de despliegue estables y bien probados.
  • Amplio apoyo de la comunidad y del ecosistema: Aplicaciones que se benefician de los extensos tutoriales de YOLOv8, integraciones de terceros y recursos activos de la comunidad.

Link to this sectionCuándo elegir YOLO11#

YOLO11 se recomienda para:

  • Implementación en producción en el borde: Aplicaciones comerciales en dispositivos como Raspberry Pi o NVIDIA Jetson donde la fiabilidad y el mantenimiento activo son primordiales.
  • Aplicaciones de visión multitarea: Proyectos que requieren detección, segmentación, estimación de pose y OBB dentro de un único marco unificado.
  • Creación rápida de prototipos e implementación: Equipos que necesitan pasar rápidamente de la recopilación de datos a la producción utilizando la API de Python de Ultralytics optimizada.

Link to this sectionCuándo elegir Ultralytics (YOLO26)#

Para la mayoría de los proyectos nuevos, Ultralytics YOLO26 ofrece la mejor combinación de rendimiento y experiencia de desarrollo:

  • Implementación en el borde sin NMS: Aplicaciones que requieren una inferencia consistente y de baja latencia sin la complejidad del posprocesamiento de supresión de no máximos.
  • Entornos solo de CPU: Dispositivos sin aceleración de GPU dedicada, donde la inferencia en CPU hasta un 43% más rápida de YOLO26 proporciona una ventaja decisiva.
  • Detección de objetos pequeños: Escenarios desafiantes como imágenes de drones aéreos o análisis de sensores IoT donde ProgLoss y STAL aumentan significativamente la precisión en objetos pequeños.

Link to this sectionLa vanguardia: la ventaja de YOLO26#

Si bien YOLOv8 y YOLO11 son arquitecturas fenomenales, el panorama de la IA nunca deja de moverse. Para los desarrolladores que buscan lo último en tecnología en 2026, Ultralytics YOLO26 representa el siguiente gran salto hacia adelante.

YOLO26 reimagina fundamentalmente el pipeline de despliegue. Presenta un diseño end-to-end libre de NMS, un enfoque innovador pionero en YOLOv10, que elimina complejos pasos de postprocesamiento. Además, la eliminación de DFL (Distribution Focal Loss) simplifica enormemente la lógica de exportación y mejora la compatibilidad con dispositivos edge de baja potencia, lo que resulta en una inferencia en CPU hasta un 43 % más rápida en comparación con sus predecesores.

La estabilidad del entrenamiento y las velocidades de convergencia mejoran drásticamente con el nuevo optimizador MuSGD, un híbrido inspirado en técnicas de entrenamiento de LLM. Además, nuevas formulaciones de pérdida como ProgLoss + STAL mejoran significativamente el reconocimiento de objetos pequeños, un punto débil histórico para el IoT y la robótica. Con mejoras específicas de tareas como RLE para pose estimation y proto multi-escala para segmentación, YOLO26 no tiene rival.

Más información sobre YOLO26

Elegir el modelo adecuado

Comienza tu viaje con YOLOv8 si necesitas un amplio soporte comunitario heredado. Actualiza a YOLO11 para obtener un equilibrio altamente refinado de velocidad y parámetros reducidos. Da el salto a YOLO26 para obtener la arquitectura definitiva de futuro, optimizada para edge y libre de NMS.

Link to this sectionConclusión#

Elegir entre YOLOv8 y YOLO11 depende en última instancia del cronograma de tu proyecto y de las limitaciones de hardware. YOLOv8 es un titán de la industria probado en batalla que ofrece una estabilidad inigualable. Por el contrario, YOLO11 refina esa arquitectura, entregando un mayor mAP con menos parámetros, lo que lo hace increíblemente atractivo para aplicaciones edge con recursos limitados. Independientemente de tu elección, la API de Python de Ultralytics garantiza que tu flujo de trabajo de desarrollo siga siendo ágil, eficiente y totalmente compatible. Y cuando estés listo para traspasar los límites de lo posible en dispositivos edge, YOLO26 está listo y esperando.

Colaboradores

Comentarios