Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ frente a YOLOv6-3.0#

El campo de la visión artificial en tiempo real se ha expandido rápidamente, dando lugar a arquitecturas altamente especializadas y optimizadas para diversos escenarios de despliegue. Los desarrolladores comparan frecuentemente PP-YOLOE+ y YOLOv6-3.0 al crear aplicaciones que requieren un equilibrio entre un alto rendimiento y una precisión fiable. Ambos modelos aportaron mejoras arquitectónicas sustanciales tras sus lanzamientos, centrándose en mejorar la velocidad de inferencia para aplicaciones industriales y de borde.

Antes de profundizar en los desglose arquitectónicos detallados, explora el gráfico siguiente para visualizar cómo funcionan estos modelos en relación el uno con el otro en términos de velocidad y precisión.

Link to this sectionPP-YOLOE+: Puntos fuertes y débiles de la arquitectura#

Desarrollado por los autores de PaddlePaddle, PP-YOLOE+ es un destacado detector sin anclas que se basa en sus predecesores para ofrecer un rendimiento sólido en diversos requisitos de escala.

Link to this sectionAspectos destacados de la arquitectura#

PP-YOLOE+ introdujo varias mejoras críticas sobre el diseño original de PP-YOLOE. Aprovecha una potente arquitectura de fondo CSPRepResNet, que equilibra eficientemente el coste computacional con las capacidades de extracción de características. Además, incorpora una avanzada red de pirámide de características (FPN) combinada con una red de agregación de rutas (PAN) para asegurar la fusión de características multiescala. Una de sus características más destacadas es el ET-head (Efficient Task-aligned head), que mejora significativamente la coordinación de clasificación y localización durante la detección de objetos.

Aunque PP-YOLOE+ alcanza una precisión media (mAP) impresionante, su dependencia del ecosistema PaddlePaddle puede presentar a veces una curva de aprendizaje pronunciada para los investigadores acostumbrados a los flujos de trabajo nativos de PyTorch. Esto puede complicar ligeramente el proceso de despliegue del modelo cuando se apunta a dispositivos de borde heterogéneos que carecen de soporte directo para la inferencia de Paddle.

Contexto de despliegue

PP-YOLOE+ está altamente optimizado para su despliegue dentro del stack tecnológico de Baidu, lo que lo convierte en una excelente elección si tu entorno de producción depende en gran medida de las herramientas de inferencia de Paddle.

Aprende más sobre PP-YOLOE+

Link to this sectionYOLOv6-3.0: Rendimiento industrial#

Lanzado por el Departamento de IA de Visión de Meituan, YOLOv6-3.0 fue diseñado explícitamente para servir como un detector de objetos de próxima generación para aplicaciones industriales, priorizando un rendimiento masivo en hardware GPU.

Link to this sectionAspectos destacados de la arquitectura#

YOLOv6-3.0 cuenta con una arquitectura de fondo EfficientRep adaptada específicamente para maximizar la utilización del hardware, particularmente en GPUs NVIDIA usando TensorRT. La actualización v3.0 incorporó un módulo de concatenación bidireccional (BiC) en el cuello, mejorando la retención de características espaciales sin aumentar severamente el número de parámetros. Además, introdujo una estrategia de entrenamiento asistido por anclas (AAT) que fusiona los beneficios de la estabilidad basada en anclas durante el entrenamiento del modelo mientras mantiene una arquitectura rápida y sin anclas durante la inferencia en tiempo real.

Sin embargo, debido a que YOLOv6-3.0 está altamente optimizado para GPUs de grado servidor, sus ganancias de latencia disminuyen a veces cuando se despliega en dispositivos de borde muy limitados que solo usan CPU. Esta especialización significa que destaca en entornos como el análisis de vídeo offline, pero puede quedarse atrás frente a modelos optimizados dinámicamente en hardware más pequeño y localizado.

Más información sobre YOLOv6

Link to this sectionTabla de comparación de rendimiento#

La siguiente tabla destaca las métricas de rendimiento clave, comparando directamente las diferentes variantes de escala de ambas arquitecturas.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

Link to this sectionCasos de uso y recomendaciones#

Elegir entre PP-YOLOE+ y YOLOv6 depende de los requisitos específicos de tu proyecto, las restricciones de despliegue y tus preferencias de ecosistema.

Link to this sectionCuándo elegir PP-YOLOE+#

PP-YOLOE+ es una buena elección para:

  • Integración con el ecosistema PaddlePaddle: Organizaciones con infraestructura existente construida sobre el marco de trabajo PaddlePaddle de Baidu.
  • Despliegue en el borde con Paddle Lite: Desplegar en hardware con kernels de inferencia altamente optimizados específicamente para el motor de inferencia Paddle Lite o Paddle.
  • Detección de alta precisión en el lado del servidor: Escenarios que priorizan la máxima precisión de detección en potentes servidores GPU donde la dependencia del marco de trabajo no es una preocupación.

Link to this sectionCuándo elegir YOLOv6#

YOLOv6 se recomienda para:

  • Despliegue consciente del hardware industrial: Escenarios donde el diseño del modelo consciente del hardware y la reparametrización eficiente proporcionan un rendimiento optimizado en hardware de destino específico.
  • Detección rápida en una sola etapa: Aplicaciones que priorizan la velocidad de inferencia bruta en GPU para el procesamiento de vídeo en tiempo real en entornos controlados.
  • Integración con el ecosistema Meituan: Equipos que ya trabajan dentro de la pila tecnológica y la infraestructura de despliegue de Meituan.

Link to this sectionCuándo elegir Ultralytics (YOLO26)#

Para la mayoría de los proyectos nuevos, Ultralytics YOLO26 ofrece la mejor combinación de rendimiento y experiencia de desarrollo:

  • Implementación en el borde sin NMS: Aplicaciones que requieren una inferencia consistente y de baja latencia sin la complejidad del posprocesamiento de supresión de no máximos.
  • Entornos solo de CPU: Dispositivos sin aceleración de GPU dedicada, donde la inferencia en CPU hasta un 43% más rápida de YOLO26 proporciona una ventaja decisiva.
  • Detección de objetos pequeños: Escenarios desafiantes como imágenes de drones aéreos o análisis de sensores IoT donde ProgLoss y STAL aumentan significativamente la precisión en objetos pequeños.

Link to this sectionLa ventaja de Ultralytics: avanzar más allá de los modelos tradicionales#

Aunque PP-YOLOE+ y YOLOv6-3.0 ofrecen soluciones dirigidas, el desarrollo moderno de IA requiere flujos de trabajo versátiles y eficientes en memoria. Aquí es donde la Plataforma Ultralytics proporciona una experiencia de desarrollador inigualable. Con una API de Python unificada, puedes entrenar, validar y desplegar modelos de vanguardia sin problemas, sin la inmensa carga de configuración que suele encontrarse en repositorios de investigación más antiguos.

Los modelos de Ultralytics soportan de forma nativa una amplia gama de tareas de visión más allá de la detección estándar, incluyendo segmentación de instancias, estimación de poses, clasificación de imágenes y extracción de cajas delimitadoras orientadas (OBB). Además, están altamente optimizados para un menor uso de memoria durante el entrenamiento, un marcado contraste con los modelos basados en Transformer como RT-DETR, que generalmente requieren asignaciones masivas de VRAM en la GPU.

Link to this sectionDescubre YOLO26: El nuevo estándar#

Para las organizaciones que buscan desplegar los modelos de visión de vanguardia definitivos, Ultralytics YOLO26 (lanzado en enero de 2026) redefine los límites del rendimiento. Supera significativamente a las generaciones anteriores con varias innovaciones críticas:

  • Diseño de extremo a extremo sin NMS: Basándose en conceptos de YOLOv10, YOLO26 elimina completamente el post-procesamiento de Supresión de No Máximos (NMS). Este enfoque nativo de extremo a extremo garantiza una inferencia predecible y de latencia ultra baja, crucial para los sistemas de seguridad en tiempo real.
  • Hasta un 43% más rápido en inferencia CPU: Mediante la eliminación de la pérdida focal de distribución (DFL) de la arquitectura, YOLO26 está radicalmente optimizado para la computación de borde y entornos que carecen de aceleración GPU dedicada.
  • Optimizador MuSGD: Integrando la estabilidad de entrenamiento de los LLM en modelos de visión, este optimizador híbrido (inspirado en Moonshot AI) permite una convergencia rápida y sesiones de entrenamiento personalizado altamente estables.
  • ProgLoss + STAL: Estas formulaciones de pérdida avanzadas ofrecen mejoras notables en el reconocimiento de objetos pequeños, vital para aplicaciones como imágenes de drones aéreos y análisis de escenas concurridas.
Prepara tus pipelines para el futuro

Si estás construyendo un nuevo proyecto hoy, recomendamos encarecidamente evitar las arquitecturas heredadas y adoptar YOLO26. Su eficiencia de memoria y su velocidad sin NMS hacen que sea significativamente más fácil de llevar a producción.

Link to this sectionImplementación fluida#

Entrenar y exportar modelos de última generación usando el paquete de Python de Ultralytics es notablemente sencillo. El siguiente ejemplo demuestra cómo entrenar el último modelo YOLO26 y exportarlo a ONNX para un despliegue rápido en el borde:

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a test image (NMS-free speed)
predict_results = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for edge deployment
model.export(format="onnx")

Para los equipos profundamente integrados en flujos de trabajo más antiguos pero que buscan una estabilidad moderna, explorar Ultralytics YOLO11 es también un excelente paso de transición, ofreciendo una versatilidad completa de tareas respaldada por todo el ecosistema de Ultralytics.

Colaboradores

Comentarios