Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ frente a EfficientDet: una comparativa técnica exhaustiva#

Elegir la arquitectura adecuada es un paso crítico en la creación de aplicaciones robustas de computer vision. Esta guía técnica explora las diferencias entre dos modelos de detección de objetos bien conocidos: PP-YOLOE+ y EfficientDet. Analizaremos sus arquitecturas, evaluaremos sus métricas de rendimiento y exploraremos sus escenarios de despliegue ideales.

Aunque ambos modelos han realizado contribuciones significativas al campo, también veremos cómo las alternativas modernas como Ultralytics YOLO26 ofrecen una eficiencia de memoria muy superior, una inferencia más rápida y una experiencia de desarrollo altamente optimizada.

Link to this sectionDescripción general de la arquitectura: PP-YOLOE+#

PP-YOLOE+ es una versión evolucionada del PP-YOLO original, construida específicamente para optimizar el rendimiento en GPUs del lado del servidor dentro del ecosistema PaddlePaddle. Introduce varias mejoras en la arquitectura base, centrándose en un paradigma sin anclas (anchor-free).

Aprende más sobre PP-YOLOE+

PP-YOLOE+ cuenta con un backbone CSPRepResNet, una cabeza de tareas alineadas eficiente (ET-head), y se basa en gran medida en la pérdida varifocal para la clasificación junto con la pérdida focal de distribución para la regresión de cuadros delimitadores. Su transición a un diseño de detector sin anclas ayudó a optimizar el proceso de post-procesamiento, haciéndolo altamente competitivo en el momento de su lanzamiento.

Ventajas de integración

Los equipos que ya están profundamente involucrados en el marco PaddlePaddle de Baidu a menudo encuentran que PP-YOLOE+ es más fácil de adoptar para tareas como segmentación de instancias, aunque carece del amplio soporte multi-marco que se observa en herramientas más nuevas.

Link to this sectionDescripción general de la arquitectura: EfficientDet#

EfficientDet adopta un enfoque radicalmente diferente para la detección de objetos, basándose en gran medida en la búsqueda de arquitectura neuronal y principios de escalado compuesto.

Más información sobre EfficientDet

La piedra angular de EfficientDet es su red de pirámide de características bidireccional (BiFPN). A diferencia de las FPN tradicionales, BiFPN permite una fusión de características multiescala fácil y rápida al introducir pesos aprendibles para conocer la importancia de diferentes características de entrada. Junto con un backbone EfficientNet, EfficientDet escala sistemáticamente el ancho, la profundidad y la resolución de la red de forma simultánea.

Aunque teóricamente es muy eficiente en términos de FLOPs, los modelos EfficientDet a veces pueden tener dificultades para traducir la eficiencia teórica en velocidad real en dispositivos de borde debido a sus patrones complejos de acceso a memoria, lo que contrasta marcadamente con los requisitos de memoria más bajos de los modelos basados en YOLO.

Link to this sectionAnálisis de rendimiento y puntos de referencia#

La siguiente tabla contrasta métricas clave en datasets estándar como COCO. Comparar la precisión media (mAP) frente a la velocidad de inferencia ofrece una imagen clara de la frontera de Pareto.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Como se muestra, PP-YOLOE+ generalmente escala mejor en mAP bruto para GPUs de gama alta, mientras que EfficientDet intenta minimizar los parámetros. Sin embargo, ambos se quedan atrás frente a las capacidades modernas de tiempo real requeridas para la IA de borde de vanguardia.

Link to this sectionCasos de uso y recomendaciones#

Elegir entre PP-YOLOE+ y EfficientDet depende de los requisitos específicos de tu proyecto, las restricciones de despliegue y las preferencias de ecosistema.

Link to this sectionCuándo elegir PP-YOLOE+#

PP-YOLOE+ es una buena elección para:

  • Integración con el ecosistema PaddlePaddle: Organizaciones con infraestructura existente construida sobre el marco de trabajo PaddlePaddle de Baidu.
  • Despliegue en el borde con Paddle Lite: Desplegar en hardware con kernels de inferencia altamente optimizados específicamente para el motor de inferencia Paddle Lite o Paddle.
  • Detección de alta precisión en el lado del servidor: Escenarios que priorizan la máxima precisión de detección en potentes servidores GPU donde la dependencia del marco de trabajo no es una preocupación.

Link to this sectionCuándo elegir EfficientDet#

EfficientDet se recomienda para:

  • Google Cloud y pipelines de TPU: Sistemas profundamente integrados con las API de Google Cloud Vision o la infraestructura de TPU, donde EfficientDet cuenta con optimización nativa.
  • Investigación en escalado compuesto: Benchmarking académico centrado en el estudio de los efectos de un escalado equilibrado de profundidad, anchura y resolución de red.
  • Despliegue móvil mediante TFLite: Proyectos que requieren específicamente la exportación a TensorFlow Lite para dispositivos Android o Linux embebido.

Link to this sectionCuándo elegir Ultralytics (YOLO26)#

Para la mayoría de los proyectos nuevos, Ultralytics YOLO26 ofrece la mejor combinación de rendimiento y experiencia de desarrollo:

  • Implementación en el borde sin NMS: Aplicaciones que requieren una inferencia consistente y de baja latencia sin la complejidad del posprocesamiento de supresión de no máximos.
  • Entornos solo de CPU: Dispositivos sin aceleración de GPU dedicada, donde la inferencia en CPU hasta un 43% más rápida de YOLO26 proporciona una ventaja decisiva.
  • Detección de objetos pequeños: Escenarios desafiantes como imágenes de drones aéreos o análisis de sensores IoT donde ProgLoss y STAL aumentan significativamente la precisión en objetos pequeños.

Link to this sectionLa alternativa moderna: Ultralytics YOLO26#

Aunque PP-YOLOE+ y EfficientDet representan hitos históricos importantes, los desarrolladores que buscan precisión de vanguardia, menor consumo de memoria y una experiencia de usuario optimizada deberían considerar Ultralytics YOLO26.

YOLO26 representa un gran salto adelante en la detección de objetos, introduciendo varias innovaciones críticas:

  • Diseño integral sin NMS: Aprovechando los avances de YOLOv10, YOLO26 elimina de forma nativa la supresión no máxima (NMS) durante la inferencia. Esto resulta en una latencia significativamente menor y elimina los complejos cuellos de botella del post-procesamiento.
  • Optimizador MuSGD: Inspirado en innovaciones en el entrenamiento de LLMs, YOLO26 utiliza un optimizador híbrido SGD y Muon. Esto mejora drásticamente la estabilidad del entrenamiento y reduce el tiempo de convergencia.
  • Velocidad extrema: YOLO26 ofrece hasta un 43% más de velocidad en inferencia de CPU en comparación con generaciones anteriores como YOLO11, lo que la convierte en la opción absoluta para dispositivos de borde que funcionan con batería o solo con CPU.
  • Funciones de pérdida avanzadas: La integración de ProgLoss y STAL mejora enormemente el reconocimiento de objetos pequeños, lo cual es esencial para tareas como análisis con drones y robótica.
Versatilidad multitarea

A diferencia de EfficientDet, que se centra puramente en la detección, YOLO26 maneja de forma nativa estimación de poses, clasificación de imágenes y cuadros delimitadores orientados (OBB), todo dentro del mismo ecosistema bien mantenido.

Link to this sectionFacilidad de uso e integración en el ecosistema#

Uno de los mayores inconvenientes de los modelos heredados como EfficientDet es la complejidad de sus tuberías de entrenamiento y configuraciones de aprendizaje automático automatizado. Por el contrario, la Plataforma Ultralytics ofrece una experiencia de desarrollador inigualable.

Desplegar un modelo con Ultralytics toma solo unas pocas líneas de código, proporcionando un contraste marcado con las configuraciones prolijas requeridas por los marcos más antiguos.

from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100)

# Run inference on a test image natively without NMS overhead
predictions = model("https://ultralytics.com/images/bus.jpg")

Para aquellos que exploran otras alternativas, arquitecturas como RT-DETR o el legado YOLOv8 también están disponibles dentro del ecosistema de Ultralytics, permitiendo intercambios y pruebas sin problemas.

Link to this sectionConclusión#

PP-YOLOE+ sigue siendo una opción sólida para despliegues de servidor específicos dentro del ecosistema Paddle, y EfficientDet continúa siendo un estudio interesante en el diseño de arquitectura automatizada. Sin embargo, para aplicaciones modernas que exigen inferencia en tiempo real, facilidad de despliegue y requisitos mínimos de memoria, Ultralytics YOLO26 proporciona el equilibrio de rendimiento más convincente. Su diseño nativo sin NMS y su rendimiento de CPU ultrarrápido la convierten en la opción definitiva para preparar tu infraestructura de IA para el futuro.

Colaboradores

Comentarios