Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ frente a YOLOv7#

Al crear pipelines de visión artificial, elegir el modelo de detección de objetos adecuado es fundamental. Dos arquitecturas importantes de 2022, PP-YOLOE+ y YOLOv7, introdujeron avances potentes en la detección de objetos en tiempo real. Esta comparativa técnica ofrece una visión detallada de sus arquitecturas, metodologías de entrenamiento y rendimiento en el mundo real para ayudarte a tomar decisiones informadas para tus aplicaciones.

Link to this sectionVisión general de los modelos#

Tanto PP-YOLOE+ como YOLOv7 fueron diseñados para ampliar los límites de la precisión y la velocidad, pero provienen de ecosistemas de desarrollo y filosofías de diseño diferentes.

Link to this sectionPP-YOLOE+#

Desarrollado por los autores de PaddlePaddle en Baidu, PP-YOLOE+ se basa en el PP-YOLOv2 original. Se introdujo para proporcionar un detector de objetos eficiente y de gran precisión optimizado para el ecosistema PaddlePaddle.

Aprende más sobre PP-YOLOE+

Link to this sectionYOLOv7#

Desarrollado por Chien-Yao Wang, Alexey Bochkovskiy y Hong-Yuan Mark Liao, YOLOv7 introdujo la "caja de herramientas de entrenamiento" (trainable bag-of-freebies) para establecer nuevos puntos de referencia de vanguardia para detectores de objetos en tiempo real en el momento de su lanzamiento.

Más información sobre YOLOv7

Link to this sectionInnovaciones arquitectónicas#

Link to this sectionArquitectura de PP-YOLOE+#

PP-YOLOE+ depende en gran medida de un paradigma sin anclas (anchor-free), lo que simplifica el proceso de despliegue al eliminar la necesidad de ajustar anchor boxes para conjuntos de datos personalizados. Incorpora una potente backbone RepResNet y una PAN (Path Aggregation Network) al estilo CSPNet para una fusión eficaz de características a múltiples escalas. Además, aprovecha el concepto de Task Alignment Learning (TAL) para alinear las tareas de clasificación y localización dinámicamente durante el entrenamiento, garantizando una alta precisión en diversas tareas de visión artificial.

Link to this sectionArquitectura de YOLOv7#

YOLOv7 adoptó un enfoque diferente mediante la introducción de la red de agregación de capas eficientes extendida (E-ELAN). Esta arquitectura permite a la red aprender características más diversas sin destruir la ruta de gradiente original, lo que conduce a una mejor convergencia. YOLOv7 también utiliza intensivamente la re-parametrización de modelos (específicamente, convoluciones re-parametrizadas planificadas), que fusiona capas convolucionales durante la inferencia para acelerar la ejecución sin sacrificar la precisión. Esto hace que YOLOv7 sea excepcionalmente fuerte en tareas como el seguimiento de múltiples objetos y sistemas de alarma de seguridad complejos.

Diferencias de ecosistema

Mientras que PP-YOLOE+ está estrechamente integrado con el framework PaddlePaddle de Baidu, YOLOv7 se creó en PyTorch, que históricamente ofrece una comunidad más grande y una compatibilidad inmediata más amplia con pipelines de despliegue como ONNX y TensorRT.

Link to this sectionAnálisis de rendimiento#

Al equilibrar velocidad, parámetros y precisión (mAP), los modelos alternan ventajas según la variante específica y el hardware de destino. A continuación, se presenta una comparativa completa de sus métricas.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Aunque el modelo PP-YOLOE+x logra un mAP ligeramente superior, las variantes de YOLOv7 ofrecen una relación parámetros-precisión muy sólida. La arquitectura de YOLOv7 sigue siendo una de las preferidas para el procesamiento GPU puro, donde la optimización de TensorRT proporciona una latencia excepcionalmente baja.

Link to this sectionLa ventaja de Ultralytics#

Al entrenar y desplegar estos modelos, el framework que eliges es tan importante como el propio modelo. Utilizar Ultralytics proporciona una experiencia de usuario optimizada gracias a una API de Python altamente unificada que simplifica todo el ciclo de vida del aprendizaje automático.

  • Ecosistema bien mantenido: Los modelos YOLO de Ultralytics se benefician de un ecosistema actualizado continuamente, documentación sólida y una comunidad activa.
  • Requisitos de memoria: Ultralytics optimiza significativamente la carga de datos y los regímenes de entrenamiento. Entrenar modelos YOLO de Ultralytics normalmente requiere mucha menos memoria CUDA en comparación con arquitecturas pesadas basadas en Transformer, lo que permite a los desarrolladores utilizar tamaños de lote más grandes en hardware de consumo.
  • Eficiencia de entrenamiento: Aprovechando sólidas estrategias de aumento de datos y el ajuste de hiperparámetros integrado, Ultralytics garantiza que los modelos converjan rápidamente con pesos pre-entrenados fácilmente disponibles.

Link to this sectionImplementación sencilla de la API#

Entrenar un modelo YOLOv7 con Ultralytics requiere solo unas pocas líneas de código, abstraendo completamente los complejos scripts de entrenamiento:

from ultralytics import YOLO

# Load a pretrained YOLOv7 model
model = YOLO("yolov7.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to TensorRT for deployment
model.export(format="engine", device=0)

Link to this sectionEl nuevo estándar: Presentación de YOLO26#

Aunque PP-YOLOE+ y YOLOv7 son hitos en la detección de objetos, el panorama de la IA evoluciona rápidamente. Para cualquier nuevo proyecto de visión artificial, recomendamos encarecidamente Ultralytics YOLO26. Lanzado en enero de 2026, YOLO26 representa un salto masivo en la visión artificial centrada en el edge.

Por qué YOLO26 supera a las arquitecturas más antiguas:

  • Diseño integral sin NMS: YOLO26 es nativamente de extremo a extremo. Al eliminar el post-procesamiento de supresión de no máximos (NMS), garantiza una latencia de inferencia predecible y determinista: un avance visto por primera vez en YOLOv10.
  • Eliminación de DFL: La eliminación de Distribution Focal Loss simplifica el proceso de exportación y mejora significativamente la compatibilidad para dispositivos edge de bajo consumo.
  • Inferencia en CPU hasta un 43% más rápida: Para escenarios que carecen de GPUs dedicadas (como sensores IoT de ciudades inteligentes), YOLO26 está altamente optimizado para ejecutarse de manera eficiente directamente en CPUs.
  • Optimizador MuSGD: Inspirado en técnicas avanzadas de entrenamiento de LLM (como Kimi K2 de Moonshot AI), YOLO26 utiliza un híbrido de SGD y Muon para un entrenamiento increíblemente estable y una convergencia rápida.
  • ProgLoss + STAL: Estas funciones de pérdida mejoradas aportan ganancias notables en la detección de objetos pequeños, algo vital para casos de uso como imágenes aéreas de drones y detección de defectos en fabricación.

Más información sobre YOLO26

Link to this sectionCasos de uso ideales y escenarios de despliegue#

Link to this sectionCuándo usar PP-YOLOE+#

PP-YOLOE+ destaca cuando estás profundamente arraigado en el ecosistema de Baidu y PaddlePaddle. Si tu objetivo de despliegue utiliza hardware especializado adaptado para modelos Paddle (por ejemplo, en ciertos pipelines de fabricación asiáticos), PP-YOLOE+ ofrece una excelente precisión e integración sin problemas. Es altamente eficaz para la automatización de la fabricación industrial.

Link to this sectionCuándo usar YOLOv7#

YOLOv7 sigue siendo una excelente opción para inferencia genérica de alto rendimiento, particularmente cuando se despliega en hardware NVIDIA utilizando TensorRT. Su integración en el ecosistema de PyTorch lo hace altamente versátil para la investigación académica y pipelines comerciales personalizados, tales como gestión de multitudes en tiempo real o tareas complejas de estimación de pose donde la integridad estructural de la red es fundamental.

Link to this sectionOtros modelos a considerar#

Dependiendo de tus necesidades exactas, también podrías estar interesado en comparar estas arquitecturas con YOLO11 para una flexibilidad amplia y lista para producción, o RT-DETR si tu proyecto requiere las ventajas específicas de los vision transformers sobre las redes convolucionales tradicionales.

Link to this sectionConclusión#

Tanto PP-YOLOE+ como YOLOv7 aportaron mejoras significativas al mundo de la detección de objetos en tiempo real. Aunque PP-YOLOE+ sobresale en entornos estandarizados en torno a PaddlePaddle, YOLOv7 ofrece una flexibilidad y un rendimiento increíbles a través de los ecosistemas PyTorch y Ultralytics.

Sin embargo, a medida que las soluciones de visión artificial continúan avanzando, utilizar herramientas modernas es esencial. Al adoptar Ultralytics Platform y arquitecturas de próxima generación como YOLO26, los desarrolladores pueden garantizar que sus aplicaciones permanezcan a la vanguardia de la velocidad, precisión y facilidad de uso.

Colaboradores

Comentarios