Meet YOLO26: next-gen vision AI.

Link to this sectionEfficientDet frente a YOLOv10: Análisis de la evolución de los modelos de detección de objetos#

En el campo en rápida evolución de la computer vision, elegir la arquitectura de detección de objetos adecuada es fundamental para equilibrar la precisión, la latencia y la eficiencia computacional. Esta guía técnica completa compara dos modelos muy influyentes: EfficientDet de Google y YOLOv10 de la Universidad de Tsinghua. Aunque ambos modelos representan saltos significativos en la detección de objetos, abordan el diseño arquitectónico y la model optimization desde ángulos muy diferentes.

Exploraremos sus arquitecturas principales, revisaremos los puntos de referencia de rendimiento en standard datasets like COCO y analizaremos cómo se integran en los flujos de trabajo modernos de machine learning, destacando específicamente las ventajas del completo Ultralytics ecosystem.

Link to this sectionEfficientDet: El pionero en escalado compuesto#

Presentado a finales de 2019, EfficientDet estableció un nuevo estándar para la detección de objetos escalable y de alta precisión mediante la introducción de un enfoque basado en principios para escalar las dimensiones de la red.

Link to this sectionInnovaciones clave y arquitectura#

EfficientDet se basa en la columna vertebral de EfficientNet, aprovechando una novedosa Red de Pirámide de Características Bidireccional (BiFPN). A diferencia de las Feature Pyramid Networks (FPN) tradicionales, que suman características sin distinguir su importancia, BiFPN emplea pesos aprendibles para fusionar características de múltiples escalas. Esto permite que la red aprenda eficazmente qué características de resolución contribuyen más a la predicción final. Además, EfficientDet utiliza un método de escalado compuesto que escala uniformemente la resolución, la profundidad y el ancho para la red troncal, la red de características y las redes de predicción de cajas/clases simultáneamente.

Aunque EfficientDet sigue siendo una opción sólida para sistemas heredados profundamente integrados con tuberías de TensorFlow más antiguas, conlleva considerables memory requirements durante el entrenamiento y depende de un ecosistema más antiguo que puede resultar engorroso en comparación con los marcos modernos y dinámicos.

Aprende más sobre EfficientDet

Link to this sectionYOLOv10: El innovador sin NMS#

Lanzado a mediados de 2024, YOLOv10 cambió fundamentalmente el paradigma de detección de objetos en tiempo real al eliminar la necesidad de la supresión no máxima (NMS) durante el posprocesamiento, reduciendo significativamente la inference latency.

Link to this sectionInnovaciones clave y arquitectura#

YOLOv10 introduce una estrategia consistente de doble asignación para el entrenamiento sin NMS. Al utilizar asignaciones de etiquetas de uno a muchos y de uno a uno durante el entrenamiento, la red aprende a producir cuadros delimitadores que coinciden de forma única sin depender de NMS para filtrar los duplicados. Este diseño de modelo holístico impulsado por la eficiencia y la precisión reduce la redundancia computacional, lo que lo convierte en un candidato excelente para edge computing y aplicaciones de transmisión de video de baja latencia. Se integra perfectamente en el ecosistema Ultralytics, brindando a los desarrolladores acceso a una API de Python extremadamente directa.

Aprende más sobre YOLOv10

Impacto sin NMS

Al eliminar el paso NMS, YOLOv10 garantiza velocidades de inferencia consistentes independientemente de cuántos objetos se detecten en una escena, eliminando los picos de latencia que a menudo se ven en aplicaciones abarrotadas de computer vision applications.

Link to this sectionComparativa de rendimiento: precisión, velocidad y eficiencia#

Al implementar modelos en escenarios del mundo real, los desarrolladores deben sopesar mean Average Precision (mAP) frente al número de parámetros y las operaciones computacionales (FLOPs). La tabla siguiente detalla estas métricas en todas las variantes de escala de ambos modelos.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Nota: La variante YOLOv10n requiere significativamente menos parámetros (2.3M) y alcanza velocidades TensorRT muy superiores (1.56ms) en comparación con las primeras iteraciones de EfficientDet, lo que la hace mucho más viable para real-time inference en producción.

Link to this section¿Por qué elegir Ultralytics para la implementación de modelos?#

Si bien ambos modelos tienen importancia histórica y estructural, integrarlos en tuberías modernas puede ser un desafío. Aquí es donde brilla Ultralytics Platform. Al proporcionar un ecosistema unificado, Ultralytics simplifica todo el ciclo de vida, desde la data annotation hasta la implementación.

  1. Facilidad de uso: El paquete Python de Ultralytics ofrece una única interfaz para model training, validation y exportación, reemplazando cientos de líneas de código repetitivo con comandos concisos.
  2. Ecosistema y versatilidad: Aunque EfficientDet está altamente especializado para la detección, los modelos YOLO de Ultralytics se extienden naturalmente a Instance Segmentation, Pose Estimation, Oriented Bounding Boxes (OBB) y clasificación.
  3. Eficiencia de entrenamiento: Aprovechando técnicas de vanguardia como el auto-batching y el entrenamiento distribuido, los modelos de Ultralytics se entrenan más rápido y consumen drásticamente menos memoria CUDA que las arquitecturas pesadas de transformer o las arquitecturas TF multirrama más antiguas.

Link to this sectionEjemplo de código: Entrenamiento de YOLOv10#

Implementar YOLOv10 con Ultralytics es increíblemente sencillo. El siguiente fragmento de código demuestra cómo inicializar, entrenar y evaluar una red YOLOv10 completamente dentro de la API de Python.

from ultralytics import YOLO

# Load a pre-trained YOLOv10 model (nano variant for edge speed)
model = YOLO("yolov10n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, batch=16)

# Evaluate the model on the validation set
metrics = model.val()

# Export the model to ONNX for production deployment
model.export(format="onnx")

Link to this sectionCasos de uso y recomendaciones#

Elegir entre EfficientDet y YOLOv10 depende de los requisitos específicos de tu proyecto, las limitaciones de implementación y tus preferencias de ecosistema.

Link to this sectionCuándo elegir EfficientDet#

EfficientDet es una gran opción para:

  • Google Cloud y pipelines de TPU: Sistemas profundamente integrados con las API de Google Cloud Vision o la infraestructura de TPU, donde EfficientDet cuenta con optimización nativa.
  • Investigación en escalado compuesto: Benchmarking académico centrado en el estudio de los efectos de un escalado equilibrado de profundidad, anchura y resolución de red.
  • Despliegue móvil mediante TFLite: Proyectos que requieren específicamente la exportación a TensorFlow Lite para dispositivos Android o Linux embebidos.

Link to this sectionCuándo elegir YOLOv10#

YOLOv10 está recomendado para:

  • Detección en tiempo real sin NMS: Aplicaciones que se benefician de una detección integral (end-to-end) sin NMS, lo que reduce la complejidad de la implementación.
  • Equilibrio entre velocidad y precisión: Proyectos que requieren un buen equilibrio entre la velocidad de inferencia y la precisión de detección en varias escalas de modelo.
  • Aplicaciones de latencia constante: Escenarios de despliegue donde los tiempos de inferencia predecibles son críticos, como en robótica o sistemas autónomos.

Link to this sectionCuándo elegir Ultralytics (YOLO26)#

Para la mayoría de los proyectos nuevos, Ultralytics YOLO26 ofrece la mejor combinación de rendimiento y experiencia de desarrollo:

  • Implementación en el borde sin NMS: Aplicaciones que requieren una inferencia consistente y de baja latencia sin la complejidad del posprocesamiento de supresión de no máximos.
  • Entornos solo de CPU: Dispositivos sin aceleración de GPU dedicada, donde la inferencia en CPU hasta un 43% más rápida de YOLO26 proporciona una ventaja decisiva.
  • Detección de objetos pequeños: Escenarios desafiantes como imágenes de drones aéreos o análisis de sensores IoT donde ProgLoss y STAL aumentan significativamente la precisión en objetos pequeños.

Link to this sectionEl futuro está aquí: llega Ultralytics YOLO26#

Aunque YOLOv10 introdujo el revolucionario diseño sin NMS, la tecnología ha evolucionado. Lanzado en enero de 2026, Ultralytics YOLO26 representa el estándar definitivo de vanguardia para la visión artificial. Unifica los mejores aspectos de arquitecturas anteriores, como las capacidades multitarea de YOLO11 y la estabilidad de RT-DETR, en una potencia singular y altamente optimizada.

La ventaja de YOLO26

Si vas a comenzar un nuevo proyecto, te recomendamos encarecidamente actualizar a YOLO26. Ofrece una flexibilidad y facilidad de uso inigualables a través de la Plataforma Ultralytics.

Avances clave en YOLO26:

  • Diseño integral sin NMS: Sobre la base establecida por YOLOv10, YOLO26 es nativamente integral, simplificando la lógica de implementación a los mínimos básicos.
  • Hasta un 43% más rápido en inferencia de CPU: Con la eliminación de Distribution Focal Loss (DFL), YOLO26 reduce drásticamente la carga computacional, convirtiéndose en el rey indiscutible para dispositivos de edge AI.
  • Optimizador MuSGD: YOLO26 toma innovaciones del entrenamiento de Modelos de Lenguaje Extensos (LLM). Al fusionar la estabilidad de SGD con la velocidad de Muon, converge más rápida y fiablemente que cualquier predecesor.
  • ProgLoss + STAL: Formulaciones de pérdida superiores resuelven eficazmente problemas persistentes en la detección de objetos pequeños, un área en la que EfficientDet tradicionalmente tenía dificultades.

Más información sobre YOLO26

Link to this sectionConclusión: Adaptar los modelos a los casos de uso#

La elección entre estas redes depende finalmente de tus limitaciones de despliegue:

  • EfficientDet sigue siendo un tema de interés académico respecto al escalado compuesto y es adecuado para investigadores que mantienen sistemas de TensorFlow existentes donde el tamaño del peso del modelo (en disco) es más crítico que la velocidad de ejecución.
  • YOLOv10 es fenomenal para aplicaciones que exigen una latencia ultrabaja, como el seguimiento de múltiples objetos a alta velocidad y el control de tráfico, debido a su arquitectura pionera sin NMS.
  • YOLO26, sin embargo, es la recomendación definitiva para los proyectos modernos de visión artificial, ya que ofrece el máximo Equilibrio de Rendimiento en precisión, mínima huella de memoria y versatilidad multitarea, respaldado por el sólido ecosistema Ultralytics.
Colaboradores

Comentarios