YOLOv10 EfficientDet: la evolución de la eficiencia en la detección de objetos
El panorama de la visión artificial se ha definido por la búsqueda del equilibrio, concretamente, la compensación entre la velocidad de inferencia y la precisión de detección. Esta comparación explora dos hitos importantes en esta historia: YOLOv10, el avance académico de la Universidad de Tsinghua que introdujo la detección NMS, y EfficientDet, la arquitectura pionera Google que defendió la eficiencia escalable.
Mientras que EfficientDet estableció nuevos estándares en 2019 con su método de escalado compuesto, YOLOv10 2024) representa un cambio de paradigma hacia la eliminación total de los cuellos de botella del posprocesamiento. Esta guía analiza sus arquitecturas, métricas de rendimiento y adecuación para las aplicaciones modernas de IA en el borde.
YOLOv10: El detector de tiempo real de extremo a extremo
Lanzado en mayo de 2024, YOLOv10 una ineficiencia que existía desde hacía tiempo en la YOLO : la dependencia de la supresión no máxima (NMS). Al eliminar este paso de posprocesamiento, YOLOv10 reduce YOLOv10 la latencia y simplifica los procesos de implementación.
YOLOv10 :
- Autores: Ao Wang, Hui Chen, Lihao Liu, et al.
- Organización:Universidad de Tsinghua
- Fecha: 2024-05-23
- Arxiv:Detección de objetos de extremo a extremo en tiempo real
- GitHub:THU-MIG/yolov10
Innovaciones arquitectónicas clave
La característica definitoria de YOLOv10 su estrategia de asignación dual coherente. Durante el entrenamiento, el modelo emplea un cabezal uno a muchos para obtener señales de supervisión enriquecidas y un cabezal uno a uno para aprender predicciones únicas óptimas. Esto permite al modelo predecir cuadros delimitadores exactos sin necesidad NMS filtre los duplicados durante la inferencia.
Además, YOLOv10 un diseño holístico de eficiencia y precisión, optimizando los componentes backbone y neck para reducir la redundancia computacional. El resultado es un modelo que no solo es más rápido, sino también más eficiente en cuanto a parámetros que sus predecesores.
EfficientDet: escalable y robusto
Desarrollado por Google a finales de 2019, EfficientDet se diseñó para ampliar los límites de la eficiencia utilizando una filosofía diferente: el escalado compuesto. Escala sistemáticamente la resolución, la profundidad y la anchura de la red para lograr un mejor rendimiento en una amplia gama de limitaciones de recursos.
Detalles de EfficientDet:
- Autores: Mingxing Tan, Ruoming Pang, y Quoc V. Le
- Organización:Google Research
- Fecha: 2019-11-20
- Arxiv:EfficientDet: Scalable and Efficient Object Detection
- GitHub:google/automl
La ventaja de BiFPN
EfficientDet utiliza una estructura EfficientNet junto con una red piramidal de características bidireccionales ponderadas (BiFPN). A diferencia de las FPN estándar, que suman características sin distinción, BiFPN asigna pesos a las características de entrada, lo que permite a la red aprender la importancia de las diferentes escalas de entrada. Aunque es muy precisa, esta arquitectura implica conexiones entre escalas complejas que pueden resultar computacionalmente costosas en hardware que no está optimizado para patrones de acceso a la memoria irregulares.
Comparación del rendimiento técnico
La siguiente tabla ofrece una comparación directa de las métricas. Obsérvese la diferencia significativa en las velocidades de inferencia, especialmente porque YOLOv10 de la eliminación de NMS .
| Modelo | tamaño (píxeles) | mAPval 50-95 | Velocidad CPU ONNX (ms) | Velocidad T4 TensorRT10 (ms) | parámetros (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Análisis Crítico
- Latencia frente a precisión: YOLOv10x alcanza un mAP precisión media) superior del 54,4 % con una TensorRT de solo 12,2 ms. Por el contrario, EfficientDet-d7 alcanza un mAP comparable del 53,7 %, mAP requiere aproximadamente 128 ms, más de 10 veces más lento. Esto pone de relieve el salto generacional en la optimización en tiempo real.
- Implementación en el borde: El diseño NMS de YOLOv10 un cambio revolucionario para la implementación de modelos. NMS suele NMS una operación difícil de acelerar en las NPU (unidades de procesamiento neuronal) o en los chips integrados. Al eliminarlo, todo el modelo se ejecuta como un único gráfico, lo que mejora drásticamente la compatibilidad con herramientas como OpenVINO y TensorRT.
- Eficiencia de entrenamiento: EfficientDet se basa en el TensorFlow y en complejas estrategias de búsqueda AutoML.YOLO Ultralytics , incluidos YOLOv10 el más reciente YOLO26, se basan en PyTorch cuentan con procesos de entrenamiento optimizados que gestionan automáticamente los hiperparámetros, lo que se traduce en una convergencia más rápida y menores requisitos de memoria.
La ventaja del ecosistema de Ultralytics
La elección de un modelo rara vez se basa únicamente en la arquitectura, sino que tiene que ver con el flujo de trabajo. Ultralytics ofrecen una experiencia fluida para los desarrolladores.
- Facilidad de uso: con elPython Ultralytics , puede cargar, entrenar e implementar modelos en tres líneas de código. Las implementaciones de EfficientDet suelen requerir una gestión compleja de las dependencias y TensorFlow heredadas TensorFlow .
- Versatilidad: aunque EfficientDet es principalmente un detector de objetos, el Ultralytics admite un conjunto completo de tareas, entre las que se incluyen la segmentación de instancias, la estimación de poses y la detección de OBB (Oriented Bounding Box).
- Ecosistema bien mantenido: Ultralytics actualizaciones frecuentes, lo que garantiza la compatibilidad con las últimas bibliotecas de hardware y software. La integración con la Ultralytics permite una fácil gestión de los conjuntos de datos y la formación en la nube.
Entrenamiento Optimizado
Ultralytics automáticamente aumentos de datos complejos y la programación de la tasa de aprendizaje. No es necesario ajustar manualmente los anclajes ni los pesos de pérdida para obtener resultados de vanguardia.
Ejemplo de código: Entrenamiento con Ultralytics
El siguiente código muestra lo sencillo que es entrenar un modelo utilizando la Ultralytics . Funciona de forma idéntica para YOLOv10, YOLO11 y el recomendado YOLO26.
from ultralytics import YOLO
# Load the latest recommended model (YOLO26)
model = YOLO("yolo26n.pt")
# Train on a custom dataset
# Ultralytics automatically handles device selection (CPU/GPU)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate performance
metrics = model.val()
print(f"mAP50-95: {metrics.box.map}")
Por qué recomendamos YOLO26
Mientras que YOLOv10 el concepto NMS, Ultralytics lo perfecciona y mejora. Lanzado en enero de 2026, YOLO26 es lo último en tecnología de IA de vanguardia y sistemas de producción.
YOLO26 adopta el diseño integral NMS (sistema de gestión de red) introducido por YOLOv10 lo mejora con varias innovaciones fundamentales:
- Optimizador MuSGD: Inspirado en el entrenamiento LLM (concretamente en Kimi K2 de Moonshot AI), YOLO26 utiliza una combinación de SGD el optimizador Muon. Esto da como resultado una dinámica de entrenamiento significativamente más estable y una convergencia más rápida que las generaciones anteriores.
- Eliminación de DFL: al eliminar la pérdida focal de distribución (DFL), YOLO26 simplifica la estructura de la capa de salida. Esto hace que la exportación a formatos como CoreML ONNX sea ONNX limpia, lo que garantiza una mejor compatibilidad con dispositivos periféricos de baja potencia.
- Rendimiento: YOLO26 ofrece CPU hasta un 43 % más rápida en comparación con las versiones anteriores, lo que lo convierte en la opción ideal para dispositivos sin GPU dedicadas, como ordenadores portátiles estándar o configuraciones Raspberry Pi.
- Mejoras específicas para cada tarea: incluye funciones de pérdida especializadas como ProgLoss y STAL, que proporcionan mejoras notables en el reconocimiento de objetos pequeños, una debilidad común en los detectores anteriores.
Recomendaciones de casos de uso
Cuándo elegir Ultralytics (recomendado)
- Aplicaciones en tiempo real: vehículos autónomos, supervisión del tráfico y análisis deportivo, donde la baja latencia es fundamental.
- Implementación periférica: Funciona en teléfonos móviles, drones o dispositivos IoT donde CPU y la duración de la batería son limitados.
- Requisitos multitarea: cuando su proyecto requiere segmentación, estimación de posturas o detección de objetos rotados (OBB), además de los cuadros delimitadores estándar.
Cuándo Considerar EfficientDet
- Investigación heredada: si está reproduciendo artículos académicos del periodo 2019-2020 que comparan específicamente las arquitecturas EfficientDet.
- Restricciones de hardware (específicas): en casos excepcionales en los que los aceleradores de hardware heredados están estrictamente optimizados para estructuras BiFPN y no pueden adaptarse a los bloques modernos basados en rep-vgg o transformadores.
Conclusión
EfficientDet fue un hito en la eficiencia de escalado, pero el campo ha avanzado. YOLOv10 demostró que era posible la detección NMS, y YOLO26 lo ha perfeccionado para su producción. Para los desarrolladores que buscan el mejor equilibrio entre velocidad, precisión y facilidad de uso, Ultralytics es la opción definitiva. Su arquitectura optimizada, combinada con el potente ecosistema Ultralytics , le permite pasar del concepto a la implementación más rápido que nunca.
Para obtener más información sobre las arquitecturas de modelos, consulte nuestras comparaciones entre YOLOv8 YOLOv10 o explore la Ultralytics para comenzar a entrenar hoy mismo.