Ir al contenido

EfficientDet frente a YOLOv6. YOLOv6: un análisis en profundidad de las arquitecturas de detección de objetos

Seleccionar el modelo adecuado para la detección de objetos suele ser una cuestión de equilibrio entre precisión, latencia y limitaciones de implementación. Esta comparación explora dos hitos importantes en la historia de la visión artificial: EfficientDet, la arquitectura escalable Google que redefinió la eficiencia de los parámetros en 2019, y YOLOv6.YOLOv6, el detector de grado industrial de Meituan optimizado para GPU de alto rendimiento en 2023.

Comparación de métricas de rendimiento

La siguiente tabla destaca las diferencias de rendimiento entre las dos arquitecturas. Mientras que EfficientDet se centra en la eficiencia de los parámetros (tamaño de modelo más pequeño para una precisión determinada), YOLOv6. YOLOv6 da prioridad a la velocidad de inferencia en aceleradores de hardware como las GPU.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

EfficientDet: escalable y eficiente en cuanto a parámetros

EfficientDet fue presentado por el equipo Google para abordar el reto de escalar modelos de detección de objetos de manera eficiente. A diferencia de los modelos anteriores, que simplemente hacían las redes más profundas o más amplias, EfficientDet introdujo un método de escalado compuesto que escala de manera uniforme la resolución, la profundidad y la amplitud.

Características arquitectónicas clave

  • BiFPN (Red piramidal de características bidireccionales ponderadas): EfficientDet crea una ruta de fusión de características compleja. A diferencia de una FPN estándar, BiFPN permite una fácil fusión de características multiescala mediante la introducción de pesos aprendibles en diferentes características de entrada, lo que garantiza que la red dé prioridad a la información más importante.
  • EfficientNet Backbone: Utiliza EfficientNet como columna vertebral, que está altamente optimizado para operaciones de punto flotante (FLOP) y recuento de parámetros.
  • Escalado compuesto: un simple coeficiente $\phi$ controla el escalado de la red principal, BiFPN y las redes de clase/cuadro simultáneamente.

Advertencia sobre complejidad

Aunque BiFPN es matemáticamente elegante y eficiente en cuanto a parámetros, sus patrones irregulares de acceso a la memoria pueden dificultar su optimización en determinados aceleradores de hardware en comparación con los bloques convolucionales sencillos que se encuentran en YOLO .

Metadatos:

Más información sobre EfficientDet

YOLOv6.0: El demonio de la velocidad industrial

Lanzado por Meituan en 2023, YOLOv6. YOLOv6(a menudo denominado «Full-Scale Reloading») fue diseñado específicamente para aplicaciones industriales. Los autores dieron prioridad a la velocidad de inferencia en el mundo real en las GPU frente a los FLOP teóricos, lo que dio como resultado un modelo que domina en escenarios de alto rendimiento, como el análisis de vídeo.

Características arquitectónicas clave

  • RepBi-PAN: Esta estructura de cuello actualizada emplea bloques de estilo RepVGG. Durante el entrenamiento, estos bloques tienen topologías de múltiples ramificaciones para un mejor flujo de gradiente. Durante la inferencia, se reparametrizan estructuralmente en una única convolución 3x3, lo que reduce drásticamente la latencia.
  • Entrenamiento asistido por anclajes (AAT): aunque YOLOv6 fundamentalmente un detector sin anclajes, la versión 3.0 introdujo una rama auxiliar basada en anclajes durante el entrenamiento para estabilizar la convergencia y mejorar la precisión sin afectar a la velocidad de inferencia.
  • Cabezal desacoplado: Las tareas de clasificación y regresión se separan en diferentes ramas, una elección de diseño que se ha convertido en estándar en los detectores modernos para resolver el conflicto entre estos dos objetivos.

Metadatos:

  • Autores: Chuyi Li, Lulu Li, Yifei Geng, et al.
  • Organización:Meituan
  • Fecha: 13 de enero de 2023
  • Enlaces:Arxiv | GitHub

Más información sobre YOLOv6

Análisis comparativo

Latencia y Rendimiento

YOLOv6.YOLOv6 es significativamente más rápido en GPU . Como se puede ver en la tabla, YOLOv6.0l alcanza un mAP 52,8 % con una TensorRT de solo 8,95 ms. Por el contrario, EfficientDet-d6 alcanza un mAP similar del 52,6 %, mAP requiere 89,29 ms, lo que supone prácticamente un orden de magnitud más lento. Esto convierte a YOLOv6 en YOLOv6 claro ganador para aplicaciones que requieren procesamiento en tiempo real en dispositivos NVIDIA o Jetson.

Eficiencia de los parámetros

EfficientDet destaca en entornos donde el almacenamiento es el principal cuello de botella. EfficientDet-d0 proporciona un respetable 34,6 % mAP solo 3,9 millones de parámetros. Esto es inferior a la YOLOv6 más pequeña YOLOv6 . Para la investigación académica o entornos de almacenamiento extremadamente limitados (por ejemplo, la integración de un modelo directamente en un pequeño paquete de aplicaciones móviles), el reducido tamaño de EfficientDet sigue siendo relevante.

Entrenamiento y usabilidad

EfficientDet se basa en el antiguo ecosistema TensorFlow , que puede resultar complicado de integrar en los flujos de trabajo modernos PyTorch. El entrenamiento suele implicar un complejo ajuste de hiperparámetros para el escalado compuesto. YOLOv6. YOLOv6 ofrece una receta de entrenamiento más moderna, pero se centra en gran medida en la detección de objetos, careciendo de soporte nativo para otras tareas como la segmentación o la estimación de poses en su versión básica.

La ventaja de Ultralytics

Aunque el estudio de estas arquitecturas proporciona información valiosa, el desarrollo moderno requiere una plataforma holística. Ultralytics un ecosistema integral que supera las arquitecturas de modelos individuales al centrarse en todo el ciclo de vida del aprendizaje automático.

¿Por qué cambiar a Ultralytics?

  • Versatilidad sin igual: a diferencia de EfficientDet y YOLOv6 son principalmente detectores de objetos, Ultralytics admiten de forma nativa la segmentación de instancias, la estimación de poses, los rectángulos delimitadores orientados (OBB) y la clasificación.
  • Facilidad de uso: una Python coherente le permite cambiar entre generaciones de modelos (por ejemplo, de YOLO11 YOLO26) modificando una sola cadena.
  • Eficiencia de memoria: Ultralytics están optimizados para un menor uso de VRAM durante el entrenamiento, lo que permite tamaños de lotes más grandes en GPU de consumo en comparación con las arquitecturas de EfficientDet, que consumen mucha memoria.

Entra YOLO26: el nuevo estándar

Para los desarrolladores que buscan lo último en tecnología, YOLO26 representa la cima de la eficiencia y el rendimiento. Lanzado en enero de 2026, soluciona las limitaciones tanto de EfficientDet (velocidad) como de YOLOv6 CPU ).

Avances de YOLO26:

  • NMS de extremo a extremo: al eliminar la supresión no máxima (NMS), YOLO26 simplifica la lógica de implementación y reduce la varianza de la latencia de inferencia.
  • Optimizador MuSGD: inspirado en el entrenamiento LLM, este optimizador híbrido estabiliza el entrenamiento y acelera la convergencia.
  • Optimizado para Edge: con la eliminación de la pérdida focal de distribución (DFL) y ajustes arquitectónicos específicos, YOLO26 es hasta un 43 % más rápido en la inferencia CPU en comparación con las generaciones anteriores, lo que lo hace superior para Raspberry Pi y las implementaciones móviles, donde EfficientDet a menudo tiene dificultades.
  • Funciones avanzadas de pérdida: la integración de ProgLoss y STAL mejora significativamente la detección de objetos pequeños, un requisito fundamental para las imágenes de drones y los sensores IoT.
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on COCO8 dataset with MuSGD optimizer
model.train(data="coco8.yaml", epochs=100, optimizer="MuSGD")

# Export to ONNX for NMS-free deployment
model.export(format="onnx")

Más información sobre YOLO26

Recomendaciones de casos de uso

  • Elija EfficientDet si: está realizando una investigación académica sobre el escalado de la fusión de características o trabajando con TensorFlow heredadas en las que el tamaño del peso del modelo (MB) es una restricción estricta.
  • Elija YOLOv6. YOLOv6 si: está implementando estrictamente en NVIDIA (como T4 o A10) y el rendimiento bruto (FPS) para la detección de objetos estándar es su única métrica.
  • Elija Ultralytics si: necesita una solución lista para la producción que equilibreGPU , no requiera un posprocesamiento complejo (NMS), necesite realizar tareas más allá de la simple detección (como segmentación u OBB) o exija un flujo de trabajo de entrenamiento simplificado.

Para obtener más información sobre los detectores de objetos modernos, le recomendamos leer nuestras comparativas entre YOLOv8 EfficientDet o las capacidades de los transformadores de detección en tiempo real (RT-DETR).


Comentarios