Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv6-3.0 vs. EfficientDet: una comparativa técnica exhaustiva#

Elegir la arquitectura óptima para proyectos de visión artificial requiere un conocimiento profundo de las ventajas y desventajas entre velocidad, precisión y viabilidad de despliegue. Esta página comparativa ofrece un análisis detallado de dos modelos de detección de objetos distintos: YOLOv6-3.0 y EfficientDet. Aunque ambos modelos han contribuido significativamente al campo, los despliegues modernos en el borde (edge) y la creación rápida de prototipos suelen beneficiarse más de marcos de trabajo unificados como Ultralytics Platform.

A continuación, se muestra un gráfico interactivo que visualiza las diferencias de rendimiento entre estos modelos para ayudarte a comprender sus respectivos perfiles de latencia y precisión.

Link to this sectionYOLOv6-3.0: rendimiento de grado industrial#

YOLOv6-3.0 fue diseñado explícitamente por Meituan para servir como un marco de trabajo de detección de objetos de una sola etapa y alto rendimiento, adaptado para aplicaciones industriales. Se centra intensamente en maximizar el rendimiento en hardware GPU, lo que lo convierte en un firme candidato para líneas de fabricación de alta velocidad y análisis de vídeo sin conexión.

  • Autores: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu y Xiangxiang Chu
  • Organización: Meituan
  • Fecha: 13-01-2023
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6

Link to this sectionAspectos destacados de la arquitectura#

La arquitectura de YOLOv6-3.0 se basa en un módulo de concatenación bidireccional (BiC) para mejorar la fusión de características a distintas escalas. Para garantizar velocidades de inferencia elevadas, aprovecha un backbone EfficientRep, altamente optimizado para la ejecución en GPU. Además, emplea una estrategia de entrenamiento asistido por anclas (AAT), combinando los beneficios de los detectores basados en anclas y detectores sin anclas durante la fase de entrenamiento, manteniendo al mismo tiempo una canalización de inferencia sin anclas para reducir la latencia.

Link to this sectionPuntos fuertes y debilidades#

YOLOv6-3.0 destaca en entornos donde hay disponible hardware de GPU dedicado, ofreciendo una inferencia en tiempo real increíblemente rápida usando TensorRT. Sin embargo, su fuerte dependencia de optimizaciones de hardware específicas puede llevar a un rendimiento subóptimo en dispositivos de IA en el borde que solo utilizan CPU. Además, aunque admite cierta cuantización, su ecosistema carece de la simplicidad general que se encuentra en los marcos modernos de Ultralytics.

Más información sobre YOLOv6

Link to this sectionEfficientDet: arquitectura de AutoML escalable#

Desarrollado por Google Research, EfficientDet adopta un enfoque fundamentalmente distinto. En lugar de diseñar la red manualmente, los autores utilizaron Automated Machine Learning (AutoML) para diseñar una arquitectura escalable que equilibra parámetros, FLOPs y precisión.

Link to this sectionAspectos destacados de la arquitectura#

EfficientDet introdujo la red piramidal de características bidireccional (BiFPN), que permite una fusión de características multiescala fácil y rápida. Combinado con un método de escalado compuesto que escala uniformemente la resolución, la profundidad y la anchura de todas las redes de backbone, de características y de predicción de cuadros/clases, los modelos EfficientDet van desde el d0, altamente compacto, hasta el masivo d7.

Link to this sectionPuntos fuertes y debilidades#

EfficientDet es altamente eficiente en cuanto a parámetros. Logra una precisión media (mAP) sólida con relativamente pocos parámetros en comparación con detectores de objetos más antiguos. Sin embargo, la arquitectura está profundamente arraigada en los ecosistemas heredados de TensorFlow. Esto resulta en una gestión compleja de dependencias, ciclos de entrenamiento más lentos y mayores requisitos de memoria durante el entrenamiento en comparación con implementaciones optimizadas de PyTorch. Además, su velocidad de inferencia en GPUs modernas es significativamente más lenta que la de las arquitecturas YOLO actuales.

Más información sobre EfficientDet

Link to this sectionComparativa detallada de rendimiento#

La siguiente tabla contrasta las especificaciones técnicas de YOLOv6-3.0 y EfficientDet en varias métricas. Observa cómo YOLOv6-3.0 domina en velocidad de GPU, mientras que EfficientDet escala a un mAP superior a costa de una latencia significativa.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
Latencia vs. rendimiento (Throughput)

Al comparar modelos, recuerda que los FLOPs y los recuentos de parámetros no siempre se correlacionan perfectamente con la latencia en el mundo real. YOLOv6-3.0 está optimizado para TensorRT, logrando velocidades de milisegundos a pesar de tener recuentos de FLOP más altos que los modelos EfficientDet de nivel inferior.

Link to this sectionLa ventaja del ecosistema Ultralytics#

Aunque YOLOv6-3.0 y EfficientDet cubren nichos específicos, los proyectos modernos de visión artificial requieren versatilidad, facilidad de uso y un ecosistema bien mantenido. Aquí es donde los modelos de Ultralytics YOLO realmente destacan.

Link to this sectionFacilidad de uso y eficiencia de entrenamiento#

A diferencia de EfficientDet, que requiere navegar por configuraciones complejas de TensorFlow, los modelos de Ultralytics están construidos sobre una base intuitiva de PyTorch. Ultralytics Platform ofrece una API simplificada que facilita todo el ciclo de vida del aprendizaje automático. Entrenar un modelo de Ultralytics requiere drásticamente menos memoria CUDA, lo que acelera la experimentación y reduce los costes de cómputo.

Link to this sectionVersatilidad inigualable#

YOLOv6-3.0 y EfficientDet están vinculados principalmente a la detección de objetos. Por el contrario, las arquitecturas modernas de Ultralytics son intrínsecamente multimodales. Una única interfaz te permite entrenar modelos para tareas de segmentación de instancias, estimación de poses, clasificación de imágenes y cuadros delimitadores orientados (OBB).

Link to this sectionPresentamos Ultralytics YOLO26#

Para los desarrolladores que buscan el equilibrio de rendimiento definitivo, Ultralytics YOLO26 representa un cambio de paradigma. Lanzado en enero de 2026, introduce varias innovaciones revolucionarias que superan tanto a YOLOv6 como a EfficientDet:

  • Diseño integral sin NMS: YOLO26 elimina de forma nativa la necesidad de posprocesamiento de supresión no máxima (NMS), lo que reduce significativamente la varianza de la latencia y simplifica la lógica de despliegue en dispositivos de borde.
  • Optimizador MuSGD: Inspirado en el entrenamiento de LLM, este optimizador híbrido garantiza un entrenamiento estable y una convergencia increíblemente rápida.
  • Inferencia en CPU hasta un 43% más rápida: Con la eliminación de la pérdida focal de distribución (DFL), YOLO26 es mucho más eficiente en CPUs y dispositivos IoT de baja potencia en comparación con los modelos heredados.
  • ProgLoss + STAL: Estas funciones de pérdida avanzadas ofrecen mejoras masivas en el reconocimiento de objetos pequeños, haciendo que YOLO26 sea ideal para aplicaciones con drones e imágenes aéreas.

Más información sobre YOLO26

Link to this sectionCasos de uso y recomendaciones#

La elección entre YOLOv6 y EfficientDet depende de los requisitos específicos de tu proyecto, las limitaciones de despliegue y las preferencias de ecosistema.

Link to this sectionCuándo elegir YOLOv6#

YOLOv6 es una buena opción para:

  • Despliegue consciente del hardware industrial: Escenarios donde el diseño del modelo consciente del hardware y la reparametrización eficiente proporcionan un rendimiento optimizado en hardware de destino específico.
  • Detección rápida en una sola etapa: Aplicaciones que priorizan la velocidad de inferencia bruta en GPU para el procesamiento de vídeo en tiempo real en entornos controlados.
  • Integración con el ecosistema Meituan: Equipos que ya trabajan dentro de la pila tecnológica y la infraestructura de despliegue de Meituan.

Link to this sectionCuándo elegir EfficientDet#

EfficientDet se recomienda para:

  • Google Cloud y pipelines de TPU: Sistemas profundamente integrados con las API de Google Cloud Vision o la infraestructura de TPU, donde EfficientDet cuenta con optimización nativa.
  • Investigación en escalado compuesto: Benchmarking académico centrado en el estudio de los efectos de un escalado equilibrado de profundidad, anchura y resolución de red.
  • Despliegue móvil mediante TFLite: Proyectos que requieren específicamente la exportación a TensorFlow Lite para dispositivos Android o Linux embebido.

Link to this sectionCuándo elegir Ultralytics (YOLO26)#

Para la mayoría de los proyectos nuevos, Ultralytics YOLO26 ofrece la mejor combinación de rendimiento y experiencia de desarrollo:

  • Implementación en el borde sin NMS: Aplicaciones que requieren una inferencia consistente y de baja latencia sin la complejidad del posprocesamiento de supresión de no máximos.
  • Entornos solo de CPU: Dispositivos sin aceleración de GPU dedicada, donde la inferencia en CPU hasta un 43% más rápida de YOLO26 proporciona una ventaja decisiva.
  • Detección de objetos pequeños: Escenarios desafiantes como imágenes de drones aéreos o análisis de sensores IoT donde ProgLoss y STAL aumentan significativamente la precisión en objetos pequeños.

Link to this sectionEjemplo de implementación: Entrenamiento de YOLO26#

El siguiente código demuestra la simplicidad del ecosistema Ultralytics. Entrenar un modelo de última generación es tan fácil como cargar los pesos y señalar tus datos.

from ultralytics import YOLO

# Load the highly optimized YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on a dataset with automatic hyperparameter handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model to check mAP metrics
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")

# Run inference on a test image seamlessly
prediction = model("https://ultralytics.com/images/bus.jpg")

Link to this sectionOtros modelos a considerar#

Si estás explorando el panorama más amplio de los modelos de visión artificial, considera estas alternativas:

  • YOLO11: El exitoso predecesor de YOLO26, que ofrece capacidades multitarea robustas y un amplio soporte de la comunidad.
  • YOLOv10: La primera arquitectura YOLO en introducir el entrenamiento sin NMS, allanando el camino para la detección integral moderna.
  • RT-DETR: Para escenarios donde se prefieren arquitecturas basadas en Transformers y mecanismos de atención sobre las CNN tradicionales.

Link to this sectionConclusión#

Aunque YOLOv6-3.0 proporciona un excelente rendimiento industrial en GPU y EfficientDet muestra el potencial de AutoML en la creación de redes escalables y eficientes en cuanto a parámetros, ambos modelos presentan limitaciones en cuanto a facilidad de despliegue y versatilidad multitarea moderna.

Para la gran mayoría de las aplicaciones del mundo real —desde el despliegue en el borde móvil hasta el análisis basado en la nube— el ecosistema Ultralytics ofrece un equilibrio de rendimiento inigualable. Al adoptar YOLO26, los desarrolladores obtienen acceso a una inferencia de vanguardia sin NMS, funciones de pérdida avanzadas para objetos pequeños y una canalización de entrenamiento unificada y bien documentada que acelera drásticamente el camino desde el prototipo hasta la producción.

Colaboradores

Comentarios