Link to this sectionYOLO11 vs YOLOv5: Una comparativa técnica exhaustiva de las arquitecturas de Ultralytics#
Elegir la arquitectura de red neuronal correcta es una decisión fundamental para cualquier iniciativa de computer vision. A medida que evoluciona el panorama de la artificial intelligence, también lo hacen las herramientas disponibles para desarrolladores e investigadores. Esta guía exhaustiva ofrece una comparación técnica detallada entre dos modelos emblemáticos del ecosistema de Ultralytics: el aclamado YOLOv5 y el avanzado YOLO11.
Tanto si despliegas modelos ligeros para aplicaciones de edge AI como si procesas flujos de vídeo de alta resolución en GPUs en la nube, entender los matices arquitectónicos, las performance metrics y los casos de uso ideales de estos modelos te asegurará tomar una decisión basada en datos para tus limitaciones de despliegue específicas.
Link to this sectionLinaje del modelo y detalles técnicos#
Ambos modelos reflejan el compromiso de Ultralytics con la colaboración de código abierto, un rendimiento robusto y una facilidad de uso inigualable, lo que los hace muy populares en la comunidad global de machine learning.
Link to this sectionDetalles de YOLO11#
- Autores: Glenn Jocher y Jing Qiu
- Organización: Ultralytics
- Fecha: 2024-09-27
- GitHub: ultralytics/ultralytics
- Documentación: YOLO11 Documentation
Link to this sectionDetalles de YOLOv5#
- Autores: Glenn Jocher
- Organización: Ultralytics
- Fecha: 2020-06-26
- GitHub: ultralytics/yolov5
- Documentación: YOLOv5 Documentation
Link to this sectionDiferencias arquitectónicas#
La evolución de YOLOv5 a YOLO11 introduce varios cambios arquitectónicos profundos diseñados para optimizar la precisión y la eficiencia de los parámetros.
YOLOv5 fue pionero en el ecosistema PyTorch, al introducir un backbone CSPNet (Cross Stage Partial Network) altamente optimizado y un cuello PANet (Path Aggregation Network). Se basaba en la detección basada en anclas, lo que requería anchor boxes predefinidas para predecir los límites de los objetos. Aunque era muy eficaz, ajustar estas anclas para computer vision datasets personalizados podía resultar engorroso.
Por el contrario, YOLO11 transita hacia un paradigma de detección más moderno y libre de anclas. Esto elimina la necesidad de ajustar manualmente las anchor boxes, simplifica el proceso de entrenamiento y mejora la generalización en diversos conjuntos de datos como el COCO dataset. Además, YOLO11 cuenta con una cabeza desacoplada, lo que significa que las tareas de clasificación y regresión de cajas delimitadoras se procesan en ramas separadas. Esta separación mejora significativamente la velocidad de convergencia y el mean Average Precision (mAP), especialmente para escenarios complejos de object detection.
Link to this sectionMétricas de rendimiento y benchmarks#
La siguiente tabla compara las métricas clave en diferentes tamaños de modelo. Los modelos de Ultralytics son reconocidos por sus requisitos de memoria, ya que suelen consumir menos memoria CUDA durante el entrenamiento en comparación con las alternativas pesadas basadas en Transformer, lo que reduce drásticamente la barrera de entrada de hardware.
| Modelo | tamaño (píxeles) | mAPval 50-95 | Velocidad CPU ONNX (ms) | Velocidad T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Como se puede observar, YOLO11 logra un equilibrio de rendimiento muy favorable, ofreciendo consistentemente puntuaciones de mAP más altas con un número de parámetros comparable al de sus homólogos de YOLOv5.
Link to this sectionMetodologías de entrenamiento y usabilidad#
Un principio fundamental de la filosofía de Ultralytics es la excepcional facilidad de uso, respaldada por un ecosistema bien mantenido y un amplio soporte de la comunidad.
Históricamente, YOLOv5 dependía de robustos scripts de interfaz de línea de comandos (CLI) (train.py, detect.py) para su ejecución. Aunque potentes, integrar estos scripts directamente en aplicaciones de Python personalizadas a menudo requería soluciones alternativas.
YOLO11 revolucionó esto al introducir el paquete simplificado ultralytics para Python. Esta API unificada gestiona todo, desde el entrenamiento hasta la exporting models a formatos como ONNX, OpenVINO y TensorRT de forma nativa.
Para una experiencia sin código, los desarrolladores pueden utilizar la Ultralytics Platform para anotar datos, entrenar modelos en la nube y desplegarlos en dispositivos edge sin problemas.
Link to this sectionComparación de código#
Entrenar un modelo de Ultralytics hoy en día es increíblemente eficiente. Así es como puedes entrenar YOLO11 utilizando su API nativa de Python:
from ultralytics import YOLO
# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model on custom data
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Export the model to ONNX for deployment
model.export(format="onnx")Para sistemas antiguos que utilizan YOLOv5, el entrenamiento a través de la CLI se ve así:
# Clone the repository and run the training script
git clone https://github.com/ultralytics/yolov5
cd yolov5
pip install -r requirements.txt
python train.py --img 640 --batch 16 --epochs 50 --data coco128.yaml --weights yolov5s.ptLink to this sectionCasos de uso ideales y aplicaciones en el mundo real#
Ambos modelos poseen puntos fuertes distintos adaptados a diferentes entornos operativos.
Link to this sectionCuándo utilizar YOLOv5#
A pesar de ser una generación más antigua, YOLOv5 sigue siendo una potencia. Se recomienda encarecidamente para:
- Integración de sistemas heredados: Entornos profundamente integrados con las estructuras de tensores o pipelines de despliegue específicos de YOLOv5 que no pueden refactorizarse fácilmente.
- Líneas base académicas: Investigadores que necesiten líneas base establecidas desde hace mucho tiempo para estudios académicos reproducibles en medical image analysis.
Link to this sectionCuándo utilizar YOLO11#
YOLO11 representa la opción ideal para pipelines de producción modernos debido a su increíble versatilidad:
- Entornos multitarea: A diferencia de YOLOv5, que es principalmente un detector (con añadidos de segmentación posteriores), YOLO11 admite de forma nativa instance segmentation, image classification, pose estimation y detección de Oriented Bounding Box (OBB) desde el primer momento.
- Analítica de vídeo de alta densidad: Ideal para sistemas de tráfico inteligente o retail inventory management, donde extraer la máxima precisión de escenas complejas es crítico.
Link to this sectionMirando hacia el futuro: La arquitectura YOLO26#
Aunque YOLO11 se erige como un estándar excepcional, la frontera de la computer vision sigue avanzando rápidamente. Los desarrolladores que busquen la máxima eficiencia también deberían considerar el último Ultralytics YOLO26 (lanzado en enero de 2026).
YOLO26 representa un salto enorme, diseñado explícitamente tanto para la optimización en el borde como para la escala empresarial. Las innovaciones clave incluyen:
- Diseño de extremo a extremo sin NMS: YOLO26 es nativamente de extremo a extremo, eliminando el post-procesamiento de Non-Maximum Suppression (NMS) para un despliegue más rápido y sencillo.
- Eliminación de DFL: Se ha eliminado Distribution Focal Loss para simplificar la exportación de modelos y mejorar la compatibilidad con dispositivos de bajo consumo.
- Optimizador MuSGD: Un híbrido revolucionario de SGD y Muon, que aporta la estabilidad de entrenamiento de los LLM a la computer vision para una convergencia más rápida.
- Hasta un 43% más rápido en inferencia de CPU: Altamente optimizado para despliegues de IoT y dispositivos sin GPUs dedicadas.
- ProgLoss + STAL: Funciones de pérdida drásticamente mejoradas que ofrecen mejoras notables en el reconocimiento de objetos pequeños, vital para imágenes de drones aéreos.
Link to this sectionResumen#
Elegir entre YOLO11 y YOLOv5 depende en última instancia de la etapa del ciclo de vida de tu proyecto. El legado de YOLOv5 es innegable, ya que ofrece una estabilidad extrema y un respaldo masivo de la comunidad. Sin embargo, para cualquier proyecto nuevo, YOLO11 es muy recomendable por encima de generaciones anteriores. Combina una precisión de vanguardia, una API de Python excepcionalmente elegante y una menor sobrecarga de memoria de entrenamiento, consolidando la posición de Ultralytics a la vanguardia de la innovación en IA. Para aquellos que superan aún más los límites, explorar el estado del arte de YOLO26 en la Ultralytics Platform producirá resultados inigualables.