Ir al contenido

YOLOv5 YOLOv8: la evolución de la detección Ultralytics

El campo de la visión artificial ha avanzado rápidamente, impulsado en gran medida por la innovación continua dentro de la familia de detectores de objetos YOLO You Only Look Once). Dos de las versiones más impactantes de esta línea son YOLOv5 y YOLOv8, ambas desarrolladas por Ultralytics. Mientras que YOLOv5 el estándar del sector en cuanto a facilidad de uso y flexibilidad tras su lanzamiento en 2020, YOLOv8 lanzada en 2023) introdujo avances arquitectónicos que redefinieron el rendimiento de vanguardia.

Esta guía ofrece una comparación técnica detallada para ayudar a los desarrolladores, investigadores e ingenieros a elegir el modelo adecuado para las necesidades específicas de su aplicación, al tiempo que destaca los últimos avances en el campo, como YOLO26.

Ultralytics YOLOv5: El estándar de la industria

Lanzado en junio de 2020, YOLOv5 marcó un momento crucial en la democratización de la IA. A diferencia de sus predecesores, que estaban escritos principalmente en C (Darknet), YOLOv5 el primer PyTorch , lo que lo hizo excepcionalmente accesible para la comunidad Python .

Características clave y arquitectura

YOLOv5 famoso por su equilibrio entre velocidad, precisión y diseño fácil de usar. Su arquitectura introdujo varias mejoras clave con respecto a YOLOv4:

  • CSPDarknet Backbone: utiliza conexiones parciales entre etapas para mejorar el flujo de gradiente y reducir los parámetros.
  • Cuadros de anclaje con autoaprendizaje: aprende automáticamente las dimensiones óptimas de los cuadros de anclaje para el conjunto de datos personalizado antes de que comience el entrenamiento.
  • Aumento de datos mosaico: una técnica de entrenamiento que combina cuatro imágenes en una, mejorando la capacidad del modelo para detect objetos detect y mejorando la generalización del contexto.

Especificaciones técnicas:

Más información sobre YOLOv5

Ultralytics YOLOv8: definiendo la vanguardia tecnológica

Lanzado en enero de 2023, YOLOv8 supuso un importante avance en la tecnología de visión artificial. Se alejó de la detección basada en anclajes utilizada en YOLOv5 un diseño sin anclajes, lo que simplificó el proceso de aprendizaje y mejoró la generalización entre diferentes formas de objetos.

Innovaciones Arquitectónicas

YOLOv8 una serie de técnicas modernas que aumentaron tanto la velocidad como la precisión:

  • Detección sin anclaje: elimina la necesidad de configurar manualmente el cuadro de anclaje, ya que predice directamente los centros de los objetos. Esto reduce el número de predicciones de cuadros y acelera la supresión no máxima (NMS).
  • Módulo C2f: Reemplaza el módulo C3 de YOLOv5, ofreciendo un flujo de gradiente más rico y ajustando los números de canal para una mejor extracción de características.
  • Cabezal desacoplado: Separa las tareas de objetividad, clasificación y regresión en diferentes ramas, lo que permite que cada una de ellas converja de forma más eficaz.
  • Versatilidad de tareas: Diseñado desde cero para admitir no solo la detección, sino también la segmentación de instancias, la estimación de poses, la clasificación y OBB (Oriented Bounding Box).

Especificaciones técnicas:

Más información sobre YOLOv8

Comparación de rendimiento

Al comparar estas dos potentes herramientas, queda claro que YOLOv8 supera YOLOv8 YOLOv5 tanto YOLOv5 precisión (mAP) como YOLOv5 latencia en hardware comparable. Sin embargo, YOLOv5 un modelo muy capaz y extremadamente eficiente para los sistemas heredados.

La tabla siguiente destaca el rendimiento en el COCO . Los valores en negrita indican el mejor rendimiento en cada categoría.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Análisis

YOLOv8n Nano) alcanza un mAP significativamente más alto mAP 37,3) en comparación con YOLOv5n (28,0) con solo un aumento marginal en el recuento de parámetros. Esta ganancia en eficiencia hace que YOLOv8 sea YOLOv8 opción superior para las aplicaciones de vanguardia modernas, donde cada porcentaje de precisión cuenta.

Entrenamiento y ecosistema

Ambos modelos se benefician enormemente del Ultralytics , que prioriza la facilidad de uso.

Flujo de trabajo de formación simplificado

La transición de YOLOv5 YOLOv8 introdujo una CLI unificada CLI Python que admite todas las tareas. Mientras que YOLOv5 de scripts específicos (por ejemplo, train.py, detect.py), YOLOv8 modelos posteriores como YOLO26 utilizar una estructura de paquetes modular.

YOLOv5 :

python train.py --img 640 --batch 16 --epochs 50 --data coco128.yaml --weights yolov5s.pt

YOLOv8 :

yolo train model=yolov8n.pt data=coco8.yaml epochs=100 imgsz=640

Las ventajas de Ultralytics

Ambos modelos se integran perfectamente con la Ultralytics . Esto permite a los usuarios visualizar ejecuciones de entrenamiento, gestionar conjuntos de datos y exportar modelos con un solo clic a formatos como ONNX, TensorRTy CoreML de escribir complejos scripts de conversión.

Casos de Uso y Recomendaciones

La elección entre estos dos modelos depende de tus limitaciones específicas, aunque por lo general se recomiendan los modelos más nuevos para proyectos nuevos.

Escenarios Ideales para YOLOv5

  • Sistemas heredados: proyectos ya profundamente integrados con el YOLOv5 , donde los costes de migración son elevados.
  • Compatibilidad con hardware específico: algunos aceleradores de IA periféricos más antiguos pueden tener núcleos altamente optimizados y ajustados específicamente para las estructuras de capas específicas YOLOv5.
  • Simplicidad: con fines puramente educativos, la estructura explícita basada en scripts del YOLOv5 puede resultar más fácil de analizar línea por línea para los principiantes.

Escenarios ideales para YOLOv8

  • Requisitos de alta precisión: aplicaciones como imágenes médicas o inspección de calidad, en las que es fundamental detectar características sutiles.
  • Aprendizaje multitarea: proyectos que requieren segmentación o estimación de poses junto con la detección.
  • Preparación para el futuro: los desarrolladores que inicien nuevos proyectos deberían optar por YOLOv8 o una versión más reciente) para garantizar la compatibilidad y el soporte a largo plazo con las últimas herramientas de implementación.

El futuro: Ultralytics

Aunque YOLOv5 YOLOv8 excelentes, el campo ha seguido evolucionando. Para los desarrolladores que buscan el máximo rendimiento absoluto en 2026, recomendamos encarecidamente Ultralytics .

¿Por qué elegir YOLO26? YOLO26 se basa en el legado de v5 y v8, pero introduce cambios revolucionarios en cuanto a velocidad y eficiencia:

  • NMS de extremo a extremo: al eliminar la necesidad de la supresión no máxima (NMS), YOLO26 simplifica la lógica de implementación y reduce la latencia de inferencia, un concepto introducido por primera vez en YOLOv10.
  • MuSGD Optimizer: un optimizador híbrido que aporta estabilidad al entrenamiento de LLM en modelos de visión, lo que garantiza una convergencia más rápida.
  • Mejorado para Edge: con la eliminación de DFL y CPU específicas CPU , YOLO26 funciona hasta un 43 % más rápido en las CPU en comparación con las generaciones anteriores.
  • Detección superior de objetos pequeños: Las nuevas funciones ProgLoss y STAL mejoran significativamente el rendimiento en objetivos pequeños, lo cual es vital para las imágenes de drones y las aplicaciones de IoT.

Más información sobre YOLO26

Conclusión

Tanto YOLOv5 YOLOv8 logros monumentales en la historia de la visión artificial. YOLOv5 sigue siendo una herramienta fiable y de bajo consumo de memoria para muchas aplicaciones existentes, famosa por su estabilidad y menor consumo de recursos en el entrenamiento. YOLOv8, sin embargo, ofrece una versatilidad superior, una mayor precisión y un diseño arquitectónico más moderno que se ajusta a las tendencias actuales de investigación.

Para aquellos que exigen lo último en tecnología y miran hacia el futuro YOLO26 o YOLO11 les proporcionará aún mayores ventajas en cuanto a velocidad y precisión. En última instancia, el robusto Ultralytics garantiza que, independientemente del modelo que elija, dispondrá de las herramientas, la documentación y el apoyo de la comunidad necesarios para alcanzar el éxito.

Ejemplo de Código: Ejecución de Inferencia

Experimente la simplicidad de la Ultralytics . Este código funciona indistintamente con los modelos YOLOv8, YOLO11 y YOLO26.

from ultralytics import YOLO

# Load a pretrained model (choose yolov8n.pt or yolo26n.pt)
model = YOLO("yolov8n.pt")

# Run inference on an image from the web
results = model("https://ultralytics.com/images/bus.jpg")

# Process results list
for result in results:
    boxes = result.boxes  # Boxes object for bbox outputs
    masks = result.masks  # Masks object for segmentation masks
    keypoints = result.keypoints  # Keypoints object for pose outputs
    probs = result.probs  # Probs object for classification outputs
    result.show()  # display to screen
    result.save(filename="result.jpg")  # save to disk

Para obtener más información sobre cómo integrar estos modelos en su flujo de trabajo, consulte nuestra Guía de inicio rápido.


Comentarios