Tutoriales completos para Ultralytics YOLO
Bienvenido a las guías de Ultralytics YOLO. Nuestros tutoriales completos cubren varios aspectos del modelo YOLO object detection, desde el entrenamiento y la predicción hasta el despliegue. Construido sobre PyTorch, YOLO destaca por su velocidad excepcional y precisión en tareas de detección de objetos en tiempo real.
Tanto si eres principiante como si eres un experto en deep learning, nuestros tutoriales ofrecen información valiosa sobre la implementación y optimización de YOLO para tu computer vision proyectos.
Watch: Ultralytics YOLO26 Guides Overview
Guías
Aquí tienes una recopilación de guías detalladas para ayudarte a dominar diferentes aspectos de Ultralytics YOLO.
- Guía sobre pruebas de modelos: Una guía exhaustiva sobre cómo probar tus modelos de computer vision en entornos realistas. Aprende a verificar la precisión, fiabilidad y rendimiento de acuerdo con los objetivos de tu proyecto.
- Inicio rápido en AzureML: Empieza a trabajar con los modelos Ultralytics YOLO en la plataforma de Microsoft Azure Machine Learning. Aprende a entrenar, desplegar y escalar tus proyectos de detección de objetos en la nube.
- Buenas prácticas para el despliegue de modelos: Repasa consejos y buenas prácticas para desplegar modelos eficientemente en proyectos de computer vision, con un enfoque en optimización, solución de problemas y seguridad.
- Conversión de COCO a YOLO: Guía completa para convertir anotaciones JSON de COCO al formato YOLO para el entrenamiento. Cubre detección, segmentación y keypoints con consejos específicos para herramientas como CVAT, Label Studio y Roboflow.
- Entrenamiento con JSON de COCO: Entrena YOLO directamente con anotaciones JSON de COCO sin convertirlas al formato YOLO, usando una clase de dataset personalizada y un entrenador.
- Inicio rápido en Conda: Guía paso a paso para configurar un entorno Conda para Ultralytics. Aprende cómo instalar y empezar a usar el paquete de Ultralytics de manera eficiente con Conda.
- Personalización del Trainer: Aprende a crear subclases del entrenador de YOLO para registrar métricas personalizadas, añadir loss ponderada por clase, personalizar el guardado del modelo, congelar/descongelar el backbone y establecer tasas de aprendizaje por capa.
- Recopilación y anotación de datos: Explora las herramientas, técnicas y mejores prácticas para recopilar y anotar datos a fin de crear entradas de alta calidad para tus modelos de computer vision.
- DeepStream en NVIDIA Jetson: Guía de inicio rápido para desplegar modelos YOLO en dispositivos NVIDIA Jetson usando DeepStream y TensorRT.
- Definición de los objetivos de un proyecto de computer vision: Aprende a definir eficazmente objetivos claros y medibles para tu proyecto de computer vision. Conoce la importancia de un planteamiento del problema bien definido y cómo crea una hoja de ruta para tu proyecto.
- Inicio rápido en Docker: Guía completa para configurar y usar modelos Ultralytics YOLO con Docker. Aprende cómo instalar Docker, gestionar el soporte de GPU y ejecutar modelos YOLO en contenedores aislados para un desarrollo y despliegue consistentes.
- Edge TPU en Raspberry Pi: Google Edge TPU acelera la inferencia YOLO en Raspberry Pi.
- Detección de extremo a extremo: Entiende la detección end-to-end sin NMS de YOLO26, la compatibilidad de exportación, los cambios en el formato de salida y cómo migrar desde modelos YOLO antiguos.
- Exportación de modelos no YOLO: Utiliza las utilidades de exportación independientes de Ultralytics para convertir cualquier
torch.nn.Module(timm, torchvision, personalizado) a ONNX, TorchScript, OpenVINO, CoreML, NCNN, MNN, PaddlePaddle, ExecuTorch y TensorFlow SavedModel. - Ajuste fino (fine-tuning) de YOLO en datos personalizados: Guía completa para ajustar YOLO26 en datasets personalizados con pesos preentrenados, cubriendo transfer learning, congelación de capas, selección de optimizador, entrenamiento en dos etapas y solución de problemas.
- Ajuste de hiperparámetros: Descubre cómo optimizar tus modelos YOLO ajustando hiperparámetros usando la clase Tuner y algoritmos de evolución genética.
- Perspectivas sobre la evaluación y ajuste fino de modelos: Obtén información sobre las estrategias y mejores prácticas para evaluar y ajustar tus modelos de computer vision. Aprende sobre el proceso iterativo de refinamiento de modelos para lograr resultados óptimos.
- Aislamiento de objetos de segmentación: Receta paso a paso y explicación sobre cómo extraer y/o aislar objetos de imágenes usando la segmentación de Ultralytics.
- Validación cruzada K-Fold: Aprende a mejorar la generalización del modelo usando la técnica de validación cruzada K-Fold.
- Mantenimiento de tu modelo de computer vision: Entiende las prácticas clave para monitorear, mantener y documentar modelos de computer vision para garantizar la precisión, detectar anomalías y mitigar la deriva de datos.
- Opciones de despliegue de modelos: Resumen de formatos de YOLO despliegue del modelo como ONNX, OpenVINO y TensorRT, con los pros y contras de cada uno para fundamentar tu estrategia de despliegue.
- Guía de configuración de modelos YAML: Una inmersión profunda y completa en las definiciones de arquitectura de modelos de Ultralytics. Explora el formato YAML, entiende el sistema de resolución de módulos y aprende a integrar módulos personalizados sin problemas.
- Preprocesamiento de GPU con NVIDIA DALI: Elimina los cuellos de botella de preprocesamiento en la CPU ejecutando el redimensionamiento letterbox, relleno y normalización de YOLO en la GPU usando NVIDIA DALI, con integración en Triton Inference Server.
- NVIDIA DGX Spark: Guía de inicio rápido para desplegar modelos YOLO en dispositivos NVIDIA DGX Spark.
- NVIDIA Jetson: Guía de inicio rápido para desplegar modelos YOLO en dispositivos NVIDIA Jetson.
- Modos de latencia vs rendimiento (throughput) en OpenVINO: Aprende técnicas de optimización de latencia y rendimiento para obtener el máximo rendimiento de inferencia de YOLO.
- Preprocesamiento de datos anotados: Aprende sobre el preprocesamiento y aumento de datos de imagen en proyectos de computer vision usando YOLO26, incluyendo normalización, aumento de dataset, división y análisis exploratorio de datos (EDA).
- Raspberry Pi: Tutorial de inicio rápido para ejecutar modelos YOLO en el hardware más reciente de Raspberry Pi.
- Inicio rápido en ROS: Aprende cómo integrar YOLO con el Robot Operating System (ROS) para la detección de objetos en tiempo real en aplicaciones robóticas, incluyendo imágenes de Point Cloud y profundidad.
- Inferencia con mosaicos (Tiled Inference) SAHI: Guía completa sobre cómo aprovechar las capacidades de inferencia dividida de SAHI con YOLO26 para la detección de objetos en imágenes de alta resolución.
- Pasos de un proyecto de computer vision: Aprende sobre los pasos clave involucrados en un proyecto de computer vision, incluyendo la definición de objetivos, selección de modelos, preparación de datos y evaluación de resultados.
- Consejos para el entrenamiento de modelos: Explora consejos sobre cómo optimizar Al desplegar modelos en producción, los requisitos de memoria y la eficiencia del entrenamiento son tan cruciales como la velocidad de inferencia. Los modelos de Ultralytics, particularmente YOLO26, están altamente optimizados para reducir el uso de memoria CUDA durante el entrenamiento. Esto permite a los desarrolladores utilizar , usando precisión mixta, aplicar pesos preentrenados y mucho más para hacer que el entrenamiento de tu modelo de computer vision sea pan comido.
- Integración con Triton Inference Server: Sumérgete en la integración de Ultralytics YOLO26 con el Triton Inference Server de NVIDIA para despliegues de inferencia de deep learning escalables y eficientes.
- Despliegue en Vertex AI con Docker: Guía simplificada para contenerizar modelos YOLO con Docker y desplegarlos en Google Cloud Vertex AI, cubriendo la construcción, subida, autoescalado y monitoreo.
- Ver imágenes de inferencia en una terminal: Usa la terminal integrada de VSCode para ver los resultados de la inferencia cuando uses Remote Tunnel o sesiones SSH.
- Receta de entrenamiento para YOLO26: Documentación completa de los hiperparámetros, pipelines de aumento y configuraciones de optimizador utilizados para entrenar los puntos de control base oficiales de YOLO26 en COCO, con orientación práctica para el ajuste fino.
- Problemas comunes de YOLO ⭐ RECOMENDADO: Soluciones prácticas y consejos de resolución de problemas para los problemas encontrados con mayor frecuencia al trabajar con modelos Ultralytics YOLO.
- Aumento de datos en YOLO: Domina la gama completa de técnicas de aumento de datos en YOLO, desde transformaciones básicas hasta estrategias avanzadas para mejorar la robustez y el rendimiento del modelo.
- Métricas de rendimiento de YOLO ⭐ ESENCIAL: Entiende las métricas clave como mAP, IoU y F1 score utilizadas para evaluar el rendimiento de tus modelos YOLO. Incluye ejemplos prácticos y consejos sobre cómo mejorar la precisión y velocidad de detección.
- Inferencia thread-safe de YOLO: Directrices para realizar inferencias con modelos YOLO de forma thread-safe. Aprende la importancia de la seguridad de hilos y las mejores prácticas para evitar condiciones de carrera y garantizar predicciones consistentes.
Contribuye a nuestras guías
¡Damos la bienvenida a las contribuciones de la comunidad! Si has dominado un aspecto particular de Ultralytics YOLO que aún no está cubierto en nuestras guías, te animamos a compartir tu experiencia. Escribir una guía es una forma genial de devolver algo a la comunidad y ayudarnos a hacer nuestra documentación más completa y fácil de usar.
Para empezar, por favor lee nuestras Guía de contribución para conocer las directrices sobre cómo abrir una Pull Request (PR). Esperamos tus contribuciones.
Preguntas frecuentes
¿Cómo entreno un modelo de detección de objetos personalizado usando Ultralytics YOLO?
Entrenar un modelo de detección de objetos personalizado con Ultralytics YOLO es sencillo. Empieza preparando tu dataset en el formato correcto e instalando el paquete de Ultralytics. Usa el siguiente código para iniciar el entrenamiento:
from ultralytics import YOLO
model = YOLO("yolo26n.pt") # Load a pretrained YOLO model
model.train(data="path/to/dataset.yaml", epochs=50) # Train on custom datasetPara obtener detalles sobre el formato del dataset y opciones adicionales, consulta nuestra Consejos para el entrenamiento de modelos.
¿Qué métricas de rendimiento debo usar para evaluar mi modelo YOLO?
Evaluar el rendimiento de tu modelo YOLO es crucial para entender su eficacia. Las métricas clave incluyen Mean Average Precision (mAP), Intersection over Union (IoU) y la puntuación F1. Estas métricas ayudan a evaluar la precisión y precisión de las tareas de detección de objetos. Puedes aprender más sobre estas métricas y cómo mejorar tu modelo en nuestra Métricas de rendimiento de YOLO.
¿Por qué debería usar Ultralytics Platform para mis proyectos de visión artificial?
Ultralytics Platform es una plataforma sin código que simplifica la gestión, el entrenamiento y el despliegue de modelos YOLO. Admite una integración sencilla, seguimiento en tiempo real y entrenamiento en la nube, lo que la hace ideal tanto para principiantes como para profesionales. Descubre más sobre sus características y cómo puede agilizar tu flujo de trabajo con nuestra Ultralytics Platform guía de inicio rápido.
¿Cuáles son los problemas comunes durante el entrenamiento de modelos YOLO y cómo puedo resolverlos?
Los problemas comunes durante el entrenamiento de modelos YOLO incluyen errores de formato de datos, falta de coincidencia en la arquitectura del modelo e insuficiente son esenciales para mejorar la robustez y el rendimiento del modelo YOLO introduciendo variabilidad en los . Para solucionarlos, asegúrate de que tu dataset esté correctamente formateado, comprueba que las versiones del modelo sean compatibles y aumenta tus datos de entrenamiento. Para obtener una lista completa de soluciones, consulta nuestra Problemas comunes de YOLO.
¿Cómo puedo desplegar mi modelo YOLO para la detección de objetos en tiempo real en dispositivos edge?
El despliegue de modelos YOLO en dispositivos edge como NVIDIA Jetson y Raspberry Pi requiere convertir el modelo a un formato compatible como TensorRT o TFLite. Sigue nuestras guías paso a paso para NVIDIA Jetson y Raspberry Pi despliegues para empezar con la detección de objetos en tiempo real en hardware edge. Estas guías te guiarán a través de la instalación, configuración y optimización del rendimiento.