Ir al contenido

Visi贸n general de los conjuntos de datos Oriented Bounding Box (OBB)

El entrenamiento de un modelo preciso de detecci贸n de objetos con recuadros delimitadores orientados (OBB) requiere un conjunto de datos completo. En esta gu铆a se explican los distintos formatos de conjuntos de datos OBB compatibles con los modelos de Ultralytics YOLO y se ofrece informaci贸n sobre su estructura, aplicaci贸n y m茅todos de conversi贸n de formatos.

Formatos de conjuntos de datos OBB compatibles

YOLO Formato OBB

El formato YOLO OBB designa los recuadros delimitadores por sus cuatro puntos de esquina con coordenadas normalizadas entre 0 y 1. Sigue este formato:

class_index x1 y1 x2 y2 x3 y3 x4 y4

Internamente, YOLO procesa las p茅rdidas y salidas en el xywhr que representa el formato cuadro delimitador(xy), anchura, altura y rotaci贸n.

Ejemplos de formato OBB

Un ejemplo de *.txt para la imagen anterior, que contiene un objeto de clase 0 en formato OBB, podr铆a tener este aspecto:

0 0.780811 0.743961 0.782371 0.74686 0.777691 0.752174 0.776131 0.749758

Utilizaci贸n

Para entrenar un modelo utilizando estos formatos OBB:

Ejemplo

from ultralytics import YOLO

# Create a new YOLO11n-OBB model from scratch
model = YOLO("yolo11n-obb.yaml")

# Train the model on the DOTAv1 dataset
results = model.train(data="DOTAv1.yaml", epochs=100, imgsz=1024)
# Train a new YOLO11n-OBB model on the DOTAv1 dataset
yolo obb train data=DOTAv1.yaml model=yolo11n-obb.pt epochs=100 imgsz=1024

Conjuntos de datos compatibles

Actualmente, se admiten los siguientes conjuntos de datos con cajas delimitadoras orientadas:

  • DOTA-v1: La primera versi贸n del conjunto de datos DOTA, que proporciona un amplio conjunto de im谩genes a茅reas con cuadros delimitadores orientados para la detecci贸n de objetos.
  • DOTA-v1.5: versi贸n intermedia del conjunto de datos DOTA, que ofrece anotaciones adicionales y mejoras con respecto a DOTA-v1 para tareas de detecci贸n de objetos mejoradas.
  • DOTA-v2: DOTA (A Large-scale Dataset for Object Detection in Aerial Images) versi贸n 2, hace hincapi茅 en la detecci贸n desde perspectivas a茅reas y contiene cuadros delimitadores orientados con 1,7 millones de instancias y 11.268 im谩genes.
  • DOTA8: Un peque帽o subconjunto de 8 im谩genes del conjunto completo de datos DOTA adecuado para probar flujos de trabajo y comprobaciones de integraci贸n continua (CI) de la formaci贸n OBB en el ultralytics repositorio.

Incorporar su propio conjunto de datos OBB

Para aquellos que deseen introducir sus propios conjuntos de datos con cuadros delimitadores orientados, aseg煤rese de la compatibilidad con el "YOLO OBB format" mencionado anteriormente. Convierte tus anotaciones a este formato requerido y detalla las rutas, clases y nombres de clase en un archivo de configuraci贸n YAML correspondiente.

Convertir formatos de etiquetas

DOTA Dataset Format a YOLO OBB Format

La transici贸n de etiquetas del formato del conjunto de datos DOTA al formato YOLO OBB puede realizarse con este script:

Ejemplo

from ultralytics.data.converter import convert_dota_to_yolo_obb

convert_dota_to_yolo_obb("path/to/DOTA")

Este mecanismo de conversi贸n es fundamental para los conjuntos de datos en formato DOTA, ya que garantiza la alineaci贸n con el formato Ultralytics YOLO OBB.

Es imprescindible validar la compatibilidad del conjunto de datos con su modelo y respetar las convenciones de formato necesarias. Los conjuntos de datos correctamente estructurados son fundamentales para entrenar modelos eficientes de detecci贸n de objetos con cuadros delimitadores orientados.

PREGUNTAS FRECUENTES

驴Qu茅 son los recuadros delimitadores orientados (OBB) y c贸mo se utilizan en los modelos de Ultralytics YOLO ?

Los cuadros delimitadores orientados (OBB) son un tipo de anotaci贸n de cuadro delimitador en el que el cuadro puede girarse para alinearse m谩s estrechamente con el objeto que se detecta, en lugar de alinearse s贸lo con el eje. Esto resulta especialmente 煤til en im谩genes a茅reas o por sat茅lite, en las que los objetos pueden no estar alineados con los ejes de la imagen. En los modelos Ultralytics YOLO , los OBB se representan por sus cuatro puntos de esquina en el formato YOLO OBB. Esto permite una detecci贸n de objetos m谩s precisa, ya que los recuadros delimitadores pueden girar para ajustarse mejor a los objetos.

驴C贸mo convierto las etiquetas de mis conjuntos de datos DOTA existentes al formato YOLO OBB para utilizarlas con Ultralytics YOLO11 ?

Puede convertir las etiquetas de los conjuntos de datos DOTA al formato OBB de YOLO utilizando la herramienta convert_dota_to_yolo_obb de Ultralytics. Esta conversi贸n garantiza la compatibilidad con los modelos Ultralytics YOLO , lo que le permite aprovechar las funciones OBB para mejorar la detecci贸n de objetos. He aqu铆 un ejemplo r谩pido:

from ultralytics.data.converter import convert_dota_to_yolo_obb

convert_dota_to_yolo_obb("path/to/DOTA")

Este script reformatear谩 tus anotaciones DOTA en un formato compatible con YOLO.

驴C贸mo puedo entrenar un modelo YOLO11 con recuadros delimitadores orientados (OBB) en mi conjunto de datos?

Entrenar un modelo YOLO11 con OBBs implica asegurarse de que su conjunto de datos est谩 en el formato YOLO OBB y luego utilizar la API Ultralytics para entrenar el modelo. Aqu铆 tienes un ejemplo tanto en Python como en CLI:

Ejemplo

from ultralytics import YOLO

# Create a new YOLO11n-OBB model from scratch
model = YOLO("yolo11n-obb.yaml")

# Train the model on the custom dataset
results = model.train(data="your_dataset.yaml", epochs=100, imgsz=640)
# Train a new YOLO11n-OBB model on the custom dataset
yolo obb train data=your_dataset.yaml model=yolo11n-obb.yaml epochs=100 imgsz=640

Esto garantiza que su modelo aproveche las anotaciones detalladas de OBB para mejorar la precisi贸n de la detecci贸n.

驴Qu茅 conjuntos de datos se admiten actualmente para el entrenamiento OBB en los modelos Ultralytics YOLO ?

Actualmente, Ultralytics admite los siguientes conjuntos de datos para el entrenamiento OBB:

  • DOTA-v1: La primera versi贸n del conjunto de datos DOTA, que proporciona un amplio conjunto de im谩genes a茅reas con cuadros delimitadores orientados para la detecci贸n de objetos.
  • DOTA-v1.5: versi贸n intermedia del conjunto de datos DOTA, que ofrece anotaciones adicionales y mejoras con respecto a DOTA-v1 para tareas de detecci贸n de objetos mejoradas.
  • DOTA-v2: Este conjunto de datos incluye 1,7 millones de instancias con cuadros delimitadores orientados y 11.268 im谩genes, y se centra principalmente en la detecci贸n de objetos a茅reos.
  • DOTA8: un subconjunto m谩s peque帽o de 8 im谩genes del conjunto de datos DOTA utilizado para pruebas y comprobaciones de integraci贸n continua (CI).

Estos conjuntos de datos se adaptan a escenarios en los que los OBB ofrecen una ventaja significativa, como el an谩lisis de im谩genes a茅reas y por sat茅lite.

驴Puedo utilizar mi propio conjunto de datos con cuadros delimitadores orientados para el entrenamiento de YOLO11 y, en caso afirmativo, c贸mo?

S铆, puede utilizar su propio conjunto de datos con cuadros delimitadores orientados para el entrenamiento de YOLO11 . Aseg煤rese de que las anotaciones de su conjunto de datos se convierten al formato OBB de YOLO , lo que implica definir los cuadros delimitadores por sus cuatro puntos de esquina. A continuaci贸n, puede crear un archivo de configuraci贸n YAML especificando las rutas del conjunto de datos, las clases y otros detalles necesarios. Para obtener m谩s informaci贸n sobre la creaci贸n y configuraci贸n de sus conjuntos de datos, consulte la secci贸n Conjuntos de datos compatibles.

Creado hace 1 a帽o 鉁忥笍 Actualizado hace 3 meses

Comentarios