Roboflow 100 Conjunto de datos
Roboflow 100, patrocinado por Inteles un innovador conjunto de datos de referencia para la detección de objetos. Incluye 100 conjuntos de datos de entre más de 90.000 conjuntos de datos públicos disponibles en Roboflow Universe. Esta prueba está diseñada específicamente para comprobar la adaptabilidad de los modelos de visión por ordenador, como los modelosYOLO Ultralytics , a diversos ámbitos, como la sanidad, las imágenes aéreas y los videojuegos.
Licencias
Ultralytics ofrece dos opciones de licencia para adaptarse a diferentes casos de uso:
- LicenciaAGPL-3.0 : Esta licencia de código abierto aprobada por la OSI es ideal para estudiantes y entusiastas, ya que promueve la colaboración abierta y el intercambio de conocimientos. Consulte el archivo LICENSE para más detalles y visite nuestra página LicenciaAGPL-3.0 .
- Licencia de empresa: Diseñada para uso comercial, esta licencia permite la perfecta integración del software Ultralytics y los modelos de IA en productos y servicios comerciales. Si su caso implica aplicaciones comerciales, póngase en contacto con Ultralytics Licensing.
Características principales
- Diversos dominios: Incluye 100 conjuntos de datos en siete dominios distintos: Aéreo, Videojuegos, Microscópico, Subacuático, Documentos, Electromagnético y Mundo Real.
- Escala: La referencia comprende 224 714 imágenes de 805 clases, lo que representa más de 11 170 horas de trabajo de etiquetado de datos.
- Normalización: Todas las imágenes se procesan previamente y se redimensionan a 640x640 píxeles para una evaluación coherente.
- Evaluación limpia: Se centra en eliminar la ambigüedad de las clases y filtra las clases infrarrepresentadas para garantizar una evaluación más limpia del modelo.
- Anotaciones: Incluye cuadros delimitadores para objetos, adecuados para entrenar y evaluar modelos de detección de objetos utilizando métricas como mAP.
Estructura del conjunto de datos
El conjunto de datos Roboflow 100 está organizado en siete categorías, cada una de las cuales contiene una colección única de conjuntos de datos, imágenes y clases:
- Aéreo: 7 conjuntos de datos, 9.683 imágenes, 24 clases.
- Videojuegos: 7 conjuntos de datos, 11.579 imágenes, 88 clases.
- Microscópico: 11 conjuntos de datos, 13.378 imágenes, 28 clases.
- Bajo el agua: 5 conjuntos de datos, 18.003 imágenes, 39 clases.
- Documentos: 8 conjuntos de datos, 24.813 imágenes, 90 clases.
- Electromagnética: 12 conjuntos de datos, 36.381 imágenes, 41 clases.
- Mundo real: 50 conjuntos de datos, 110.615 imágenes, 495 clases.
Esta estructura proporciona un campo de pruebas diverso y extenso para los modelos de detección de objetos, reflejando una amplia gama de escenarios de aplicación del mundo real encontrados en varias SolucionesUltralytics .
Evaluación comparativa
La evaluación comparativa de conjuntos de datos consiste en evaluar el rendimiento de los modelos de aprendizaje automático en conjuntos de datos específicos utilizando métricas estandarizadas. Entre las métricas más comunes se incluyen la precisión, la precisión media media (mAP) y la puntuación F1. Puede obtener más información sobre estas métricas en nuestra guía de métricas de rendimientoYOLO .
Resultados de la evaluación comparativa
Los resultados de la evaluación comparativa utilizando el script proporcionado se almacenarán en el archivo ultralytics-benchmarks/
específicamente en evaluation.txt
.
Ejemplo de evaluación comparativa
La siguiente secuencia de comandos muestra cómo comparar mediante programación un modeloYOLO Ultralytics (por ejemplo, YOLOv11n) en los 100 conjuntos de datos dentro de la prueba Roboflow 100 utilizando la función RF100Benchmark
clase.
import os
import shutil
from pathlib import Path
from ultralytics.utils.benchmarks import RF100Benchmark
# Initialize RF100Benchmark and set API key
benchmark = RF100Benchmark()
benchmark.set_key(api_key="YOUR_ROBOFLOW_API_KEY")
# Parse dataset and define file paths
names, cfg_yamls = benchmark.parse_dataset()
val_log_file = Path("ultralytics-benchmarks") / "validation.txt"
eval_log_file = Path("ultralytics-benchmarks") / "evaluation.txt"
# Run benchmarks on each dataset in RF100
for ind, path in enumerate(cfg_yamls):
path = Path(path)
if path.exists():
# Fix YAML file and run training
benchmark.fix_yaml(str(path))
os.system(f"yolo detect train data={path} model=yolo11s.pt epochs=1 batch=16")
# Run validation and evaluate
os.system(f"yolo detect val data={path} model=runs/detect/train/weights/best.pt > {val_log_file} 2>&1")
benchmark.evaluate(str(path), str(val_log_file), str(eval_log_file), ind)
# Remove the 'runs' directory
runs_dir = Path.cwd() / "runs"
shutil.rmtree(runs_dir)
else:
print("YAML file path does not exist")
continue
print("RF100 Benchmarking completed!")
Aplicaciones
Roboflow 100 tiene un valor incalculable para diversas aplicaciones relacionadas con la visión por ordenador y el aprendizaje profundo. Los investigadores e ingenieros pueden aprovechar este punto de referencia para:
- Evaluar el rendimiento de los modelos de detección de objetos en un contexto multidominio.
- Probar la adaptabilidad y solidez de los modelos a escenarios reales más allá de los conjuntos de datos de referencia habituales como COCO o PASCAL VOC.
- Evalúe las capacidades de los modelos de detección de objetos en diversos conjuntos de datos, incluidas áreas especializadas como la sanidad, las imágenes aéreas y los videojuegos.
- Comparar el rendimiento de los modelos con diferentes arquitecturas de redes neuronales y técnicas de optimización.
- Identificar los retos específicos de cada dominio que puedan requerir consejos especializados para el entrenamiento de modelos o enfoques de perfeccionamiento como el aprendizaje por transferencia.
Para obtener más ideas e inspiración sobre aplicaciones reales, explore nuestras guías sobre proyectos prácticos o consulte Ultralytics HUB para agilizar la formación y el despliegue de modelos.
Utilización
El conjunto de datos Roboflow 100, incluidos los metadatos y los enlaces de descarga, está disponible en la web oficial Repositorio GitHub de Roboflow 100. Puede acceder y utilizar el conjunto de datos directamente desde allí para sus necesidades de evaluación comparativa. Ultralytics RF100Benchmark
simplifica el proceso de descarga y preparación de estos conjuntos de datos para su uso con los modelos Ultralytics .
Ejemplos de datos y anotaciones
Roboflow 100 consta de conjuntos de datos con diversas imágenes captadas desde distintos ángulos y dominios. A continuación se muestran ejemplos de imágenes anotadas incluidas en la referencia RF100, que ponen de manifiesto la variedad de objetos y escenas. Técnicas como el aumento de datos pueden mejorar aún más la diversidad durante el entrenamiento.
La diversidad observada en la prueba Roboflow 100 representa un avance significativo con respecto a las pruebas tradicionales, que a menudo se centran en la optimización de una única métrica dentro de un dominio limitado. Este enfoque integral ayuda a desarrollar modelos de visión por ordenador más robustos y versátiles, capaces de obtener buenos resultados en multitud de escenarios diferentes.
Citas y agradecimientos
Si utiliza el conjunto de datos Roboflow 100 en su trabajo de investigación o desarrollo, cite el artículo original:
Extendemos nuestra gratitud al equipo de Roboflow y a todos los colaboradores por sus importantes esfuerzos en la creación y el mantenimiento del conjunto de datos Roboflow 100 como un valioso recurso para la comunidad de visión por ordenador.
Si está interesado en explorar más conjuntos de datos para mejorar sus proyectos de detección de objetos y aprendizaje automático, no dude en visitar nuestra completa colección de conjuntos de datos, que incluye una gran variedad de otros conjuntos de datos de detección.
PREGUNTAS FRECUENTES
¿Qué es el conjunto de datos Roboflow 100 y por qué es importante para la detección de objetos?
El conjunto de datos Roboflow 100 es una referencia para los modelos de detección de objetos. Se compone de 100 conjuntos de datos diversos procedentes de Roboflow Universe, que abarcan ámbitos como la asistencia sanitaria, las imágenes aéreas y los videojuegos. Su importancia radica en que proporciona una forma estandarizada de probar la adaptabilidad y robustez de los modelos en una amplia gama de escenarios del mundo real, yendo más allá de los puntos de referencia tradicionales, a menudo limitados por el dominio.
¿Qué ámbitos abarca el conjunto de datos Roboflow 100?
El conjunto de datos Roboflow 100 abarca siete ámbitos distintos, lo que plantea retos únicos para los modelos de detección de objetos:
- Aéreas: 7 conjuntos de datos (por ejemplo, imágenes por satélite, vistas de drones).
- Videojuegos: 7 conjuntos de datos (por ejemplo, objetos de diversos entornos de juego).
- Microscópico: 11 conjuntos de datos (por ejemplo, células, partículas).
- Bajo el agua: 5 conjuntos de datos (por ejemplo, vida marina, objetos sumergidos).
- Documentos: 8 conjuntos de datos (por ejemplo, regiones de texto, elementos de formularios).
- Electromagnética: 12 conjuntos de datos (por ejemplo, firmas de radar, visualizaciones de datos espectrales).
- Mundo real: 50 conjuntos de datos (una amplia categoría que incluye objetos cotidianos, escenas, comercios, etc.).
Esta variedad hace de RF100 un recurso excelente para evaluar la generalizabilidad de los modelos de visión por ordenador.
¿Qué debo incluir al citar el conjunto de datos Roboflow 100 en mi investigación?
Cuando utilice el conjunto de datos Roboflow 100, cite el artículo original para dar crédito a los creadores. Esta es la cita BibTeX recomendada:
Para más información, visite nuestra completa colección de conjuntos de datos o consulte otros conjuntos de datos de detección compatibles con los modelos de Ultralytics .