Referencia para ultralytics/nn/tasks.py
Nota
Este archivo está disponible en https://github.com/ultralytics/ ultralytics/blob/main/ ultralytics/nn/tasks .py. Si detectas algún problema, por favor, ayuda a solucionarlo contribuyendo con una Pull Request 🛠️. ¡Gracias 🙏!
ultralytics.nn.tasks.BaseModel
Bases: Module
La clase BaseModel sirve de clase base para todos los modelos de la familia Ultralytics YOLO .
Código fuente en ultralytics/nn/tasks.py
74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 |
|
forward(x, *args, **kwargs)
Paso adelante del modelo en una sola escala. Envoltorio para _forward_once
método.
Parámetros:
Nombre | Tipo | Descripción | Por defecto |
---|---|---|---|
x |
Tensor | dict
|
La imagen de entrada tensor o un dict que incluya la imagen tensor y etiquetas gt. |
necesario |
Devuelve:
Tipo | Descripción |
---|---|
Tensor
|
La salida de la red. |
Código fuente en ultralytics/nn/tasks.py
fuse(verbose=True)
Fusiona el Conv2d()
y BatchNorm2d()
capas del modelo en una sola capa, para mejorar la
eficacia del cálculo.
Devuelve:
Tipo | Descripción |
---|---|
Module
|
Se devuelve el modelo fusionado. |
Código fuente en ultralytics/nn/tasks.py
info(detailed=False, verbose=True, imgsz=640)
Imprime la información del modelo.
Parámetros:
Nombre | Tipo | Descripción | Por defecto |
---|---|---|---|
detailed |
bool
|
si es Verdadero, imprime información detallada sobre el modelo. Por defecto es Falso |
False
|
verbose |
bool
|
si es True, imprime la información del modelo. Por defecto es Falso |
True
|
imgsz |
int
|
El tamaño de la imagen sobre la que se entrenará el modelo. Por defecto es 640 |
640
|
Código fuente en ultralytics/nn/tasks.py
init_criterion()
is_fused(thresh=10)
Comprueba si el modelo tiene menos de un determinado umbral de capas BatchNorm.
Parámetros:
Nombre | Tipo | Descripción | Por defecto |
---|---|---|---|
thresh |
int
|
El número umbral de capas BatchNorm. Por defecto es 10. |
10
|
Devuelve:
Tipo | Descripción |
---|---|
bool
|
Verdadero si el número de capas BatchNorm del modelo es inferior al umbral, Falso en caso contrario. |
Código fuente en ultralytics/nn/tasks.py
load(weights, verbose=True)
Carga los pesos en el modelo.
Parámetros:
Nombre | Tipo | Descripción | Por defecto |
---|---|---|---|
weights |
dict | Module
|
Los pesos preentrenados que se van a cargar. |
necesario |
verbose |
bool
|
Si se registra el progreso de la transferencia. Por defecto es Verdadero. |
True
|
Código fuente en ultralytics/nn/tasks.py
loss(batch, preds=None)
Calcula la pérdida.
Parámetros:
Nombre | Tipo | Descripción | Por defecto |
---|---|---|---|
batch |
dict
|
Lote para calcular la pérdida en |
necesario |
preds |
Tensor | List[Tensor]
|
Predicciones. |
None
|
Código fuente en ultralytics/nn/tasks.py
predict(x, profile=False, visualize=False, augment=False, embed=None)
Realiza una pasada hacia delante por la red.
Parámetros:
Nombre | Tipo | Descripción | Por defecto |
---|---|---|---|
x |
Tensor
|
La entrada tensor al modelo. |
necesario |
profile |
bool
|
Imprime el tiempo de cálculo de cada capa si es Verdadero, por defecto es Falso. |
False
|
visualize |
bool
|
Guarda los mapas de características del modelo si es Verdadero, por defecto es Falso. |
False
|
augment |
bool
|
Aumentar la imagen durante la predicción, por defecto Falso. |
False
|
embed |
list
|
Una lista de vectores/incrustaciones de rasgos a devolver. |
None
|
Devuelve:
Tipo | Descripción |
---|---|
Tensor
|
La última salida del modelo. |
Código fuente en ultralytics/nn/tasks.py
ultralytics.nn.tasks.DetectionModel
Bases: BaseModel
YOLOv8 modelo de detección.
Código fuente en ultralytics/nn/tasks.py
__init__(cfg='yolov8n.yaml', ch=3, nc=None, verbose=True)
Inicializa el modelo de detección YOLOv8 con la configuración y los parámetros dados.
Código fuente en ultralytics/nn/tasks.py
ultralytics.nn.tasks.OBBModel
Bases: DetectionModel
YOLOv8 Modelo de caja delimitadora orientada (OBB).
Código fuente en ultralytics/nn/tasks.py
__init__(cfg='yolov8n-obb.yaml', ch=3, nc=None, verbose=True)
Inicializa el modelo YOLOv8 OBB con la configuración y los parámetros dados.
ultralytics.nn.tasks.SegmentationModel
Bases: DetectionModel
YOLOv8 modelo de segmentación.
Código fuente en ultralytics/nn/tasks.py
__init__(cfg='yolov8n-seg.yaml', ch=3, nc=None, verbose=True)
Inicializa el modelo de segmentación YOLOv8 con la configuración y los parámetros dados.
ultralytics.nn.tasks.PoseModel
Bases: DetectionModel
YOLOv8 modelo de pose.
Código fuente en ultralytics/nn/tasks.py
__init__(cfg='yolov8n-pose.yaml', ch=3, nc=None, data_kpt_shape=(None, None), verbose=True)
Inicializa el modelo YOLOv8 Pose.
Código fuente en ultralytics/nn/tasks.py
ultralytics.nn.tasks.ClassificationModel
Bases: BaseModel
YOLOv8 modelo de clasificación.
Código fuente en ultralytics/nn/tasks.py
__init__(cfg='yolov8n-cls.yaml', ch=3, nc=None, verbose=True)
Init ClassificationModel con YAML, canales, número de clases, bandera verbose.
init_criterion()
reshape_outputs(model, nc)
staticmethod
Actualiza un modelo de clasificación de TorchVision al recuento de clases 'n' si es necesario.
Código fuente en ultralytics/nn/tasks.py
ultralytics.nn.tasks.RTDETRDetectionModel
Bases: DetectionModel
Clase de modelo de detección RTDETR (Detección y seguimiento en tiempo real mediante transformadores).
Esta clase se encarga de construir la arquitectura RTDETR, definir las funciones de pérdida y facilitar tanto los procesos de entrenamiento e inferencia. RTDETR es un modelo de detección y seguimiento de objetos que se extiende a partir de la clase base DetectionModel.
Atributos:
Nombre | Tipo | Descripción |
---|---|---|
cfg |
str
|
La ruta del archivo de configuración o cadena preestablecida. Por defecto es 'rtdetr-l.yaml'. |
ch |
int
|
Número de canales de entrada. Por defecto es 3 (RGB). |
nc |
int
|
Número de clases para la detección de objetos. Por defecto es Ninguno. |
verbose |
bool
|
Especifica si se muestran las estadísticas de resumen durante la inicialización. Por defecto es Verdadero. |
Métodos:
Nombre | Descripción |
---|---|
init_criterion |
Inicializa el criterio utilizado para el cálculo de las pérdidas. |
loss |
Calcula y devuelve la pérdida durante el entrenamiento. |
predict |
Realiza una pasada hacia delante por la red y devuelve la salida. |
Código fuente en ultralytics/nn/tasks.py
441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 547 548 549 550 551 552 553 554 555 |
|
__init__(cfg='rtdetr-l.yaml', ch=3, nc=None, verbose=True)
Inicializa el RTDETRDetectionModel.
Parámetros:
Nombre | Tipo | Descripción | Por defecto |
---|---|---|---|
cfg |
str
|
Nombre o ruta del archivo de configuración. |
'rtdetr-l.yaml'
|
ch |
int
|
Número de canales de entrada. |
3
|
nc |
int
|
Número de clases. Por defecto es Ninguno. |
None
|
verbose |
bool
|
Imprime información adicional durante la inicialización. Por defecto es Verdadero. |
True
|
Código fuente en ultralytics/nn/tasks.py
init_criterion()
Inicializa el criterio de pérdida para el RTDETRDetectionModel.
loss(batch, preds=None)
Calcula la pérdida del lote de datos dado.
Parámetros:
Nombre | Tipo | Descripción | Por defecto |
---|---|---|---|
batch |
dict
|
Diccionario que contiene los datos de la imagen y la etiqueta. |
necesario |
preds |
Tensor
|
Predicciones precalculadas del modelo. Por defecto es Ninguno. |
None
|
Devuelve:
Tipo | Descripción |
---|---|
tuple
|
Una tupla que contiene la pérdida total y las tres pérdidas principales en un tensor. |
Código fuente en ultralytics/nn/tasks.py
predict(x, profile=False, visualize=False, batch=None, augment=False, embed=None)
Realiza una pasada hacia delante a través del modelo.
Parámetros:
Nombre | Tipo | Descripción | Por defecto |
---|---|---|---|
x |
Tensor
|
La entrada tensor. |
necesario |
profile |
bool
|
Si es Verdadero, perfila el tiempo de cálculo de cada capa. Por defecto es Falso. |
False
|
visualize |
bool
|
Si es Verdadero, guarda los mapas de características para su visualización. Por defecto es Falso. |
False
|
batch |
dict
|
Datos reales para la evaluación. Por defecto es Ninguno. |
None
|
augment |
bool
|
Si es Verdadero, realiza el aumento de datos durante la inferencia. Por defecto es Falso. |
False
|
embed |
list
|
Una lista de vectores/incrustaciones de rasgos a devolver. |
None
|
Devuelve:
Tipo | Descripción |
---|---|
Tensor
|
Salida del modelo tensor. |
Código fuente en ultralytics/nn/tasks.py
ultralytics.nn.tasks.WorldModel
Bases: DetectionModel
YOLOv8 Modelo mundial.
Código fuente en ultralytics/nn/tasks.py
558 559 560 561 562 563 564 565 566 567 568 569 570 571 572 573 574 575 576 577 578 579 580 581 582 583 584 585 586 587 588 589 590 591 592 593 594 595 596 597 598 599 600 601 602 603 604 605 606 607 608 609 610 611 612 613 614 615 616 617 618 619 620 621 622 623 624 625 626 627 628 629 630 631 632 633 634 635 636 637 638 639 640 641 642 643 644 |
|
__init__(cfg='yolov8s-world.yaml', ch=3, nc=None, verbose=True)
Inicializa el modelo del mundo YOLOv8 con la configuración y los parámetros dados.
Código fuente en ultralytics/nn/tasks.py
loss(batch, preds=None)
Calcula la pérdida.
Parámetros:
Nombre | Tipo | Descripción | Por defecto |
---|---|---|---|
batch |
dict
|
Lote para calcular la pérdida. |
necesario |
preds |
Tensor | List[Tensor]
|
Predicciones. |
None
|
Código fuente en ultralytics/nn/tasks.py
predict(x, profile=False, visualize=False, txt_feats=None, augment=False, embed=None)
Realiza una pasada hacia delante a través del modelo.
Parámetros:
Nombre | Tipo | Descripción | Por defecto |
---|---|---|---|
x |
Tensor
|
La entrada tensor. |
necesario |
profile |
bool
|
Si es Verdadero, perfila el tiempo de cálculo de cada capa. Por defecto es Falso. |
False
|
visualize |
bool
|
Si es Verdadero, guarda los mapas de características para su visualización. Por defecto es Falso. |
False
|
txt_feats |
Tensor
|
Las características del texto, úsalo si se da. Por defecto es Ninguno. |
None
|
augment |
bool
|
Si es Verdadero, realiza el aumento de datos durante la inferencia. Por defecto es Falso. |
False
|
embed |
list
|
Una lista de vectores/incrustaciones de rasgos a devolver. |
None
|
Devuelve:
Tipo | Descripción |
---|---|
Tensor
|
Salida del modelo tensor. |
Código fuente en ultralytics/nn/tasks.py
set_classes(text, batch=80, cache_clip_model=True)
Establece las clases de antemano para que el modelo pueda hacer inferencias fuera de línea sin recortar el modelo.
Código fuente en ultralytics/nn/tasks.py
ultralytics.nn.tasks.Ensemble
Bases: ModuleList
Conjunto de modelos.
Código fuente en ultralytics/nn/tasks.py
__init__()
forward(x, augment=False, profile=False, visualize=False)
La función genera la capa final de la red YOLO .
Código fuente en ultralytics/nn/tasks.py
ultralytics.nn.tasks.temporary_modules(modules=None)
Gestor de contexto para añadir o modificar temporalmente módulos en la caché de módulos de Python(sys.modules
).
Esta función puede utilizarse para cambiar las rutas de los módulos durante el tiempo de ejecución. Es útil cuando se refactoriza código en el que has movido un módulo de una ubicación a otra, pero aún quieres mantener las antiguas rutas de importación por compatibilidad con versiones anteriores.
Parámetros:
Nombre | Tipo | Descripción | Por defecto |
---|---|---|---|
modules |
dict
|
Un diccionario que asigna rutas de módulos antiguos a rutas de módulos nuevos. |
None
|
Ejemplo
Nota
Los cambios sólo tienen efecto dentro del gestor de contextos y se deshacen una vez que sale el gestor de contextos.
Ten en cuenta que manipular directamente sys.modules
puede dar lugar a resultados impredecibles, especialmente en grandes
aplicaciones o bibliotecas. Utiliza esta función con precaución.
Código fuente en ultralytics/nn/tasks.py
ultralytics.nn.tasks.torch_safe_load(weight)
Esta función intenta cargar un modelo PyTorch con la función torch.load(). Si se produce un error ModuleNotFoundError detecta el error, registra un mensaje de advertencia e intenta instalar el módulo que falta mediante la función check_requirements(). Tras la instalación, la función vuelve a intentar cargar el modelo mediante torch.load().
Parámetros:
Nombre | Tipo | Descripción | Por defecto |
---|---|---|---|
weight |
str
|
La ruta del archivo del modelo PyTorch . |
necesario |
Devuelve:
Tipo | Descripción |
---|---|
dict
|
El modelo PyTorch cargado. |
Código fuente en ultralytics/nn/tasks.py
ultralytics.nn.tasks.attempt_load_weights(weights, device=None, inplace=True, fuse=False)
Carga un conjunto de modelos pesos=[a,b,c] o un único modelo pesos=[a] o pesos=a.
Código fuente en ultralytics/nn/tasks.py
ultralytics.nn.tasks.attempt_load_one_weight(weight, device=None, inplace=True, fuse=False)
Carga un único modelo de pesos.
Código fuente en ultralytics/nn/tasks.py
ultralytics.nn.tasks.parse_model(d, ch, verbose=True)
Convierte un diccionario YOLO model.yaml en un modelo PyTorch .
Código fuente en ultralytics/nn/tasks.py
830 831 832 833 834 835 836 837 838 839 840 841 842 843 844 845 846 847 848 849 850 851 852 853 854 855 856 857 858 859 860 861 862 863 864 865 866 867 868 869 870 871 872 873 874 875 876 877 878 879 880 881 882 883 884 885 886 887 888 889 890 891 892 893 894 895 896 897 898 899 900 901 902 903 904 905 906 907 908 909 910 911 912 913 914 915 916 917 918 919 920 921 922 923 924 925 926 927 928 929 930 931 932 933 934 935 936 937 938 939 940 941 942 |
|
ultralytics.nn.tasks.yaml_model_load(path)
Carga un modelo YOLOv8 desde un archivo YAML.
Código fuente en ultralytics/nn/tasks.py
ultralytics.nn.tasks.guess_model_scale(model_path)
Toma como entrada una ruta al archivo YAML de un modelo YOLO y extrae el carácter de tamaño de la escala del modelo. La función utiliza la concordancia de expresiones regulares para encontrar el patrón de la escala del modelo en el nombre del archivo YAML, que se denota por n, s, m, l o x. La función devuelve el carácter de tamaño de la escala del modelo como una cadena.
Parámetros:
Nombre | Tipo | Descripción | Por defecto |
---|---|---|---|
model_path |
str | Path
|
La ruta al archivo YAML del modelo YOLO . |
necesario |
Devuelve:
Tipo | Descripción |
---|---|
str
|
El carácter de tamaño de la escala del modelo, que puede ser n, s, m, l o x. |
Código fuente en ultralytics/nn/tasks.py
ultralytics.nn.tasks.guess_model_task(model)
Adivina la tarea de un modelo PyTorch a partir de su arquitectura o configuración.
Parámetros:
Nombre | Tipo | Descripción | Por defecto |
---|---|---|---|
model |
Module | dict
|
PyTorch modelo o configuración del modelo en formato YAML. |
necesario |
Devuelve:
Tipo | Descripción |
---|---|
str
|
Tarea del modelo ("detectar", "segmentar", "clasificar", "plantear"). |
Aumenta:
Tipo | Descripción |
---|---|
SyntaxError
|
Si no se pudo determinar la tarea del modelo. |
Código fuente en ultralytics/nn/tasks.py
982 983 984 985 986 987 988 989 990 991 992 993 994 995 996 997 998 999 1000 1001 1002 1003 1004 1005 1006 1007 1008 1009 1010 1011 1012 1013 1014 1015 1016 1017 1018 1019 1020 1021 1022 1023 1024 1025 1026 1027 1028 1029 1030 1031 1032 1033 1034 1035 1036 1037 1038 1039 1040 1041 1042 1043 1044 1045 1046 1047 1048 1049 1050 1051 1052 1053 1054 1055 |
|