Référence pour ultralytics/nn/modules/head.py
Note
Ce fichier est disponible à l'adresse https://github.com/ultralytics/ ultralytics/blob/main/ ultralytics/nn/modules/head .py. Si tu repères un problème, aide à le corriger en contribuant à une Pull Request 🛠️. Merci 🙏 !
ultralytics.nn.modules.head.Detect
Bases : Module
YOLOv8 Tête de détection pour les modèles de détection.
Code source dans ultralytics/nn/modules/head.py
__init__(nc=80, ch=())
Initialise la couche de détection YOLOv8 avec le nombre de classes et de canaux spécifié.
Code source dans ultralytics/nn/modules/head.py
bias_init()
Initialise les biais de Detect(), AVERTISSEMENT : nécessite la disponibilité de stride.
Code source dans ultralytics/nn/modules/head.py
decode_bboxes(bboxes, anchors)
forward(x)
Concatène et renvoie les boîtes de délimitation prédites et les probabilités de classe.
Code source dans ultralytics/nn/modules/head.py
ultralytics.nn.modules.head.Segment
Bases : Detect
YOLOv8 Tête de segment pour les modèles de segmentation.
Code source dans ultralytics/nn/modules/head.py
__init__(nc=80, nm=32, npr=256, ch=())
Initialise les attributs du modèle YOLO tels que le nombre de masques, de prototypes et de couches de convolution.
Code source dans ultralytics/nn/modules/head.py
forward(x)
Renvoie les sorties du modèle et les coefficients du masque en cas d'entraînement, sinon renvoie les sorties et les coefficients du masque.
Code source dans ultralytics/nn/modules/head.py
ultralytics.nn.modules.head.OBB
Bases : Detect
YOLOv8 Tête de détection OBB pour la détection avec des modèles de rotation.
Code source dans ultralytics/nn/modules/head.py
__init__(nc=80, ne=1, ch=())
Initialise l'OBB avec un certain nombre de classes nc
et les canaux de la couche ch
.
Code source dans ultralytics/nn/modules/head.py
decode_bboxes(bboxes, anchors)
forward(x)
Concatène et renvoie les boîtes de délimitation prédites et les probabilités de classe.
Code source dans ultralytics/nn/modules/head.py
ultralytics.nn.modules.head.Pose
Bases : Detect
YOLOv8 Tête de pose pour les modèles à points clés.
Code source dans ultralytics/nn/modules/head.py
__init__(nc=80, kpt_shape=(17, 3), ch=())
Initialise le réseau YOLO avec les paramètres par défaut et les couches convolutives.
Code source dans ultralytics/nn/modules/head.py
forward(x)
Effectue une passe avant à travers le modèle YOLO et renvoie les prédictions.
Code source dans ultralytics/nn/modules/head.py
kpts_decode(bs, kpts)
Décode les points clés.
Code source dans ultralytics/nn/modules/head.py
ultralytics.nn.modules.head.Classify
Bases : Module
YOLOv8 de classification, c'est-Ă -dire x(b,c1,20,20) Ă x(b,c2).
Code source dans ultralytics/nn/modules/head.py
__init__(c1, c2, k=1, s=1, p=None, g=1)
Initialise la tête de classification YOLOv8 avec les canaux d'entrée et de sortie spécifiés, la taille du noyau, le stride, padding, et les groupes.
Code source dans ultralytics/nn/modules/head.py
forward(x)
Effectue une passe avant du modèle YOLO sur les données de l'image d'entrée.
Code source dans ultralytics/nn/modules/head.py
ultralytics.nn.modules.head.WorldDetect
Bases : Detect
Code source dans ultralytics/nn/modules/head.py
__init__(nc=80, embed=512, with_bn=False, ch=())
Initialise la couche de détection YOLOv8 avec nc classes et les canaux de la couche ch.
Code source dans ultralytics/nn/modules/head.py
bias_init()
Initialise les biais de Detect(), AVERTISSEMENT : nécessite la disponibilité de stride.
Code source dans ultralytics/nn/modules/head.py
forward(x, text)
Concatène et renvoie les boîtes de délimitation prédites et les probabilités de classe.
Code source dans ultralytics/nn/modules/head.py
ultralytics.nn.modules.head.RTDETRDecoder
Bases : Module
Module de décodage de transformateurs déformables en temps réel (RTDETRDecoder) pour la détection d'objets.
Ce module de décodage utilise l'architecture Transformer ainsi que des convolutions déformables pour prédire les boîtes de délimitation et les étiquettes de classe pour les objets dans l'image. et les étiquettes de classe pour les objets d'une image. Il intègre les caractéristiques de plusieurs couches et passe par une série de couches de décodeur Transformer pour produire les prédictions finales. couches du décodeur Transformer pour produire les prédictions finales.
Code source dans ultralytics/nn/modules/head.py
261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 |
|
__init__(nc=80, ch=(512, 1024, 2048), hd=256, nq=300, ndp=4, nh=8, ndl=6, d_ffn=1024, dropout=0.0, act=nn.ReLU(), eval_idx=-1, nd=100, label_noise_ratio=0.5, box_noise_scale=1.0, learnt_init_query=False)
Initialise le module RTDETRDecoder avec les paramètres donnés.
Paramètres :
Nom | Type | Description | DĂ©faut |
---|---|---|---|
nc |
int
|
Nombre de classes. La valeur par défaut est 80. |
80
|
ch |
tuple
|
Canaux dans les cartes de caractéristiques de l'épine dorsale. La valeur par défaut est (512, 1024, 2048). |
(512, 1024, 2048)
|
hd |
int
|
Dimension des couches cachées. La valeur par défaut est 256. |
256
|
nq |
int
|
Nombre de points d'interrogation. La valeur par défaut est 300. |
300
|
ndp |
int
|
Nombre de points de décodage. La valeur par défaut est 4. |
4
|
nh |
int
|
Nombre de têtes dans l'attention à plusieurs têtes. La valeur par défaut est 8. |
8
|
ndl |
int
|
Nombre de couches du décodeur. La valeur par défaut est 6. |
6
|
d_ffn |
int
|
Dimension des réseaux de type "feed-forward". La valeur par défaut est 1024. |
1024
|
dropout |
float
|
Taux d'abandon. La valeur par défaut est 0. |
0.0
|
act |
Module
|
Fonction d'activation. La valeur par défaut est nn.ReLU. |
ReLU()
|
eval_idx |
int
|
Indice d'évaluation. La valeur par défaut est -1. |
-1
|
nd |
int
|
Nombre de débruitages. La valeur par défaut est 100. |
100
|
label_noise_ratio |
float
|
Rapport de bruit de l'étiquette. La valeur par défaut est 0,5. |
0.5
|
box_noise_scale |
float
|
Échelle de bruit de la boîte. La valeur par défaut est 1,0. |
1.0
|
learnt_init_query |
bool
|
Si l'on doit apprendre les enchâssements initiaux de la requête. La valeur par défaut est False. |
False
|
Code source dans ultralytics/nn/modules/head.py
272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 |
|
forward(x, batch=None)
Exécute la passe avant du module, en renvoyant la boîte englobante et les scores de classification pour l'entrée.