Referans için ultralytics/models/sam/modules/decoders.py
Not
Bu dosya https://github.com/ultralytics/ultralytics/blob/main/ ultralytics/models/ sam/modules/decoders .py adresinde mevcuttur. Bir sorun tespit ederseniz lütfen bir Çekme İsteği 🛠️ ile katkıda bulunarak düzeltilmesine yardımcı olun. Teşekkürler 🙏!
ultralytics.models.sam.modules.decoders.MaskDecoder
Üsler: Module
Tahmin etmek için bir dönüştürücü mimarisi kullanarak maskeler ve bunlarla ilişkili kalite puanları üretmek için kod çözücü modülü görüntü ve hızlı gömme verilen maskeler.
Nitelikler:
İsim | Tip | Açıklama |
---|---|---|
transformer_dim |
int
|
Transformatör modülü için kanal boyutu. |
transformer |
Module
|
Maske tahmini için kullanılan transformatör modülü. |
num_multimask_outputs |
int
|
Belirsizleştirici maskeler için tahmin edilecek maske sayısı. |
iou_token |
Embedding
|
IoU belirteci için gömme. |
num_mask_tokens |
int
|
Maske belirteçlerinin sayısı. |
mask_tokens |
Embedding
|
Maske belirteçleri için gömme. |
output_upscaling |
Sequential
|
Çıktıyı yükseltmek için sinir ağı dizisi. |
output_hypernetworks_mlps |
ModuleList
|
Maske oluşturmak için hiper ağ MLP'leri. |
iou_prediction_head |
Module
|
Maske kalitesini tahmin etmek için MLP. |
Kaynak kodu ultralytics/models/sam/modules/decoders.py
12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 |
|
__init__(*, transformer_dim, transformer, num_multimask_outputs=3, activation=nn.GELU, iou_head_depth=3, iou_head_hidden_dim=256)
Bir dönüştürücü mimarisi kullanarak bir görüntü ve istem katıştırmaları verilen maskeleri tahmin eder.
Parametreler:
İsim | Tip | Açıklama | Varsayılan |
---|---|---|---|
transformer_dim |
int
|
transformatör modülünün kanal boyutu |
gerekli |
transformer |
Module
|
maskeleri tahmin etmek için kullanılan transformatör |
gerekli |
num_multimask_outputs |
int
|
maskeleri belirsizleştirirken tahmin edilecek maske sayısı |
3
|
activation |
Module
|
maskeleri yükseltirken kullanılacak etkinleştirme türü |
GELU
|
iou_head_depth |
int
|
maske kalitesini tahmin etmek için kullanılan MLP derinliği |
3
|
iou_head_hidden_dim |
int
|
maske kalitesini tahmin etmek için kullanılan MLP'nin gizli boyutu |
256
|
Kaynak kodu ultralytics/models/sam/modules/decoders.py
forward(image_embeddings, image_pe, sparse_prompt_embeddings, dense_prompt_embeddings, multimask_output)
Görüntü ve istem katıştırmaları verilen maskeleri tahmin edin.
Parametreler:
İsim | Tip | Açıklama | Varsayılan |
---|---|---|---|
image_embeddings |
Tensor
|
görüntü kodlayıcıdan gelen gömüler |
gerekli |
image_pe |
Tensor
|
image_embeddings şekli ile konumsal kodlama |
gerekli |
sparse_prompt_embeddings |
Tensor
|
noktaların ve kutuların gömülmeleri |
gerekli |
dense_prompt_embeddings |
Tensor
|
maske girdilerinin gömülmeleri |
gerekli |
multimask_output |
bool
|
Birden fazla maske mi yoksa tek bir maske mi döndürüleceği. |
gerekli |
İade:
Tip | Açıklama |
---|---|
Tensor
|
torch.Tensor: gruplanmış öngörülen maskeler |
Tensor
|
torch.Tensor: maske kalitesinin toplu tahminleri |
Kaynak kodu ultralytics/models/sam/modules/decoders.py
predict_masks(image_embeddings, image_pe, sparse_prompt_embeddings, dense_prompt_embeddings)
Maskeleri tahmin ediyor.
Daha fazla ayrıntı için 'ileri' bölümüne bakın.
Kaynak kodu ultralytics/models/sam/modules/decoders.py
ultralytics.models.sam.modules.decoders.MLP
Üsler: Module
MLP (Çok Katmanlı Algılayıcı) modelinden hafifçe uyarlanmıştır https://github.com/facebookresearch/MaskFormer/blob/main/mask_former/modeling/transformer/transformer_predictor.py
Kaynak kodu ultralytics/models/sam/modules/decoders.py
__init__(input_dim, hidden_dim, output_dim, num_layers, sigmoid_output=False)
MLP (Çok Katmanlı Algılayıcı) modelini başlatır.
Parametreler:
İsim | Tip | Açıklama | Varsayılan |
---|---|---|---|
input_dim |
int
|
Giriş özelliklerinin boyutluluğu. |
gerekli |
hidden_dim |
int
|
Gizli katmanların boyutluluğu. |
gerekli |
output_dim |
int
|
Çıktı katmanının boyutluluğu. |
gerekli |
num_layers |
int
|
Gizli katman sayısı. |
gerekli |
sigmoid_output |
bool
|
Çıktı katmanına sigmoid aktivasyonu uygular. Varsayılan değer False'dir. |
False
|
Kaynak kodu ultralytics/models/sam/modules/decoders.py
forward(x)
Sinir ağı modülü içinde ileri beslemeyi yürütür ve aktivasyon uygular.