Tài liệu tham khảo cho ultralytics/models/utils/loss.py


Tệp này có sẵn tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/models/utils/loss.py. Nếu bạn phát hiện ra một vấn đề, vui lòng giúp khắc phục nó bằng cách đóng góp Yêu cầu 🛠️ kéo. Cảm ơn bạn 🙏 !


Căn cứ: Module

DETR (DEtection TRansformer) Lớp tổn thất. Lớp này tính toán và trả về các thành phần tổn thất khác nhau cho Mô hình phát hiện đối tượng DETR. Nó tính toán tổn thất phân loại, mất hộp giới hạn, tổn thất GIoU và tùy chọn phụ trợ Thiệt hại.

Thuộc tính:

Tên Kiểu Sự miêu tả
nc int

Số lượng lớp học.

loss_gain dict

Hệ số cho các thành phần tổn thất khác nhau.

aux_loss bool

Có nên tính toán tổn thất phụ trợ hay không.

use_fl bool

Sử dụng FocalLoss hay không.

use_vfl bool

Sử dụng VarifocalLoss hay không.

use_uni_match bool

Có nên sử dụng một lớp cố định để gán nhãn cho nhánh phụ hay không.

uni_match_ind int

Các chỉ số cố định của một lớp để sử dụng nếu use_uni_match là sự thật.

matcher HungarianMatcher

Đối tượng tính toán chi phí và chỉ số phù hợp.

fl FocalLoss or None

Đối tượng Focal Loss nếu use_fl là Đúng, nếu không thì Không có.

vfl VarifocalLoss or None

Đối tượng mất Varifocal nếu use_vfl là Đúng, nếu không thì Không có.

device device

Thiết bị mà tensor được lưu trữ.

__init__(nc=80, loss_gain=None, aux_loss=True, use_fl=True, use_vfl=False, use_uni_match=False, uni_match_ind=0)

Chức năng mất DETR.

Thông số:

Tên Kiểu Sự miêu tả Mặc định
nc int

Số lượng lớp học.

loss_gain dict

Hệ số tổn thất.

aux_loss bool

Nếu 'aux_loss = True', tổn thất ở mỗi lớp bộ giải mã sẽ được sử dụng.

use_vfl bool

Sử dụng VarifocalLoss hay không.

use_uni_match bool

Có nên sử dụng một lớp cố định để gán nhãn cho nhánh phụ hay không.

uni_match_ind int

Các chỉ số cố định của một lớp.

forward(pred_bboxes, pred_scores, batch, postfix='', **kwargs)

Thông số:

Tên Kiểu Sự miêu tả Mặc định
pred_bboxes Tensor

[l, b, truy vấn, 4]

bắt buộc
pred_scores Tensor

[l, b, truy vấn, num_classes]

bắt buộc
batch dict

Một lệnh bao gồm: gt_cls (torch.Tensor) với hình dạng [num_gts, ], gt_bboxes (torch.Tensor): [num_gts, 4], gt_groups (List(int)): danh sách độ dài kích thước lô bao gồm số gts của mỗi hình ảnh.

bắt buộc
postfix str

hậu tố của tên mất.

Căn cứ: DETRLoss

DeepTracker thời gian thực (RT-DETR) Lớp mất phát hiện mở rộng DETRLoss.

Lớp này tính toán tổn thất phát hiện cho RT-DETR mô hình, bao gồm tổn thất phát hiện tiêu chuẩn cũng như một tổn thất đào tạo khử nhiễu bổ sung khi được cung cấp siêu dữ liệu khử nhiễu.

forward(preds, batch, dn_bboxes=None, dn_scores=None, dn_meta=None)

Chuyển tiếp vượt qua để tính toán tổn thất phát hiện.

Thông số:

Tên Kiểu Sự miêu tả Mặc định
preds tuple

Dự đoán các hộp giới hạn và điểm số.

bắt buộc
batch dict

Dữ liệu hàng loạt chứa thông tin sự thật cơ bản.

bắt buộc
dn_bboxes Tensor

Khử nhiễu các hộp giới hạn. Mặc định là Không có.

dn_scores Tensor

Khử nhiễu điểm số. Mặc định là Không có.

dn_meta dict

Siêu dữ liệu để khử nhiễu. Mặc định là Không có.


Trở lại:

Kiểu Sự miêu tả

Từ điển chứa tổng tổn thất và, nếu có, tổn thất khử nhiễu.

get_dn_match_indices(dn_pos_idx, dn_num_group, gt_groups) staticmethod

Nhận các chỉ số phù hợp để khử nhiễu.

Thông số:

Tên Kiểu Sự miêu tả Mặc định
dn_pos_idx List[Tensor]

Danh sách các tensor chứa các chỉ số dương để khử nhiễu.

bắt buộc
dn_num_group int

Số lượng nhóm khử nhiễu.

bắt buộc
gt_groups List[int]

Danh sách các số nguyên đại diện cho số lượng sự thật cơ bản cho mỗi hình ảnh.

bắt buộc

Trở lại:

Kiểu Sự miêu tả

Danh sách các bộ chứa các chỉ số phù hợp để khử nhiễu.

