Bỏ để qua phần nội dung

Tài liệu tham khảo cho ultralytics/models/yolo/classify/predict.py

Ghi

Tệp này có sẵn tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/Mô hình/yolo/phân loại/predict.py. Nếu bạn phát hiện ra một vấn đề, vui lòng giúp khắc phục nó bằng cách đóng góp Yêu cầu 🛠️ kéo. Cảm ơn bạn 🙏 !ultralytics.models.yolo.classify.predict.ClassificationPredictor

Căn cứ: BasePredictor

Một lớp mở rộng lớp BasePredictor để dự đoán dựa trên mô hình phân loại.

Ghi chú
 • Các mô hình phân loại Torchvision cũng có thể được chuyển đến đối số 'model', tức là model = 'resnet18'.
Ví dụ
from ultralytics.utils import ASSETS
from ultralytics.models.yolo.classify import ClassificationPredictor

args = dict(model='yolov8n-cls.pt', source=ASSETS)
predictor = ClassificationPredictor(overrides=args)
predictor.predict_cli()
Mã nguồn trong ultralytics/models/yolo/classify/predict.py
class ClassificationPredictor(BasePredictor):
  """
  A class extending the BasePredictor class for prediction based on a classification model.

  Notes:
    - Torchvision classification models can also be passed to the 'model' argument, i.e. model='resnet18'.

  Example:
    ```python
    from ultralytics.utils import ASSETS
    from ultralytics.models.yolo.classify import ClassificationPredictor

    args = dict(model='yolov8n-cls.pt', source=ASSETS)
    predictor = ClassificationPredictor(overrides=args)
    predictor.predict_cli()
    ```
  """

  def __init__(self, cfg=DEFAULT_CFG, overrides=None, _callbacks=None):
    """Initializes ClassificationPredictor setting the task to 'classify'."""
    super().__init__(cfg, overrides, _callbacks)
    self.args.task = "classify"
    self._legacy_transform_name = "ultralytics.yolo.data.augment.ToTensor"

  def preprocess(self, img):
    """Converts input image to model-compatible data type."""
    if not isinstance(img, torch.Tensor):
      is_legacy_transform = any(
        self._legacy_transform_name in str(transform) for transform in self.transforms.transforms
      )
      if is_legacy_transform: # to handle legacy transforms
        img = torch.stack([self.transforms(im) for im in img], dim=0)
      else:
        img = torch.stack(
          [self.transforms(Image.fromarray(cv2.cvtColor(im, cv2.COLOR_BGR2RGB))) for im in img], dim=0
        )
    img = (img if isinstance(img, torch.Tensor) else torch.from_numpy(img)).to(self.model.device)
    return img.half() if self.model.fp16 else img.float() # uint8 to fp16/32

  def postprocess(self, preds, img, orig_imgs):
    """Post-processes predictions to return Results objects."""
    if not isinstance(orig_imgs, list): # input images are a torch.Tensor, not a list
      orig_imgs = ops.convert_torch2numpy_batch(orig_imgs)

    results = []
    for i, pred in enumerate(preds):
      orig_img = orig_imgs[i]
      img_path = self.batch[0][i]
      results.append(Results(orig_img, path=img_path, names=self.model.names, probs=pred))
    return results

__init__(cfg=DEFAULT_CFG, overrides=None, _callbacks=None)

Khởi tạo ClassificationPredictor đặt tác vụ thành 'phân loại'.

Mã nguồn trong ultralytics/models/yolo/classify/predict.py
def __init__(self, cfg=DEFAULT_CFG, overrides=None, _callbacks=None):
  """Initializes ClassificationPredictor setting the task to 'classify'."""
  super().__init__(cfg, overrides, _callbacks)
  self.args.task = "classify"
  self._legacy_transform_name = "ultralytics.yolo.data.augment.ToTensor"

postprocess(preds, img, orig_imgs)

Dự đoán sau xử lý để trả về các đối tượng Kết quả.

Mã nguồn trong ultralytics/models/yolo/classify/predict.py
def postprocess(self, preds, img, orig_imgs):
  """Post-processes predictions to return Results objects."""
  if not isinstance(orig_imgs, list): # input images are a torch.Tensor, not a list
    orig_imgs = ops.convert_torch2numpy_batch(orig_imgs)

  results = []
  for i, pred in enumerate(preds):
    orig_img = orig_imgs[i]
    img_path = self.batch[0][i]
    results.append(Results(orig_img, path=img_path, names=self.model.names, probs=pred))
  return results

preprocess(img)

Chuyển đổi hình ảnh đầu vào thành kiểu dữ liệu tương thích với mô hình.

Mã nguồn trong ultralytics/models/yolo/classify/predict.py
def preprocess(self, img):
  """Converts input image to model-compatible data type."""
  if not isinstance(img, torch.Tensor):
    is_legacy_transform = any(
      self._legacy_transform_name in str(transform) for transform in self.transforms.transforms
    )
    if is_legacy_transform: # to handle legacy transforms
      img = torch.stack([self.transforms(im) for im in img], dim=0)
    else:
      img = torch.stack(
        [self.transforms(Image.fromarray(cv2.cvtColor(im, cv2.COLOR_BGR2RGB))) for im in img], dim=0
      )
  img = (img if isinstance(img, torch.Tensor) else torch.from_numpy(img)).to(self.model.device)
  return img.half() if self.model.fp16 else img.float() # uint8 to fp16/32

Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (5), Burhan-Q (1)