predict.py`#

Improvements

This page is sourced from https://github.com/ultralytics/ultralytics/blob/main/ultralytics/models/sam/predict.py. Have an improvement or example to add? Open a Pull Request — thank you! 🙏

Summary

Predictor
SAM2Predictor
SAM2VideoPredictor
SAM2DynamicInteractivePredictor
SAM3Predictor
SAM3SemanticPredictor
SAM3VideoPredictor
SAM3VideoSemanticPredictor

Link to this sectionClass `ultralytics.models.sam.predict.Predictor`#

Predictor(self, cfg = DEFAULT_CFG, overrides = None, _callbacks: dict | None = None)

Bases: BasePredictor

Predictor class for SAM, enabling real-time image segmentation with promptable capabilities.

This class extends BasePredictor and implements the Segment Anything Model (SAM) for advanced image segmentation tasks. It supports various input prompts like points, bounding boxes, and masks for fine-grained control over segmentation results.

Sets up the Predictor object for SAM (Segment Anything Model) and applies any configuration overrides or callbacks provided. Initializes task-specific settings for SAM, such as retina_masks being set to True for optimal results.

Args

Name	Type	Description	Default
`cfg`	`dict`	Configuration dictionary containing default settings.	`DEFAULT_CFG`
`overrides`	`dict	None`	Dictionary of values to override default configuration.
`_callbacks`	`dict	None`	Dictionary of callback functions to customize behavior.

Attributes

Name	Type	Description
`args`	`SimpleNamespace`	Configuration arguments for the predictor.
`model`	`torch.nn.Module`	The loaded SAM model.
`device`	`torch.device`	The device (CPU or GPU) on which the model is loaded.
`im`	`torch.Tensor`	The preprocessed input image.
`features`	`torch.Tensor`	Extracted image features.
`prompts`	`dict[str, Any]`	Dictionary to store various types of prompts (e.g., bboxes, points, masks).
`segment_all`	`bool`	Flag to indicate if full image segmentation should be performed.
`mean`	`torch.Tensor`	Mean values for image normalization.
`std`	`torch.Tensor`	Standard deviation values for image normalization.

Methods

Name	Description
`_inference_features`	Perform inference on image features using the SAM model.
`_prepare_prompts`	Prepare and transform the input prompts for processing based on the destination shape.
`generate`	Perform image segmentation using the Segment Anything Model (SAM).
`get_im_features`	Extract image features using the SAM model's image encoder for subsequent mask prediction.
`get_model`	Retrieve or build the Segment Anything Model (SAM) for image segmentation tasks.
`inference`	Perform image segmentation inference based on the given input cues, using the currently loaded image.
`inference_features`	Perform prompts preprocessing and inference on provided image features using the SAM model.
`postprocess`	Post-process SAM's inference outputs to generate object detection masks and bounding boxes.
`pre_transform`	Perform initial transformations on the input image for preprocessing.
`preprocess`	Preprocess the input image for model inference.
`prompt_inference`	Perform image segmentation inference based on input cues using SAM's specialized architecture.
`remove_small_regions`	Remove small disconnected regions and holes from segmentation masks.
`reset_image`	Reset the current image and its features, clearing them for subsequent inference.
`set_image`	Preprocess and set a single image for inference.
`set_prompts`	Set prompts for subsequent inference operations.
`setup_model`	Initialize the Segment Anything Model (SAM) for inference.
`setup_source`	Set up the data source for SAM inference.

Examples

>>> predictor = Predictor()
>>> predictor.setup_model(model_path="sam_model.pt")
>>> predictor.set_image("image.jpg")
>>> bboxes = [[100, 100, 200, 200]]
>>> results = predictor(bboxes=bboxes)

Source code in ultralytics/models/sam/predict.py

Type	Description
`pred_masks (torch.Tensor)`	Output masks with shape (C, H, W), where C is the number of generated masks.
`pred_scores (torch.Tensor)`	Quality scores for each mask, with length C.

Name	Type	Description	Default
`dst_shape`	`tuple[int, int]`	The target shape (height, width) for the prompts.	required
`src_shape`	`tuple[int, int]`	The source shape (height, width) of the input image.	required
`bboxes`	`np.ndarray	list	None`
`points`	`np.ndarray	list	None`
`labels`	`np.ndarray	list	None`
`masks`	`list[np.ndarray]	np.ndarray	None`

Type	Description
`bboxes (torch.Tensor	None)`
`points (torch.Tensor	None)`
`labels (torch.Tensor	None)`
`masks (torch.Tensor	None)`

Name	Type	Description	Default
`im`	`torch.Tensor`	Input tensor representing the preprocessed image with shape (N, C, H, W).	required
`crop_n_layers`	`int`	Number of layers for additional mask predictions on image crops.	`0`
`crop_overlap_ratio`	`float`	Overlap between crops, scaled down in subsequent layers.	`512 / 1500`
`crop_downscale_factor`	`int`	Scaling factor for sampled points-per-side in each layer.	`1`
`point_grids`	`list[np.ndarray]	None`	Custom grids for point sampling normalized to [0,1].
`points_stride`	`int`	Number of points to sample along each side of the image.	`32`
`points_batch_size`	`int`	Batch size for the number of points processed simultaneously.	`64`
`conf_thres`	`float`	Confidence threshold [0,1] for filtering based on mask quality prediction.	`0.88`
`stability_score_thresh`	`float`	Stability threshold [0,1] for mask filtering based on stability.	`0.95`
`stability_score_offset`	`float`	Offset value for calculating stability score.	`0.95`
`crop_nms_thresh`	`float`	IoU cutoff for NMS to remove duplicate masks between crops.	`0.7`

Link to this sectionReference for ultralytics/models/sam/predict.py#

Link to this sectionClass ultralytics.models.sam.predict.Predictor#

Link to this sectionMethod ultralytics.models.sam.predict.Predictor._inference_features#

Link to this sectionMethod ultralytics.models.sam.predict.Predictor._prepare_prompts#

Link to this sectionMethod ultralytics.models.sam.predict.Predictor.generate#

Link to this sectionMethod ultralytics.models.sam.predict.Predictor.get_im_features#

Link to this sectionMethod ultralytics.models.sam.predict.Predictor.get_model#

Link to this sectionMethod ultralytics.models.sam.predict.Predictor.inference#

Link to this sectionMethod ultralytics.models.sam.predict.Predictor.inference_features#

Link to this sectionMethod ultralytics.models.sam.predict.Predictor.postprocess#

Link to this sectionMethod ultralytics.models.sam.predict.Predictor.pre_transform#

Link to this sectionMethod ultralytics.models.sam.predict.Predictor.preprocess#

Link to this sectionMethod ultralytics.models.sam.predict.Predictor.prompt_inference#

Link to this sectionMethod ultralytics.models.sam.predict.Predictor.remove_small_regions#

Link to this sectionMethod ultralytics.models.sam.predict.Predictor.reset_image#

Link to this sectionMethod ultralytics.models.sam.predict.Predictor.set_image#

Link to this sectionMethod ultralytics.models.sam.predict.Predictor.set_prompts#

Link to this sectionMethod ultralytics.models.sam.predict.Predictor.setup_model#

Link to this sectionMethod ultralytics.models.sam.predict.Predictor.setup_source#

Link to this sectionClass ultralytics.models.sam.predict.SAM2Predictor#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2Predictor._inference_features#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2Predictor._prepare_prompts#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2Predictor.get_im_features#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2Predictor.get_model#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2Predictor.setup_source#

Link to this sectionClass ultralytics.models.sam.predict.SAM2VideoPredictor#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor._add_output_per_object#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor._clear_non_cond_mem_around_input#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor._consolidate_temp_output_across_obj#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor._get_empty_mask_ptr#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor._get_maskmem_pos_enc#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor._init_state#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor._obj_id_to_idx#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor._prune_non_cond_memory#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor._reset_tracking_results#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor._run_memory_encoder#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor._run_single_frame_inference#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor.add_new_prompts#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor.clear_all_points_in_frame#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor.clear_all_points_in_video#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor.get_im_features#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor.get_model#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor.inference#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor.init_state#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor.postprocess#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor.propagate_in_video_preflight#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2VideoPredictor.remove_object#

Link to this sectionClass ultralytics.models.sam.predict.SAM2DynamicInteractivePredictor#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2DynamicInteractivePredictor._obj_id_to_idx#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2DynamicInteractivePredictor._prepare_memory_conditioned_features#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2DynamicInteractivePredictor.get_im_features#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2DynamicInteractivePredictor.get_maskmem_enc#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2DynamicInteractivePredictor.inference#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2DynamicInteractivePredictor.track_step#

Link to this sectionMethod ultralytics.models.sam.predict.SAM2DynamicInteractivePredictor.update_memory#

Link to this sectionClass ultralytics.models.sam.predict.SAM3Predictor#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3Predictor.get_model#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3Predictor.setup_model#

Link to this sectionClass ultralytics.models.sam.predict.SAM3SemanticPredictor#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3SemanticPredictor._get_dummy_prompt#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3SemanticPredictor._inference_features#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3SemanticPredictor._prepare_geometric_prompts#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3SemanticPredictor.get_im_features#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3SemanticPredictor.get_model#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3SemanticPredictor.inference#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3SemanticPredictor.inference_features#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3SemanticPredictor.postprocess#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3SemanticPredictor.pre_transform#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3SemanticPredictor.reset_prompts#

Link to this sectionClass ultralytics.models.sam.predict.SAM3VideoPredictor#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3VideoPredictor.propagate_in_video#

Link to this sectionClass ultralytics.models.sam.predict.SAM3VideoSemanticPredictor#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3VideoSemanticPredictor._apply_object_wise_non_overlapping_constraints#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3VideoSemanticPredictor._associate_det_trk#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3VideoSemanticPredictor._cache_backbone_features#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3VideoSemanticPredictor._det_track_one_frame#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3VideoSemanticPredictor._drop_new_det_with_obj_limit#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3VideoSemanticPredictor._extract_detection_outputs#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3VideoSemanticPredictor._initialize_metadata#

Link to this sectionMethod ultralytics.models.sam.predict.SAM3VideoSemanticPredictor._process_hotstart#

Link to this sectionReference for `ultralytics/models/sam/predict.py`#

Link to this sectionClass `ultralytics.models.sam.predict.Predictor`#

Link to this sectionMethod `ultralytics.models.sam.predict.Predictor._inference_features`#

Link to this sectionMethod `ultralytics.models.sam.predict.Predictor._prepare_prompts`#

Link to this sectionMethod `ultralytics.models.sam.predict.Predictor.generate`#

Link to this sectionMethod `ultralytics.models.sam.predict.Predictor.get_im_features`#

Link to this sectionMethod `ultralytics.models.sam.predict.Predictor.get_model`#

Link to this sectionMethod `ultralytics.models.sam.predict.Predictor.inference`#

Link to this sectionMethod `ultralytics.models.sam.predict.Predictor.inference_features`#

Link to this sectionMethod `ultralytics.models.sam.predict.Predictor.postprocess`#

Link to this sectionMethod `ultralytics.models.sam.predict.Predictor.pre_transform`#

Link to this sectionMethod `ultralytics.models.sam.predict.Predictor.preprocess`#

Link to this sectionMethod `ultralytics.models.sam.predict.Predictor.prompt_inference`#

Link to this sectionMethod `ultralytics.models.sam.predict.Predictor.remove_small_regions`#

Link to this sectionMethod `ultralytics.models.sam.predict.Predictor.reset_image`#

Link to this sectionMethod `ultralytics.models.sam.predict.Predictor.set_image`#

Link to this sectionMethod `ultralytics.models.sam.predict.Predictor.set_prompts`#

Link to this sectionMethod `ultralytics.models.sam.predict.Predictor.setup_model`#

Link to this sectionMethod `ultralytics.models.sam.predict.Predictor.setup_source`#

Link to this sectionClass `ultralytics.models.sam.predict.SAM2Predictor`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2Predictor._inference_features`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2Predictor._prepare_prompts`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2Predictor.get_im_features`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2Predictor.get_model`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2Predictor.setup_source`#

Link to this sectionClass `ultralytics.models.sam.predict.SAM2VideoPredictor`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor._add_output_per_object`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor._clear_non_cond_mem_around_input`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor._consolidate_temp_output_across_obj`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor._get_empty_mask_ptr`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor._get_maskmem_pos_enc`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor._init_state`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor._obj_id_to_idx`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor._prune_non_cond_memory`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor._reset_tracking_results`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor._run_memory_encoder`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor._run_single_frame_inference`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor.add_new_prompts`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor.clear_all_points_in_frame`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor.clear_all_points_in_video`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor.get_im_features`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor.get_model`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor.inference`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor.init_state`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor.postprocess`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor.propagate_in_video_preflight`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2VideoPredictor.remove_object`#

Link to this sectionClass `ultralytics.models.sam.predict.SAM2DynamicInteractivePredictor`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2DynamicInteractivePredictor._obj_id_to_idx`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2DynamicInteractivePredictor._prepare_memory_conditioned_features`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2DynamicInteractivePredictor.get_im_features`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2DynamicInteractivePredictor.get_maskmem_enc`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2DynamicInteractivePredictor.inference`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2DynamicInteractivePredictor.track_step`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM2DynamicInteractivePredictor.update_memory`#

Link to this sectionClass `ultralytics.models.sam.predict.SAM3Predictor`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3Predictor.get_model`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3Predictor.setup_model`#

Link to this sectionClass `ultralytics.models.sam.predict.SAM3SemanticPredictor`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3SemanticPredictor._get_dummy_prompt`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3SemanticPredictor._inference_features`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3SemanticPredictor._prepare_geometric_prompts`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3SemanticPredictor.get_im_features`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3SemanticPredictor.get_model`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3SemanticPredictor.inference`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3SemanticPredictor.inference_features`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3SemanticPredictor.postprocess`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3SemanticPredictor.pre_transform`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3SemanticPredictor.reset_prompts`#

Link to this sectionClass `ultralytics.models.sam.predict.SAM3VideoPredictor`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3VideoPredictor.propagate_in_video`#

Link to this sectionClass `ultralytics.models.sam.predict.SAM3VideoSemanticPredictor`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3VideoSemanticPredictor._apply_object_wise_non_overlapping_constraints`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3VideoSemanticPredictor._associate_det_trk`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3VideoSemanticPredictor._cache_backbone_features`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3VideoSemanticPredictor._det_track_one_frame`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3VideoSemanticPredictor._drop_new_det_with_obj_limit`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3VideoSemanticPredictor._extract_detection_outputs`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3VideoSemanticPredictor._initialize_metadata`#

Link to this sectionMethod `ultralytics.models.sam.predict.SAM3VideoSemanticPredictor._process_hotstart`#