Bỏ để qua phần nội dung

Tài liệu tham khảo cho ultralytics/utils/dist.py

Ghi

Tệp này có sẵn tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/utils/dist.py. Nếu bạn phát hiện ra một vấn đề, vui lòng giúp khắc phục nó bằng cách đóng góp Yêu cầu 🛠️ kéo. Cảm ơn bạn 🙏 !ultralytics.utils.dist.find_free_network_port()

Tìm một cổng miễn phí trên localhost.

Nó rất hữu ích trong đào tạo một nút khi chúng ta không muốn kết nối với một nút chính thực sự mà phải đặt MASTER_PORT biến môi trường.

Mã nguồn trong ultralytics/utils/dist.py
def find_free_network_port() -> int:
  """
  Finds a free port on localhost.

  It is useful in single-node training when we don't want to connect to a real main node but have to set the
  `MASTER_PORT` environment variable.
  """
  with socket.socket(socket.AF_INET, socket.SOCK_STREAM) as s:
    s.bind(("127.0.0.1", 0))
    return s.getsockname()[1] # portultralytics.utils.dist.generate_ddp_file(trainer)

Tạo tệp DDP và trả về tên tệp của nó.

Mã nguồn trong ultralytics/utils/dist.py
def generate_ddp_file(trainer):
  """Generates a DDP file and returns its file name."""
  module, name = f"{trainer.__class__.__module__}.{trainer.__class__.__name__}".rsplit(".", 1)

  content = f"""
# Ultralytics Multi-GPU training temp file (should be automatically deleted after use)
overrides = {vars(trainer.args)}

if __name__ == "__main__":
  from {module} import {name}
  from ultralytics.utils import DEFAULT_CFG_DICT

  cfg = DEFAULT_CFG_DICT.copy()
  cfg.update(save_dir='')  # handle the extra key 'save_dir'
  trainer = {name}(cfg=cfg, overrides=overrides)
  results = trainer.train()
"""
  (USER_CONFIG_DIR / "DDP").mkdir(exist_ok=True)
  with tempfile.NamedTemporaryFile(
    prefix="_temp_",
    suffix=f"{id(trainer)}.py",
    mode="w+",
    encoding="utf-8",
    dir=USER_CONFIG_DIR / "DDP",
    delete=False,
  ) as file:
    file.write(content)
  return file.nameultralytics.utils.dist.generate_ddp_command(world_size, trainer)

Tạo và trả về lệnh cho đào tạo phân tán.

Mã nguồn trong ultralytics/utils/dist.py
def generate_ddp_command(world_size, trainer):
  """Generates and returns command for distributed training."""
  import __main__ # noqa local import to avoid https://github.com/Lightning-AI/lightning/issues/15218

  if not trainer.resume:
    shutil.rmtree(trainer.save_dir) # remove the save_dir
  file = generate_ddp_file(trainer)
  dist_cmd = "torch.distributed.run" if TORCH_1_9 else "torch.distributed.launch"
  port = find_free_network_port()
  cmd = [sys.executable, "-m", dist_cmd, "--nproc_per_node", f"{world_size}", "--master_port", f"{port}", file]
  return cmd, fileultralytics.utils.dist.ddp_cleanup(trainer, file)

Xóa tệp tạm thời nếu được tạo.

Mã nguồn trong ultralytics/utils/dist.py
def ddp_cleanup(trainer, file):
  """Delete temp file if created."""
  if f"{id(trainer)}.py" in file: # if temp_file suffix in file
    os.remove(file)

Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (5), Burhan-Q (1), Laughing-q (1)