跳至内容

掌握YOLOv5 在Google 平台 (GCP) 深度学习虚拟机上的部署

踏上人工智能和机器学习的征程是令人振奋的,尤其是当您利用云平台的强大功能和灵活性时。Google 平台(GCP)为机器学习爱好者和专业人士提供了强大的工具。深度学习虚拟机就是这样一款工具,它为数据科学和 ML 任务进行了预配置。在本教程中,我们将介绍如何设置 YOLOv5的过程。无论您是初次接触 ML,还是经验丰富的实践者,本指南都将为您提供一条清晰的路径,帮助您实现由YOLOv5 支持的对象检测模型。

🆓 另外,如果您是 GCP 的新用户,您将有幸获得 300 美元的免费信用额度来启动您的项目。

除 GCP 外,还可探索YOLOv5 的其他可访问的快速入门选项,如我们的 Google Colab 笔记本 在 Colab 中打开 基于浏览器的体验,或 亚马逊 AWS.此外,容器爱好者还可以在以下网址使用我们的官方 Docker 镜像 Docker Hub Docker 拉动 用于封装环境。

第 1 步:创建和配置深度学习虚拟机

首先,让我们创建一个针对深度学习进行调整的虚拟机:

  1. 前往GCP 市场,选择深度学习虚拟机
  2. 选择n1-standard-8实例;它提供 8 个 vCPU 和 30 GB 内存,非常适合我们的需求。
  3. 接下来,选择GPU 。这取决于您的工作量;即使是像 T4 这样的基本型号,也会明显加快模型训练速度。
  4. 勾选 "首次启动时自动安装NVIDIA GPU 驱动程序?"复选框,即可轻松完成安装。
  5. 分配一个 300 GB SSD 持久磁盘,确保不会出现 I/O 操作瓶颈。
  6. 点击 "部署",让 GCP 发挥它的魔力,配置您的自定义深度学习虚拟机。

该虚拟机装载了大量预装工具和框架,包括Anaconda Python 发行版,其中方便地捆绑了YOLOv5.NET 所需的所有依赖项。

GCP Marketplace 设置深度学习虚拟机示例

第 2 步:准备好虚拟机YOLOv5

环境设置完成后,让我们启动并运行YOLOv5 :

# Clone the YOLOv5 repository
git clone https://github.com/ultralytics/yolov5

# Change the directory to the cloned repository
cd yolov5

# Install the necessary Python packages from requirements.txt
pip install -r requirements.txt

此设置过程可确保您使用的Python 环境版本为 3.8.0 或更新版本,且 PyTorch1.8 或更高版本。我们的脚本可以直接从最新的YOLOv5 版本中流畅地下载模型数据集,让您轻松开始模型训练。

步骤 3:培训和部署YOLOv5 模型

设置完成后,您就可以在 GCP 虚拟机上使用YOLOv5 进行训练和推理了:

# Train a model on your data
python train.py

# Validate the trained model for Precision, Recall, and mAP
python val.py --weights yolov5s.pt

# Run inference using the trained model on your images or videos
python detect.py --weights yolov5s.pt --source path/to/images

# Export the trained model to other formats for deployment
python export.py --weights yolov5s.pt --include onnx coreml tflite

只需几条命令,YOLOv5 就能根据您的具体需求训练定制的物体检测模型,或利用预训练的权重在各种任务中快速获得结果。

说明在 GCP 深度学习虚拟机上进行模型训练的终端命令图像

分配交换空间(可选)

对于需要处理大量数据集的用户,可以考虑为 GCP 实例增加 64GB 的交换内存:

sudo fallocate -l 64G /swapfile
sudo chmod 600 /swapfile
sudo mkswap /swapfile
sudo swapon /swapfile
free -h # confirm the memory increment

训练自定义数据集

要在 GCP 中的自定义数据集上训练YOLOv5 ,请按照以下步骤操作:

  1. 准备YOLOv5 格式的数据集(图像和标签)
  2. 使用以下命令将数据集上传至 GCP 虚拟机 gcloud 或 SCP
  3. 创建数据集 YAML 文件,指定路径和类别
  4. 使用适当的参数开始训练:
python train.py --img 640 --batch 16 --epochs 100 --data custom.yaml --weights yolov5s.pt

有关使用自定义数据集进行训练的详细说明,请参阅Ultralytics YOLOv5 文档

利用云存储

为实现高效的数据管理,请将YOLOv5 工作流程与Google Cloud Storage 集成:

# Install Google Cloud SDK if not already installed
curl https://sdk.cloud.google.com | bash
gcloud init

# Copy data to/from Cloud Storage
gsutil cp -r gs://your-bucket/dataset ./
gsutil cp -r ./runs/train/exp/weights gs://your-bucket/models/

通过这种方法,您可以在云中安全地存储大型数据集和训练有素的模型,同时将虚拟机的存储需求降至最低。

结束语

恭喜您!现在,您可以利用YOLOv5 的功能和Google 云平台的计算能力。这种组合为您的物体检测任务提供了可扩展性、高效性和多功能性。无论是个人项目、学术研究还是工业应用,您都已经在云端人工智能和机器学习领域迈出了关键的一步。

请记得记录您的旅程,与Ultralytics 社区分享您的见解,并利用GitHub 讨论等合作平台进一步发展。现在,就用YOLOv5 和 GCP 去创新吧!

想要不断提高您的 ML 技能和知识?深入了解我们的文档和教程,获取更多资源。让您的人工智能探险继续下去!

📅创建于 1 年前 ✏️已更新 11 天前

评论