YOLOv5 🚀 关于 AWS 深度学习实例：您的完整指南

对于新手来说，建立高性能的深度学习环境可能会令人望而生畏，但不用担心！🛠️ 通过本指南，我们将引导您完成以下过程 YOLOv5并在 AWS 深度学习实例上运行的过程。利用亚马逊网络服务 (AWS) 的强大功能，即使是机器学习新手也可以快速、经济高效地开始学习。AWS 平台的可扩展性非常适合实验和生产部署。

YOLOv5 的其他快速启动选项包括我们的 Colab 笔记本 , GCP 深度学习虚拟机以及我们的 Docker 镜像 Docker Hub .

首先创建一个账户或登录 AWS 控制台https://aws.amazon.com/console/。登录后，选择EC2服务来管理和设置实例。

控制台

第 2 步：启动实例

在 EC2 控制面板中，你可以找到 "启动实例"按钮，它是创建新虚拟服务器的入口。

选择正确的亚马逊机器映像（AMI）

在这里，您可以为实例选择操作系统和软件栈。在搜索栏中输入"深度学习"，然后选择最新的基于 Ubuntu 的深度学习 AMI，除非你有其他需求。亚马逊的深度学习 AMI 预装了常用框架和GPU 驱动程序，可简化设置过程。

选择 AMI

选择实例类型

对于深度学习任务，一般建议选择GPU 实例类型，因为它可以大大加快模型训练速度。在考虑实例大小时，请记住，模型的内存需求绝不能超过实例所能提供的容量。

注意：选择实例时应考虑模型的大小。如果您的模型超过了实例的可用内存，请为您的应用程序选择内存充足的其他实例类型。

有关可用GPU 实例类型的列表，请访问EC2 Instance Types，特别是加速计算下的内容。

选择类型

有关GPU 监控和优化的更多信息，请参阅GPU 监控和优化。有关定价，请参阅按需定价和现货定价。

配置您的实例

Amazon EC2 Spot Instances 允许您以标准成本的一小部分竞标未使用的容量，从而为运行应用程序提供了一种经济高效的方式。要获得即使 Spot Instance 出现故障也能保留数据的持久体验，请选择持久请求。

点播请求

记住在启动前根据需要在步骤 4-7 中调整其他实例设置和安全配置。

第 3 步：连接到您的实例

实例运行后，选择其复选框并单击 "连接 "访问 SSH 信息。在首选终端中使用显示的 SSH 命令与实例建立连接。

步骤 4：运行YOLOv5

登录到您的实例后，您就可以在Python 3.8 或更高版本的环境中克隆YOLOv5 仓库并安装依赖项了。YOLOv5模型和数据集将自动从最新版本下载。

git clone https://github.com/ultralytics/yolov5 # clone repository
cd yolov5
pip install -r requirements.txt # install dependencies

环境设置完成后，您就可以开始训练、验证、执行推理和导出 YOLOv5 模型了：

# Train a model on your data
python train.py

# Validate the trained model for Precision, Recall, and mAP
python val.py --weights yolov5s.pt

# Run inference using the trained model on your images or videos
python detect.py --weights yolov5s.pt --source path/to/images

# Export the trained model to other formats for deployment
python export.py --weights yolov5s.pt --include onnx coreml tflite

可选附加功能

要添加更多交换内存（这对大型数据集来说是个救星），请运行

sudo fallocate -l 64G /swapfile # allocate 64GB swap file
sudo chmod 600 /swapfile        # modify permissions
sudo mkswap /swapfile           # set up a Linux swap area
sudo swapon /swapfile           # activate swap file
free -h                         # verify swap memory