跳至内容

YOLOv5 🚀 关于 AWS 深度学习实例:您的完整指南

对于新手来说,建立高性能的深度学习环境可能令人望而生畏,但不要担心!🛠️ 通过本指南,我们将指导您完成在 AWS 深度学习实例上启动和运行YOLOv5 的过程。通过利用亚马逊网络服务(AWS)的强大功能,即使是机器学习的新手也能以经济高效的方式快速入门。AWS 平台的可扩展性非常适合实验和生产部署。

YOLOv5 的其他快速启动选项包括我们的 Colab 笔记本 在 Colab 中打开 在 Kaggle 中打开, GCP 深度学习虚拟机以及我们的 Docker 镜像 Docker Hub Docker 拉动.

步骤 1:登录 AWS 控制台

首先创建一个账户或登录 AWS 控制台https://aws.amazon.com/console/。登录后,选择EC2服务来管理和设置实例。

控制台

第 2 步:启动实例

在 EC2 控制面板中,你可以找到 "启动实例"按钮,它是创建新虚拟服务器的入口。

启动

选择正确的亚马逊机器映像(AMI)

在这里,您可以为实例选择操作系统和软件栈。在搜索栏中输入 "深度学习",然后选择最新的基于 Ubuntu 的深度学习 AMI,除非你有其他需求。亚马逊的深度学习 AMI 预装了常用框架和 GPU 驱动程序,可简化设置过程。

选择 AMI

选择实例类型

对于深度学习任务,一般建议选择 GPU 实例类型,因为它可以大大加快模型训练速度。在考虑实例大小时,请记住模型的内存需求绝不能超过实例所能提供的容量。

注意:选择实例时应考虑模型的大小。如果您的模型超过了实例的可用内存,请为您的应用程序选择内存足够大的其他实例类型。

有关可用 GPU 实例类型的列表,请访问EC2 Instance Types,特别是加速计算下的内容。

选择类型

有关 GPU 监控和优化的更多信息,请参阅GPU 监控和优化。有关定价,请参阅按需定价现货定价

配置您的实例

Amazon EC2 Spot Instances 允许您以标准成本的一小部分竞标未使用的容量,从而为运行应用程序提供了一种经济高效的方式。要获得即使 Spot Instance 出现故障也能保留数据的持久体验,请选择持久请求。

点播请求

记住在启动前根据需要在步骤 4-7 中调整实例设置和安全配置的其余部分。

第 3 步:连接到您的实例

实例运行后,选择其复选框并单击 "连接 "访问 SSH 信息。在首选终端中使用显示的 SSH 命令与实例建立连接。

连接

步骤 4:运行YOLOv5

登录到您的实例后,您就可以克隆YOLOv5 仓库,并在Python 3.8 或更高版本的环境中安装依赖项。YOLOv5模型和数据集将自动从最新版本下载。

git clone https://github.com/ultralytics/yolov5  # clone repository
cd yolov5
pip install -r requirements.txt  # install dependencies

环境设置完成后,您就可以开始训练、验证、执行推理并导出YOLOv5 模型:

# Train a model on your data
python train.py

# Validate the trained model for Precision, Recall, and mAP
python val.py --weights yolov5s.pt

# Run inference using the trained model on your images or videos
python detect.py --weights yolov5s.pt --source path/to/images

# Export the trained model to other formats for deployment
python export.py --weights yolov5s.pt --include onnx coreml tflite

可选附加功能

要添加更多交换内存(这对大型数据集来说是个救星),请运行

sudo fallocate -l 64G /swapfile  # allocate 64GB swap file
sudo chmod 600 /swapfile  # modify permissions
sudo mkswap /swapfile  # set up a Linux swap area
sudo swapon /swapfile  # activate swap file
free -h  # verify swap memory

就是这样!您已成功创建 AWS 深度学习实例并运行YOLOv5 。无论您是刚刚开始进行对象检测,还是扩大规模用于生产,这种设置都能帮助您实现机器学习目标。祝您训练、验证和部署愉快!如果您在使用过程中遇到任何问题,强大的 AWS 文档和活跃的Ultralytics 社区将为您提供支持。



创建于 2023-11-12,更新于 2023-12-03
作者:glenn-jocher(2)

评论