在 AWS VM 上运行 TAO
Amazon Web Services 提供了弹性计算云 (Elastic Compute Cloud, EC2) 实例,用于在云端运行计算作业。本页面提供了在 EC2 VM 上运行 TAO 的说明。
登录您的 AWS 账户,或按照官方 AWS 入门网页 上的说明创建一个账户
登录后,在 EC2 下选择 Compute(计算)。
选择 AWS 区域。在本教程中,使用“美国东部(弗吉尼亚北部)”。
单击 Launch Instance(启动实例)。
启动 EC2 虚拟机实例。要运行 TAO,请使用 NVIDIA 深度学习 Amazon Machine Instance (AMI)。要使用此 AMI,请选择 AWS Marketplace 并搜索 NVIDIA Deep Learning AMI。
注意Amazon EC2 P3 和 G4 实例针对 NVIDIA Volta/Turing GPU 进行了优化。
根据您的 P3 和 G4 实例类型选择 Amazon EC2 P3 和 G4 实例类型之一。
单击 Review and Launch(查看和启动) 以查看默认配置设置。
选择实例类型后,单击 Next: Configure Instance Details(下一步:配置实例详细信息)。
注意无需配置任何实例详细信息,因此您可以继续下一步。
单击 Next: Add Storage(下一步:添加存储) 添加存储
注意建议 TAO 用户请求至少 200GB 的存储空间。
添加标签。命名您的实例有助于保持多个实例的井井有条。
继续 Configure a Security Group(配置安全组)。单击 Select an Existing Security Group(选择现有安全组),然后选择您在 初步设置 期间创建的安全组。您现在已配置您的 AWS 实例。
单击 Review and Launch(查看和启动) 以启动您的实例。您应该会收到一个弹出窗口,询问您要使用的密钥对。选择您在 初步设置说明 中设置的密钥对。
您现在可以按照此 网页 上的说明连接到您的实例。
默认情况下,NVIDIA 深度学习 AMI 预装了多个依赖项以启动
NVIDIA 构建的深度学习容器。要运行 TAO,您需要安装一些简单的依赖项。
安装先决条件 apt 包
sudo apt update sudo apt install python-pip python3-pip unzip pip3 install --upgrade pip
安装 virtualenv wrapper
pip3 install virtualenvwrapper
配置 virtualenv wrapper
export VIRTUALENVWRAPPER_PYTHON=/usr/bin/python3 export WORKON_HOME=/home/ubuntu/.virtualenvs export PATH=/home/ubuntu/.local/bin:$PATH source /home/ubuntu/.local/bin/virtualenvwrapper.sh
注意您还可以将这些命令添加到 VM 的
/home/ubuntu/.bashrc
文件中,以便配置在多个会话中持久存在。使用以下命令为启动器创建 virtualenv
mkvirtualenv -p /usr/bin/python3 launcher
注意您只需在实例中创建一次 virtualenv。当您重启实例时,只需运行步骤 3 中的命令,然后使用以下命令调用相同的 virtual env
workon launcher
使用以下命令在 virtualenv 中安装 jupyterlab
pip3 install jupyterlab
登录到名为
nvcr.io
的 NGC docker 注册表docker login nvcr.io
此处的用户名是
$oauthtoken
,密码是NGC API KEY
。您可以从 NGC 网站 设置此 API 密钥。
现在您已经创建了 virtualenv 并安装了所有依赖项,您现在可以下载并在 notebook 上运行 TAO 示例了。以下说明假设您正在运行 TAO 计算机视觉 示例。
使用以下命令从 NGC 下载并解压缩 notebook
wget --content-disposition https://api.ngc.nvidia.com/v2/resources/nvidia/tao/tao-getting-started/versions/5.0.0/zip -O tao-getting-started_5.0.0.zip unzip -u tao-getting-started_5.0.0.zip -d ./tao-getting-started_5.0.0 && cd ./tao-getting-started_5.0.0
使用以下命令启动 jupyter notebook
jupyter notebook --ip 0.0.0.0 --port 8888 --allow-root --NotebookApp.token=<notebook_token>
这将在 VM 中启动 jupyter notebook 服务器。要访问此服务器,请导航到
http://<dns_name>:8888/
,并在出现提示时输入用于启动 notebook 服务器的<notebook_token>
。dns_name
此处是 VM 的公共 IPv4 DNS,您将在各自实例的 EC2 控制面板下看到它。