数据集和工作空间概述
人工智能和机器学习产品由数据驱动 - 使工作负载能够以高性能方式轻松可靠地访问数据是 Base Command 的核心功能。 本实验将介绍如何在 Base Command 中使用数据集和工作空间管理数据,以及如何创建、访问和删除数据集和工作空间。
在 Base Command 中,数据集是可共享的只读工件,可以挂载以在 Base Command 作业中使用。 许多机器学习或深度学习工作负载都期望特定的数据布局 - 在构建数据集之前,应了解这些基本期望,以确保目录布局、文件名和数据类型可以一致地重用。 可以通过多种方式创建数据集,每种方式都经过定制,以适应访问当前可用数据。
在 Base Command 中,工作空间是可共享的读写存储端点,也可以挂载在 Base Command 作业中。 工作空间旨在用于可能需要频繁更改的迭代工作 - 例如,用于尚未准备好转换为静态数据集的数据。 本实验将重点介绍工作空间面向数据的用例,但鉴于其灵活性,工作空间可以用于尚未进行版本控制的源代码,或用作不同作业中多个团队的共享工作空间。 工作空间访问控制和共享将在其他实验内容中深入介绍。