文件管理用于组织 New IDE 中的代码、Notebook、工作流配置、资源描述文件和其他数据工程资产。良好的文件组织方式可以降低协作成本,也便于 Git 管理、发布审查和运维追溯。本文将为您介绍如何进行文件管理。
已创建 New IDE 模式的项目,相关操作请参见创建项目。
说明
不同的文件建议放在不同的目录下,以便管理。各目录说明及相关建议请参见工作空间结构。
本文以在主页的操作为例,介绍管理文件的步骤如下:
创建文件夹
单击创建 > 文件夹按钮,在弹出的窗口中,设置文件夹名称后,可以创建文件夹。
创建 Git 文件夹
单击创建 > Git 文件夹按钮,在弹出的窗口中,设置相关信息后,可以创建 Git 文件夹。
参数 | 说明 |
|---|---|
*Git 仓库 URL | 输入要存放 Git 文件夹的 Git 仓库的 URL,例如 https://github.com/org/repo.git |
*Git 供应商 | 仅支持 GitHub,下拉可选。 |
*Git 文件夹名称 | 用于展示的 Git 文件夹的名称,自行设定。 |
创建 Notebook 任务
单击创建 > Notebook 按钮,在弹出的窗口中,设置相关信息后,可以创建 Notebook 文件并进入其任务编辑页面。配置 Notebook 任务的具体操作说明可参见 Notebook 开发。
参数 | 说明 |
|---|---|
*脚本名称 | Notebook 脚本的名称,自行设定,如 notebook.ipynb。 |
计算资源组 | 使用的计算资源组,下拉可选运行中的计算资源组。 |
创建 SQL 任务
单击创建 > SQL 脚本按钮,在弹出的窗口中,设置相关信息后,可以创建 SQL 文件并进入其任务编辑页面。配置 SQL 任务的具体操作说明可参见 SQL 开发。
参数 | 说明 |
|---|---|
*脚本名称 | SQL 脚本的名称,自行设定。 |
*脚本类型 | 仅支持 SQL,下拉可选。 |
*计算队列 | 使用的计算队列,下拉可选运行中的计算资源组。 |
创建 CopyData 任务
单击创建 > CopyData 脚本按钮,在弹出的窗口中,设置脚本名称后,可以创建 CopyData 文件并进入其任务编辑页面。
创建资源文件
单击创建 > 资源文件按钮,在弹出的窗口中,设置相关信息后,可以创建资源文件并进入其任务编辑页面。管理资源文件的操作说明可参见资源库。
参数 | 说明 |
|---|---|
*资源来源 | 资源的来源方式,支持以下两种方式:
|
*资源名称 | 创建资源的名称(resourceName),自行设定。 |
*TOS 地址 | 填写具体的 TOS 文件路径,如 tos://test-tos/spark-examples-1.8.jar。 |
分享信息
单击分享按钮,在弹出的窗口中,选择分享用户,可以将主页访问权限分享给他人,以实现协作开发。
说明
若已存在被分享的用户,会显示在窗口列表中,可单击取消分享按钮,取消对该用户的分享;也可继续添加分享用户,同时列表中的“取消分享”也会立即生效。
复制链接
单击复制链接按钮,复制主页链接,并可分享给他人快速访问。
重命名
单击 ⋮ > 重命名按钮,在弹出的窗口中,可以对主页重命名。
移动文件夹/文件
单击 ⋮ > 移动按钮,在弹出的窗口中,可以将主页信息移动到指定的目录下。
复制文件夹/文件
单击 ⋮ > 复制按钮,在弹出的窗口中,可以将主页信息复制到指定的目录下。
收藏/取消收藏
单击 ⋮ > 收藏/取消收藏复合按钮,可以收藏/取消收藏主页信息。
删除文件夹/文件
单击 ⋮ > 删除按钮,二次确认后,可以将主页信息删除至垃圾桶。
说明
删除文件会影响线上在使用的工作流任务,请谨慎操作。
说明