DataLeap 提供多种 skill 技能包,包括 dataleap-dev、dataleap-ops、dataleap-help 等。本文将为您分别进行详细介绍。
数据开发 skill 辅助用户创建、编辑、复制、开发、修改、保存、调试任务调度任务。支持任务创建、编辑的原子能力(当前支持 EMR Serverless Spark SQL 任务类型),可利用大模型基于原子能力进行多个环节的编排,例如先创建 3 个任务,再根据业务逻辑修改这 3 个任务的代码,上述变更,平台会输出多个「产物」,需用户人工确认产物无误之后才会实际执行。具体能力包含如下:
任务运维 Skill 提供完整的任务实例运维能力,包括查询/列出任务实例、查看实例详情、重跑/停止/置成功实例、触发实例、任务回溯、修改队列/优先级、获取日志、诊断非 DataSail/DTS 离线作业、分析 Spark 慢 SQL RCA、推荐 Spark SQL Hint。也用于用户taskId/jobId/instanceId/projectId/status/pending/taskTime/taskType/engineId/cluster 等作业元信息或 JSON,并询问异常原因、运行状态、EMR/Spark/Hive/SQL 通用离线作业问题。具体能力包含如下:
DataLeap 官方文档咨询 Skill。用于回答方法、原理、流程/工作流、步骤、配置指南、限制条件、最佳实践等文档型问题,例如“如何实现......”、“怎么做......”、“数据开发工作流是什么”、“如何配置/使用/申请/开发......”。
控制台项目查询 skill 提供获取控制台项目信息的能力,用于代查 DataLeap 控制台项目列表、项目详情和项目成员列表,适合项目与成员相关的控制台查询场景,例如“帮我查询xxx项目的成员”、“列出我的项目”。
示例任务 skill 提供快速创建 Notebook 示例任务的能力,用于快速创建 Notebook 示例任务并自动保存示例 Notebook 文件,适合需要一键生成演示任务的场景。
当您创建 Notebook 示例任务时,例如“帮我创建一个 Notebook 示例任务,项目是 xxx”,可以使用该 skill,快速创建一个示例任务。该 skill 不支持咨询型问题,例如“如何创建 Notebook 示例任务”。
DataLeap 元数据只读查询 skill 提供查询/查看/列出任务基础信息、表基础信息、智能搜索找表、项目权限、失败/慢实例列表、调度统计等能力。用于只读查询 DataLeap 元数据、项目权限、任务表基础信息和调度统计,适合元数据检索与统计查看场景。
当使用该 skill 查询相关信息时,可以返回原始数据或简单列表,但不会生成报告,也不更改资源。
DataLeap 一次性报告生成 skill 提供生成治理、运维报告的能力。用于生成 DataLeap 失败异常、耗时异常和调度汇总报告,适合一次性统计分析并输出报告产物的场景。
当您需要生成、统计、分析并输出报告时,例如“帮我生成失败报告”、“统计近 7 天失败异常报告”,可以使用该 skill,生成 Markdown 报告 + Excel 明细 + 上传 TOS。
DataLeap 定时任务管理 skill 用于创建、查询、更新、触发和管理 DataLeap 定时任务,适合周期性执行 Agent 指令和自动化调度场景。主要提供以下能力:
数据集成问题诊断skill 提供处理 DataSail(DTS)任务相关问题的能力,用于处理 相关任务的诊断、日志查询、运行态定位和根因分析,适合数据集成任务排障场景。