会话档案是客户数据平台(VeCDP)中用于管理和分析历史会话数据的模块,可以存档会话记录,如企微对话、语音对话,可用于会话分析、会话总结、话术推荐等场景,支持在「会话洞察」模块中进行明细查询和分析。
若企微会话存档数据已完成接入,则直接从数据库表读取即可,需至少保留2个字段,id列和内容列,如下所示。
若企微会话数据未同步,则可以从数据源进行接入,如下所示。
点击「数据管理」,下拉选择「数据连接」,进入页面。
选择左侧「新建数据连接」,在类别里选择「微信生态」,点击「企业微信」。
填写公钥,点击授权。
外呼数据、导购机器人数据等数据若存储于Hive表等系统,需根据数据实际存储位置配置连接。
点击「数据管理」,下拉选择「数据档案管理」,点击「会话档案」。
点击「新建数据档案」,选择「会话档案」并点击,支持创建多个,在编排页完成相关配置。
相关字段 | 字段说明 |
|---|---|
会话档案 | 会话档案每天获取数据集最新分区的数据,请保证最新「数据集分区」包含全部会话档案的属性特征。 |
数据集 | 下拉选择可用的数据集注册成为VeCDP可被查询使用的数据档案。 |
数据档案名称 | 自定义,不超过100字,允许中英文、数字、下划线。 |
数据档案描述 | 自定义。 |
关联主体 | 选择数据档案挂在哪个主体下。 |
会话数据来源 | 下拉进行选择,可选择企业会话-单聊、智能体、语音会话。 |
分区增量更新 | 每天分区存储增量数据。若需查询最近7天某个业务含义日期(如订单创建时间是分区日期)的数据,需要跨分区查询。 |
会话ID | 会话唯一标识字段,如果原会话有一段对话的唯一标识便采用原ID若没有,是经过数据处理聚合的新ID。 |
会话类型 | 会话类型:如企微会话-单聊、语音外呼-A渠道等,采用系统定义的枚举值,字段类型为string。 |
主体OneID | 目标主体的OneID字段。 |
客户ID | 用于保存客户ID段。 |
客户名称 | 用于保存客户名称的字段。 |
客服ID | 用于保存客服ID字段。 |
客服名称 | 用于保存客服name的字段。 |
会话内容 | 用于保存一段完整的对话内容的字段。 |
会话开始时间 | 用于保存一段对话的第一条消息发送时间的字段。 |
会话结束时间 | 用于保存一段对话的最后一条消息发送时间的字段。 |
会话持续时长 | 用于保存这段会话持续时长的字段。 |
时间分区 | 字段类型为date。 |
字符型属性 | 用于保存string类型的属性字段。 |
数值型属性 | 用于保存int类型的属性字段。 |
浮点型属性 | 用于保存float类型的属性字段。 |
会话档案页面,可对各个会话档案进行「编辑」和「删除」。
需通过「可视化建模」模块,将会话数据中的一条条message加工成一个标准的会话session(即一段对话)。
点击「数据管理」,选择「可视化建模」,左侧列表选择「任务列表」,点击「新建」。
点击「➕」,添加需要连接的数据。其余流程也可参考下图内红标部分。
「添加数据连接」时,用户可以选择「已有数据连接」的内容,也可自行「新建数据连接」。
选择其中一个数据连接,并将其从左侧列表里拉入右侧面板。(示例:选择「会话档案」,将其拉入右侧。)
点击右侧小加号,「输出」到「输出数据集」,并在CDP应用中下拉选择「数据档案-会话档案」,再进行相应配置。
相应参数 | 参数说明 |
|---|---|
名称及描述 | 自定义。 |
VeCDP应用 | 注:由于VeCDP下游部分应用存在特殊查询逻辑,请根据需要选择合适的应用场景。 |
基准ID字段 | 仅支持int/short/long类型字段。 |
会话ID | 会话原始ID,用于标识会话,支持选择int、string类型的字段。 |
类型 | 仅支持ClickHouse。 |
数据生命周期 | 作用: |
分区 | 一级分区必须为date类型,若无合适字段,可以选择“系统默认分区”(对天、周、 月级别例行同步任务的取值为任务例行执行的前一天,对小时、分钟级别例行同步任务取值为任务例行执行当天, 对手动运行的任务的取值为运行时选择的业务时间),二级分区可选小时或其他取值可枚举的字段作为分区(必须在高级设置打开动态分区)。 |
排序键 | 将最常用作过滤条件的字段设置为排序键,可以使查询会更快。 |
分片字段 | 用于确保数据均分分布在各个存储节点上。若每天数据量不超过2000w行,请保留系统默认设置。 |
抽样字段 | 在可视化查询模块中可按此字段抽样进行查询,只支持int,float,string类型的字段。 |
唯一键去重 | 唯一键去重指在数据处理过程中,依据某个或某些被定义为唯一键的字段,去除重复的数据记录。系统默认为否。 |
注意
为了在「会话洞察-会话明细-会话详情」模块,能够结构化地展示对话内容,如下图。需将会话档案中的“会话内容”字段按照一定格式要求处理:
text_yyyy-MM-dd HH:mm:ss_角色(名称)_消息内容\n;
含义:文本类型消息_消息发送时间_客户或客户(客户名称或客服名称)_消息内容\n;
需注意:消息内容后需跟固定的特殊字符“\n;”
image_yyyy-MM-dd HH:mm:ss_角色(名称)_文件地址\n;
含义:图片类型消息_消息发送时间_客户或客户(客户名称或客服名称)_消息内容\n;
需注意:消息内容后需跟固定的特殊字符“\n;”
audio_yyyy-MM-dd HH:mm:ss_角色(名称)_文件地址\n;
含义:视频类型消息_消息发送时间_客户或客户(客户名称或客服名称)_消息内容\n;
需注意:消息内容后需跟固定的特殊字符“\n;”
video_yyyy-MM-dd HH:mm:ss_角色(名称)_文件地址\n;
含义:音频类型消息_消息发送时间_客户或客户(客户名称或客服名称)_消息内容\n;
需注意:消息内容后需跟固定的特殊字符“\n;”
file_yyyy-MM-dd HH:mm:ss_角色(名称)_文件地址\n;
含义:文件类型消息_消息发送时间_客户或客户(客户名称或客服名称)_消息内容\n;
需注意:消息内容后需跟固定的特殊字符“\n;”
2024-10-20 14:30:05_客户 (李先生 189xxxxxxxxx)_下午 5 点健身私教课有空位吗? ;2024-10-20 14:30:20_客服 (运动顾问 - 张)_XX 健身中心浦东店,需咨询哪个课程类型? ;2024-10-20 14:31:08_客户 (李先生 189xxxxxxxxx)_增肌塑形套餐,1 对 1 指导。 ;2024-10-20 14:31:35_客服 (运动顾问 - 张)_查询 17:00 时段预约情况。 ;2024-10-20 14:33:12_客服 (运动顾问 - 张)_下午 5 点私教已预约满,傍晚 6 点有教练 A 空档,是否调整? ;2024-10-20 14:34:01_客户 (李先生189xxxxxxxxx)_6 点可接受,教练 A 的资质如何? ;2024-10-20 14:34:45_客服 (运动顾问 - 张)_教练 A 有 5 年从业经验,擅长力量训练,需查看详细资料吗? ;2024-10-20 14:35:10_客户 (李先生 189xxxxxxxxx)_不需要,直接预约。 ;2024-10-20 14:35:38_客服 (运动顾问 - 张)_预约 10 月 20 日 18:00 浦东店私教 A,手机号 189xxxxxxxxx,需提前 15 分钟到店签到。 ;2024-10-20 14:36:05_客户 (李先生 189xxxxxxxxx)_课程包含体测吗? ;2024-10-20 14:36:30_客服 (运动顾问 - 张)_首节课程含免费体测,后续每次课结束提供数据记录。 ;2024-10-20 14:36:50_客户 (李先生 189xxxxxxxxx)_确认预约。 ;2024-10-20 14:37:15_客服 (运动顾问 - 张)_已发送确认短信,含场馆地址和教练联系方式,变动需提前 4 小时取消。 ;2024-10-20 14:37:30_客户 (李先生 189xxxxxxxxx)_信息确认。 ;2024-10-20 14:37:45_客服 (运动顾问 - 张)_预约已存档,如需调整可随时联系。
会话档案目前能应用的场景只适用于会话洞察模块,不能应用于 VeCDP 标签生产、分群生产、群体画像洞察等组件。详情可参考:使用实践:会话分析场景。