关于DataFinder
SaaS-云原生、SaaS-非云原生
随DataFinder产品发展,当前产品在火山引擎SaaS环境中存在两大类产品环境:SaaS-云原生环境(新版SaaS环境)、SaaS-非云原生(旧版SaaS环境)两类。
- 两类环境在埋点接入时的上报地址不一致、管理员的项目/应用等管理操作不一致。
- 其他数据分析、数据治理、看板等功能的操作流程基本一致。
注意
您在做操作前,需了解下您当前的环境是哪种环境,根据环境来查看对应的帮助文档:
增值功能/白名单功能
DataFinder为您提供丰富的数据集成、分析、治理等功能。
- 部分功能为增值功能需要您单独购买才可使用,例如广告监测、虚拟项目、多ID口径、多维表格等。
- 也会持续发布新功能,部分新功能可能为白名单用户才可使用。
注意
如果您在您当前环境中未找到文档中展示的功能,可能由于此功能为增值功能或仅白名单用户可用,您可参考文档中的购买指引、白名单申请指引进行购买或申请加白。
关于费用
计费事件量统计口径
您在开通购买DataFinder时,会在签署合约的时候选择好相应的用量统计口径(有效事件量 或 MTU)。
用量口径说明 | 有效事件 | MTU |
|---|
计算方法 | 统计上报的所有有效事件量之和。 | 以 SSID 口径统计过去一个完整月内发生有效事件的用户。
有效事件包括以下三类: - 预置事件,详情可以参考:预置属性总表 。
- 用户自定义代码埋点事件。
- SDK功能开启后自动上报的事件,包括:
|
计算时机 | 次日10点完成前一日统计。 | 每月1日10点完成上一月统计。 |
注意
- 并非所有事件都会被统计进事件使用量中,有效事件的范围请参见:有效事件口径。
- 如果事件在数据管理中被禁用了,则不会上报对应事件,则不会计算在事件使用量中,禁用事件操作请参见:启用/禁用/隐藏事件
数据存储/使用有效期
数据上报至DataFinder后,DataFinder会为您保存一定时长,超出存储有效期后,历史数据将丢失。
查看用量
您可以在DataFinder控制台的集团设置页面查看当前的用量,操作入口参见:查看产品用量。
注意
仅集团管理员可进入相关页面查看产品用量详情,如果您当前的账号没有找到对应的页面入口,可能是权限不足。
关于权限管控
权限管控能力
DataFinder的权限管控主要是基于RBAC权限管控策略来的,即核心管控思路为通过规划不同角色的权限范围,将具体用户添加为角色成员,实现对用户的细化权限管控。管控粒度包括:集团层面、项目层面、应用层面、DataFinder功能层面、DataFinder数据及数据脱敏层面、看板/图表层面,详情:
数据口径
集团、项目、应用
DataFinder的产品资源管理可从集团、项目、应用维度来开展,建议您在使用DataFinder时,结合自身业务分类和人员组织情况,进行资产规划:

- 集团:集团是一个团队空间,集团名称通常为注册火山引擎账号时填写的公司名称或账号名称,在集团中可以创建项目、创建应用并进行数据分析。
- 项目:可通过项目来隔离集团下的应用、用户角色等。
- 应用:指的是属于用户(或用户所在团队)的,需要被监测数据变化及波动的产品。
分析主体 & 多主体
实际业务分析过程需明确进行分析的核心对象或焦点,通常“主体”是指使用产品或服务的用户。但是某些场景下也可能需要分析多个主体,例如汽车行业,需以消费者、汽车、商家等不同视角去进行数据分析,此场景下您即可开通使用DataFinder的多主体功能:使用多主体。
统计口径 & 用户唯一标识
通常,当我们使用高级分析进行数据分析时,增长分析(DataFinder)会默认以用户作为统计分析的对象,默认使用SSID作为用户唯一标识ID来计算指标,此时用户的SSID就是默认的统计口径。当您的分析对象为用户时,建议保持默认统计口径ssid,DataFinder可通过ID_Mapping将用户的device_id/web_id、user_unique_id等进行mapping后,尽量通过一个ssid还原一个真实的用户个体,详情请参见用户标识。
此外,增长分析还提供了统计口径切换的能力,来满足按照用户SSID之外的口径来统计用户行为数据,进而进行用户分析的场景。创建并使用其他统计口径的操作指导:统计口径。
用户标识ID & 多ID类型
DataFinder支持使用device_id/web_id/anonymous_id、user_unique_id、ssid来标识用户/设备。
- device_id、web_id、anonymous_id:均可作为设备的唯一id,多为无法获取用户实名id的场景下使用。
- user_unique_id:为登录态用户标识,多为在能获取用户实名ID场景下使用,一般情况直接使用产品业务中使用的用户标识,比如登录账号。当 user_unique_id 未设定时,在SaaS版本中,系统会自动使用 device_id/web_id 替代。
- ssid:为DataFinder的用户统计口径ID,与设备标识device_id/web_id、登录态用户标识user_unique_id 互相Mapping,能保证用户匿名和实名状态下的ID统一。
三类ID的mapping简单示意图如下,更多关于用户标识的介绍请参见用户标识(uid、ssid、did)。

也支持您新增更多ID类型,并为您提供ID-MAPPING计算能力,将多类ID进行MAPPING计算,通过ssid来尽量还原一个真实的自然人,使用多ID类型时的mapping简单示意图如下,多ID类型的使用指导请参见使用多ID类型。

埋点设计埋点方案
支持的埋点类型:代码埋点(结合预置事件/属性使用)、全埋点
对比项 | 代码埋点 | 全埋点 |
|---|
埋点方式 | 代码埋点指的是开发工程师,按照业务个性化需求,人工写入代码中以实现数据采集逻辑。 | 全埋点,又称为“无埋点”、“无痕埋点”以及“自动埋点”。全埋点是针对标准页面的浏览和标准元素的点击进行自动采集上报,无需研发开发代码进行埋点集成。 |
采集事件 | 采集范围广,理论上只要是应用端的交互操作,都可以采集得到。 - DataFinder为您提供了预置事件和属性,您可结合已支持的预置事件和属性,补充使用自定义代码埋点。
- 支持的预置事件/属性详情参见:预置属性总表。
| 采集的全埋点事件为bav2b_click按钮点击、 bav2b_page页面浏览等事件,详情参见全埋点预置事件和属性。 |
适用场景 | - 适用于采集分析业务相关字段逻辑紧密的场景,分析更聚焦;
- 尤其是一些非点击的、不可视的行为,非代码埋点实现不可
例如:搜索结果返回、注册结果返回、Banner、楼层、个性化推荐/千人千面页面 | - 适用于活动页、落地页,简单分析 UV、PV、点击量等基础指标;
- 分析或统计需求简单,不需要对埋点事件进行传参等自定义属性设置的事件;
|
优势 | - 业务信息完善;
- 事件、属性、上报时机等可以自定义和控制
- 能够完整还原用户行为链路
| - 不需要开发人员手动录入,对业务代码侵入性最小,工作量少;
- 部署SDK后即会自动且持续地收集的全埋点事件数据,这意味着,即使最初并未明确指定要分析哪些特定事件,但由于全埋点持续且全面的数据采集,因此可支持数据回溯——即可以在任何时候对过去的数据进行查询和分析。
|
劣势 | - 每一个控件的埋点都需要添加相应的代码,工作量大,需要开发人员支持、跟业务代码耦合;
- 版本上线后埋点内容迭代灵活性低
| - 无差别全量采集,产生无效数据上报,浪费流量/存储/计算资源;
- 无法采集业务相关属性,对所有事件数据的自动收集,对所有事件数据的自动收集
- 对于开发框架有一定限制,详情可参见客户端SDK支持范围中全埋点部分。
- 如果需要定位具体用户行为,则需要结合虚拟事件or圈选事件功能才能实现
|
集成操作指导 | - 预置事件和属性:无需您做任何配置,后续会自动根据触发机制采集上报对应的数据。
- 自定义代码埋点:
- 先根据业务分析需要,规划好需要采集上报的自定义埋点和属性有哪些。
- 在DataFinder控制台录入对应的埋点和属性,将埋点和属性名称先落库。
- 在集成SDK时,参考上报代码埋点的操作指导进行配置。
| |
停止数据上报 | 如果不希望再采集上报某些代码埋点数据,可在DataFinder控制台的数据管理>元数据管理中禁用对应事件或属性即可。 | 如果不希望再采集上报全埋点数据,可在DataFinder控制台项目中心>项目管理>SDK设置中关闭全埋点开关。无需修改集成代码中的全埋点开关。 |
数据分析 | |
更多埋点规划与demo参考
数据接入与上报
数据上报注意事项
数据接入上报流程

各端的数据集成操作指导请参见数据接入概述。
数据上报地址
进行数据接入上报时,您需要根据当前的环境类型和端类型确认您的数据上报地址,如果上报地址设置错误,后续会导致您无法查询到上报的数据:数据上报地址。
预置事件/属性、自定义事件/属性
DataFinder为您提供了丰富的常用预置事件和属性,您可以先查看当前已支持的预置事件和属性:预置属性总表。您也可以根据业务需要将自定义埋点录入DataFinder,后续上报自定义埋点数据用于用户行为分析。
事件/属性分类 | 业务含义说明 |
|---|
系统预置 | 预置事件公共属性 | 系统预置的每一个事件都会上报的通用属性。比如Finder SDK上报的设备信息类字段。 |
预置事件及事件属性 | 系统预置的埋点事件以及事件属性。 |
预置用户属性 | 系统预置的用于描述用户自身状态的属性。 |
自定义 | 自定义事件公共属性 | 客户在预置事件公共属性以外自定义的事件公共属性。 |
自定义事件及事件属性 | 客户在预置事件及事件属性以外自定义的事件及事件属性。 |
自定义用户属性 | 客户在预置用户属性以外自定义的用户属性。 |
埋点数据格式要求
当前支持采集的埋点数据类型包括整数、浮点数、字符串、数组、日期时间等.
- 采集的数据在落库后数据类型会做一定的转化,支持的数据类型列表和数据类型转化说明请参见属性数据类型。
- 数据入库至DataFinder后的示例可参见数据入库格式。
- 入库后可将数据导出,数据导出的格式示例可参见数据对外输出格式。
注意
- 自定义事件/属性时,取值不要包含转义字符。
- 一个属性的数据类型由首次落库时的数据类型决定。
上报结果验证
- 在数据集成SDK开发过程中:可先检查一下各端的集成SDK配置易错点;然后在集成过程中进行验证,例如使用DataFinder提供的实时埋点监测功能、使用Devtools工具进行验证。
- 集成SDK开发完成,数据开始上报:在数据接入SDK开发完成后,您可主动构造一些埋点数据进行上报验证,通常等待10~15分钟后即可在DataFinder的元数据管理页面查看数据上报记录、使用分析工具可查询上报的数据。
更多埋点验证的操作指导请参见通用埋点验证操作指引。
接入&上报报错处理
数据导入与导出
数据导入方案
数据导出方案
DataFinder中分析工具/看板的数据大部分支持下载为Excel表存储到本地。
DataFinder为您提供了数据输出功能模块,当前主要支持实时导出方案。数据输出能力、数据导出的格式示例可参见数据对外输出格式。
实时导出方案 | 主要流程与详细指导文档 | 适用场景 | 易用性 | event数据 | user数据 |
|---|
webHook API推送 | 1 API对接,主动推送。
2 一定数据量免费,超出按量计费
详情请参见:DataFinder上创建数据输出任务 | 1 数据量较小,主动推数消耗公网火山带宽资源
2 数据质量要求不高,可接受部分因网络抖动、消费失败的丢数场景 | 需按照Finder要求开发接口 | Y | N |
接火山Kafka/BMQ消费落数仓 | 1 创建的topic 仅支持华北2(北京)地域
2 消费topic走公网域名,可能会时延会大一些,如果您的服务部署在火山北京机房可以走私网域名
3 引入了Kafka/BMQ服务,您需要支持对应产品的费用;此外使用公网IP也会产生费用。
详情请参见: | 1 希望通过中间件对接
2 适合数据质量有要求(可以重新消费、有重试机制) | 直接消费Kafka,开发选型灵活 | Y | N |
SaaS-非云原生还支持通过OpenAPI导出原始事件属性数据、导出原始用户属性数据。
数据分析
基本概念
事件分析须知
留存分析须知
转化分析须知
- 基本概念:
- 计算逻辑:
- 深度学习:多条路径的转化率对比分析——多路径对比
用户路径分析须知
用户生命周期分析须知
LTV分析须知
分析指标
- 您可以将常用的分析指标在统一的页面中创建为固化的指标,便于您在多个分析工具中直接选择使用:指标管理。
- 您可以对DataFinder中的多个一般事件通过一定的逻辑关系组合成虚拟事件,后续通过虚拟事件进行用户行为分析:虚拟事件。
例如,想看一下发生了事件A或者发生了事件B的去重用户数。比如浏览了页面A或者浏览了页面B的去重用户数有多少。此时就需要用到虚拟事件:表示发生了事件A或者事件B。
数据看板
看板搭建与权限管控
- 如果您拥有“公共空间管理权限”,那么您可以将看板创建到公共空间或个人空间。
- 如果您没有“公共空间管理权限”,那么您只能将看板创建到个人空间。
- 创建到公共空间的看板:创建后默认对全体成员可见,您可以通过“分享”功能修改查看范围。
- 创建到私人空间的看板:创建后默认仅对自己可见,您可以通过“分享”功能将看板分享给其他人查看(对应查看权限)或协同编辑(对应编辑权限)。
- 您可以通过“分享”功能将看板分享给其他人查看(对应查看权限)或协同编辑(对应编辑权限)。
看板订阅/监控
- DataFinder的看板支持通过邮件/飞书群/钉钉群方式进行图片订阅,单看板最多订阅20条:看板订阅操作指导。
- 在看板中,我们可以通过创建监控任务,来关注重点数据的波动变化。根据监控规则可以自动判断指标是否在正常范围内波动,异常时触发报警(邮件),无需人工每日跟踪判断,实现自动化监测:监控管理。
看板嵌出
看板和图表嵌出是指将DataFinder的看板/图表嵌出外部平台,例如:报表平台、飞书文档、或您公司自建的业务系统等。通过该能力,您将获得属于看板/图表的链接,对于拥有看板/图表权限账号的用户,即可直接在外部平台通过该链接查看嵌出的看板/图表:看板嵌出操作指导。
注意
- 通过该方式嵌出的看板需要当前账号为登录状态。未登录态时,您需要先要登录火山引擎,然后再打开看板嵌出页。
- 使用自定义权限时无需账号为登录态,如果嵌入的环境需要自定义权限,请优先查看<DataFinder看板分析集成解决方案>。
图表嵌入
支持嵌入火山引擎域名下的图表,如增长分析其他应用下看板以及各产品页面的url地址等:图表嵌入操作指导。