数据产品指北埋点和数据指标.docx

上传人:b****5 文档编号:30690058 上传时间:2023-08-19 格式:DOCX 页数:9 大小:1.12MB
下载 相关 举报
数据产品指北埋点和数据指标.docx_第1页
第1页 / 共9页
数据产品指北埋点和数据指标.docx_第2页
第2页 / 共9页
数据产品指北埋点和数据指标.docx_第3页
第3页 / 共9页
数据产品指北埋点和数据指标.docx_第4页
第4页 / 共9页
数据产品指北埋点和数据指标.docx_第5页
第5页 / 共9页
点击查看更多>>
下载资源
资源描述

数据产品指北埋点和数据指标.docx

《数据产品指北埋点和数据指标.docx》由会员分享,可在线阅读,更多相关《数据产品指北埋点和数据指标.docx(9页珍藏版)》请在冰豆网上搜索。

数据产品指北埋点和数据指标.docx

数据产品指北埋点和数据指标

数据产品指北—埋点和数据指标

所谓“巧妇难为无米之炊”,所有的数据工作,前提一定是有数据。

埋点作为获取数据的常用手段,其概念本身我们并不陌生。

埋点所采集的数据,是后续数据分析,搭建数据产品等工作的基础,因此,这个系列也会先从埋点开始。

埋点的本质是记录事件

通过埋点,我们希望记录的其实是用户背后的行为事件。

主要的埋点事件分为三种:

点击、曝光和停留

1.点击事件

即用户在页面上的每一次点击,都会记录一次数据。

2.曝光事件

每向用户展示一次页面,便会记录一次数据。

这里可以对首次进入和刷新进行区分。

3.停留事件

主要用于记录用户在单个页面的停留时长。

通过记录用户进入页面的时间点和离开的时间点,可计算出停留时长。

而事件所反映的是用户的行为,有时候一个事件或多个事件组合的背后,可以挖掘出更多的用户行为,需要结合实际业务进行定性分析。

通过这三种事件,我们可以组合并计算出一系列所需的指标,例如跳出率、转化率等。

埋点的主要方式

根据埋点终端可分为客户端前端埋点和服务器后端埋点。

前端埋点主要有可视化埋点、无埋点和代码埋点三种。

整体来看,三种方式的埋点成本递增,可记录的数据量和数据深度也递增。

1.可视化埋点

记录前端设置的页面元素和其操作的对应关系。

可直接以前端页面可视化的方式展示相关数据。

例如统计页面PV、UV、点击等宏观指标,能满足基本的数据分析需求。

在设置时,通过圈选页面具体位置等操作设置埋点事件。

2.无埋点

绑定页面上的控件,触发事件时通过采集SDK上报相关数据。

无埋点可以对全量的交互数据进行标准化采集,因此也有“全埋点”的说法。

个人认为,可以把可视化埋点和无埋点都归为非代码埋点,具有相似的优劣性。

都能简单、方便、准确地完成埋点操作,对应的在收集数据深度和灵活性上存在不足。

3.代码埋点

由研发人员在程序中写入代码实现,通过触发具体动作后程序自动上报数据。

代码埋点可以采集更细粒度的数据和与业务强相关的信息,是精细化分析必备的埋点方式。

例如电商网站在记录用户加购行为时,还希望包含具体加购商品等相关信息,就需要采用代码埋点。

其缺点自然是开发成本较高,而且有可能出现漏埋、错埋,对团队水平要求也更高。

前端埋点整体更适合产品功能相对简单的运营初期。

除去前端埋点,还有前面提到的后端埋点,通常以代码埋点为主。

后端埋点可收集全量网络请求数据,不限于在app中的行为。

其实时性更强,数据准确性也更高。

因此后端埋点其实是更被推荐的。

常见情况是公司会同时结合前端埋点和后端埋点。

能通过后端埋点采集的数据,尽量使用后端埋点,特别是一些业务关键数据(订单、支付等)。

前端埋点主要采集一些常规的操作行为,和与后端没有交互的纯前端事件。

两种埋点都存在,也能方便进行数据的交叉验证和互补。

例如在一方数据出现问题时,还可用另一方数据替代。

数据不准确的原因

由于前端埋点和后端埋点的实现方式不同,统计到的数据通常会有差异,只要范围可容忍,不用过于纠结。

当然,在出现差异较大时,则有必要质疑数据的准确性了。

造成数据不准确的原因,主要有以下几种情况。

1.网络异常

这是最常见也最直接的原因之一。

网络的拥堵、抖动、丢包等都会导致数据的异常。

2.统计口径不一致

同一指标可能存在不同的定义方式和统计口径,导致实际数据产生误差。

这就需要数据管理系统来保证数据质量了,如果还有机会写到数据管理系统这一篇,届时再详述。

3.代码质量问题

一方面,由于手机操作系统版本、开发框架、程序本身等问题可能导致SDK在某些情况下无法被正常调用或重复调用。

另一方面,埋点本身也可能出现了漏埋、错埋的失误。

数据埋点实例

埋点一般采用Key-Value的形式,Key表示某个事件,Value代表对应的值。

同属性下的多个事件可命名为同一事件ID,通过Key-Value进行区分。

这样可以在一个事件ID下区分不同维度和维度下不同的值,更重要的是,比起一个埋点一个事件的方式,Key-Value的方式具有更高的扩展性,维护成本更低。

例如对某app内上线了2个活动,并分别在2个渠道投放,想要了解2个活动的访问情况,则可设计如下埋点方式。

Key-Value设计

通过Page、Source和ActionType来确定一个事件,例如通过酒店入口点击活动A,可表示为

ActivityA_Click_HotelButton。

简化后的埋点文档如下。

简化埋点文档

除去以上字段,在正式的埋点文档中可能还会包含上报时机、埋点端(前端/后端、App/Web/小程序)、埋点模块、事件触发时间、用户信息、设备信息等公共属性或事件特定属性,视具体需求而定。

数据埋点就总结到这里。

数据产品指北

(二)—数据指标

我们所有的数据工作,包括处理、查询、分析等,其针对的数据字段,本质上都是数据指标。

所以数据指标已经是大家很熟悉的产品了。

指标既包括一些宏观通用的指标,例如PV、UV。

也有结合具体业务的特定指标,例如零售行业的动销率、周转天数,或者游戏行业的留存、ARPU等。

对企业来说,一套科学严谨的指标体系,是了解和指导公司经营的关键。

指标体系

为什么要有指标体系?

如果没有一套针对业务的指标体系,那么所有的分析都是只针对具体单点的,无法观察到业务全貌,每次的分析过程也不具备复用性。

而企业经营过程中,其实可以梳理出大量的指标,分散在各个业务流程中,若不对指标定义优先级,建立联系,则每次分析数据、定位问题时都会如大海捞针,存在大量的重复且无效的工作。

建立一套适合具体业务的指标体系,正是为了通过指标间有机的结合,能简洁明了地反映业务经营状况。

个人认为指标体系的搭建,主要是2类方式:

1.纵向构成

即对指标进行自上而下的拆解(也小有可能是自下而上的归纳)。

典型例子便是第一关键指标法。

了解增长黑客的同学,对北极星指标应该不会陌生,其本质也是要定义出在当前阶段,企业要集中全部精力关注的一个指标。

然后对该指标进行逐级拆解,最后形成的公式,这套指标体系,其实也就是该业务的增长模型。

例如某零售商,若以毛利作为第一关键指标,则可以构建如下的指标体系。

纵向指标拆解

2.横向推进

横向推进用于分析业务流程,关注其中的过程指标。

用户转化漏斗、用户行为路径都是常见的横向推进的分析模型,每个步骤下的指标共同构成了一套体系。

更宏观且长效的案例,可以参考AARRR模型,也称为海盗指标法,仍然是增长黑客的常用工具。

AARRR模型将公司需要关注的指标归结为5个阶段,分别为Acquisition(获取)、Activation(激活)、Retention(留存)、Revenue(营收)和Referral(推荐),不同阶段下可以再定义并拆解出具体的指标。

对于该模型,如果以后有机会写增长相关内容的话,再做展开。

通常来说纵向和横向的指标体系是配合使用的,共同构建出公司当前阶段经营情况的全貌。

需要注意的是,随着公司的发展,在不同阶段所关注的指标和所需的指标体系也是不同的,需要适时调整。

指标体系的重点,一是指标,二是体系,缺一不可。

更多时候我们遇到的情况并不是从0到1搭建指标体系,而是公司可能已经有了一系列的指标,但并没有形成成熟的体系,这是在做数据治理时常碰到的情况。

这种情况下,一般会经历4个阶段,我们也可以看看自己的公司目前处在哪个阶段。

阶段1:

有指标,无体系。

公司有关注的指标,但通常数据粒度较粗,深度较浅,数据有可能散落在各处。

比如常见的GMV、订单量等指标,电商公司都会关注,但每次关注都是独立的取数和单一的数据观察的过程。

阶段2:

有一定的分类和归集标准,通过合适的维度进行了区分,对于数据的查询处理要方便很多。

例如下图对指标按照商品、销售等维度做了分类。

阶段3:

指标具备可量化的衡量标准,可以更容易暴露问题,方便分析解读。

类似我们去医院体检的报告,会告知各指标的参考区间,标注出异常情况。

图片来源:

XX图片

阶段4:

形成体系,能梳理清指标间的关联关系,可观察出问题和解决问题的脉络。

指标字典

当体系架构确定后,就需要维护起对应的指标字典。

指标字典是数据标准化的前提,也是构建后续数据分析产品的基础。

通过指标字典可以对指标进行统一且唯一的管理。

规范的指标字典会对数据的维度、量纲等进行标准制定,并统一计算口径。

指标字典必须具备一义性,即一个指标一经录入,其命名、量纲、所有下钻维度的默认口径等信息都须已确定。

字典中的指标可以分为描述型和计算型,描述型又可分为基础指标和衍生指标。

基础指标:

基于单一实体的属性或行为统计得出,没有更上游的指标,即该指标的父指标是其自身。

例如订单量、日活跃用户数等都属于基础指标

衍生指标:

对单一父指标进行某些维度上的取值限定而定义出的新指标,其统计方式整体和基础指标一致。

例如按终端分别统计的PC端订单量和移动端订单量

计算指标:

对描述型指标进行计算、排序、累计等操作后定义的指标,例如客单价、ARPU值等。

也包括了一些规则不适合公开的复合指标,例如反映商品热度的商品指数,可能由商品访问量、订单量、加购量、评论量等多指标综合计算得出

指标字典实例

一份指标字典,应该包含以下必填字段。

1.指标名称:

命名最好能包含维度、量度等信息

2.指标定义:

需要详细说明指标的含义、统计口径和计算方式

3.指标类型:

基础指标/衍生指标/计算指标,或业务可能也有自己的分类方式

以及一些可选字段,例如在产品上可能有所属的模块、别名、限制条件、限制维度。

其中时间维度由于其常用性,可以考虑单独列出。

例如下图是某零售商的指标字典节选。

指标字典示例

数据指标就总结到这里。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1