用户画像:标签化就是数据的抽象能力

王兴说过,我们已经进入到互联网的下半场。在上半场,也就是早期的互联网时代,你永远不知道在对面坐的是什么样的人。那个年代大部分人还是QQ的早期用户。在下半场,互联网公司已经不新鲜了,大部分公司已经互联网化。他们已经在用网络进行产品宣传,使用电商销售自己的商品。

这两年引领下半场发展的是那些在讲 “大数据”“赋能”的企业,他们有数据,有用户。

通过大数据告诉政府该如何智慧地管理交通,做城市规划。

通过消费数据分析,告诉企业该在什么时间生产什么产品,以最大化地满足用户的需求。

通过生活大数据告诉我们餐饮企业,甚至房地产企业该如何选址。

如果说互联网的上半场是粗狂运营,因为有流量红利不需要考虑细节。那么在下半场,精细化运营将是长久的主题。有数据,有数据分析能力才能让用户得到更好的体验。

所以,用户是根本,也是数据分析的出发点。

假如你进入到一家卖羊肉串的餐饮公司,老板说现在竞争越来越激烈,要想做得好就要明白顾客喜欢什么。于是上班第一天,老板问你:“你能不能分析下用户数据,给咱们公司的业务做个赋能啊?”

听到这,你会怎么想?

你说:“老板啊,咱们是卖羊肉串的,做数据挖掘没用啊。”估计老板听后,晚上就把你给开了。

那该怎么办呢?如果你感觉一头懵,没关系,我们今天就来讲讲怎么一步步分析用户数据。

用户画像的准则

首先就是将自己企业的用户画像做个白描,告诉他这些用户“都是谁”“从哪来”“要去哪”。

你可以这么和老板说:“老板啊,用户画像建模是个系统的工程,我们要解决三个问题。第一呢,就是用户从哪里来,这里我们需要统一标识用户ID,方便我们对用户后续行为进行跟踪。我们要了解这些羊肉串的用户从哪里来,他们是为了聚餐,还是自己吃宵夜,这些场景我们都要做统计分析。第二呢,这些用户是谁?我们需要对这些用户进行标签化,方便我们对用户行为进行理解。第三呢,就是用户要到哪里去?我们要将这些用户画像与我们的业务相关联,提升我们的转化率,或者降低我们的流失率。”

听到这,老板给你竖起了大拇指,说:“不错,都需要什么资源,随时找我就行。”


刚才说的这三个步骤,下面我一一给你做个梳理。

首先,为什么要设计唯一标识?

用户唯一标识是整个用户画像的核心。我们以一个App为例,它把“从用户开始使用APP到下单到售后整个所有的用户行为”进行串联,这样就可以更好地去跟踪和分析一个用户的特征。

设计唯一标识可以从这些项中选择:用户名、注册手机号、联系人手机号、邮箱、设备号、CookieID等。

其次,给用户打标签。

你可能会想,标签有很多,且不同的产品,标签的选择范围也不同,这么多的标签,怎样划分才能既方便记忆,又能保证用户画像的全面性呢?

这里我总结了八个字,叫“用户消费行为分析”。我们可以从这4个维度来进行标签划分。

  1. 用户标签:它包括了性别、年龄、地域、收入、学历、职业等。这些包括了用户的基础属性。

  2. 消费标签:消费习惯、购买意向、是否对促销敏感。这些统计分析用户的消费习惯。

  3. 行为标签:时间段、频次、时长、访问路径。这些是通过分析用户行为,来得到他们使用App的习惯。

  4. 内容分析:对用户平时浏览的内容,尤其是停留时间长、浏览次数多的内容进行分析,分析出用户对哪些内容感兴趣,比如,金融、娱乐、教育、体育、时尚、科技等。

可以说,用户画像是现实世界中的用户的数学建模,我们正是将海量数据进行标签化,来得到精准的用户画像,从而为企业更精准地解决问题。

最后,当你有了用户画像,可以为企业带来什么业务价值呢?

我们可以从用户生命周期的三个阶段来划分业务价值,包括:获客、粘客和留客

  1. 获客:如何进行拉新,通过更精准的营销获取客户。

  2. 粘客:个性化推荐,搜索排序,场景运营等。

  3. 留客:流失率预测,分析关键节点降低流失率。

如果按照数据流处理的阶段来划分用户画像建模的过程,可以分为数据层、算法层和业务层。你会发现在不同的层,都需要打上不同的标签。

数据层指的是用户消费行为里的标签。我们可以打上“事实标签”,作为数据客观的记录。

算法层指的是透过这些行为算出的用户建模。我们可以打上“模型标签”,作为用户画像的分类标识。

业务层指的是获客、粘客、留客的手段。我们可以打上“预测标签”,作为业务关联的结果。

所以这个标签化的流程,就是通过数据层的“事实标签”,在算法层进行计算,打上“模型标签”的分类结果,最后指导业务层,得出“预测标签”。

美团外卖的用户画像该如何设计?

刚才讲的是用户画像的三个阶段,以及每个阶段的准则。下面,我们来使用这些准则做个练习。

如果你是美团外卖的数据分析师,你该如何制定用户标识ID,制定用户画像,以及基于用户画像可以做哪些业务关联?

首先,我们先回顾下美团外卖的产品背景。美团已经和大众点评进行了合并,因此在大众点评和美团外卖上都可以进行外卖下单。另外美团外卖针对的是高频O2O的场景,美团外卖是美团的核心产品,基本上有一半的市值都是由外卖撑起来的。

基于用户画像实施的三个阶段,我们首先需要统一用户的唯一标识,那么究竟哪个字段可以作为用户标识呢?

我们先看下美团和大众点评都是通过哪些方式登录的。

我们看到,美团采用的是手机号、微信、微博、美团账号的登录方式。大众点评采用的是手机号、微信、QQ、微博的登录方式。这里面两个APP共同的登录方式都是手机号、微信和微博。

那么究竟哪个可以作为用户的唯一标识呢?当然主要是以用户的注册手机号为标准。这样美团和大众点评的账号体系就可以相通。

当然,大家知道在集团内部,各部门之间的协作,尤其是用户数据打通是非常困难的,所以这里建议,如果希望大数据对各个部门都能赋能,一定要在集团的战略高度上,尽早就在最开始的顶层架构上,将用户标识进行统一,这样在后续过程中才能实现用户数据的打通。

然后我们思考下,有了用户,用户画像都可以统计到哪些标签。我们按照“用户消费行为分析”的准则来进行设计。

  1. 用户标签:性别、年龄、家乡、居住地、收货地址、婚姻、宝宝信息、通过何种渠道进行的注册。

  2. 消费标签:餐饮口味、消费均价、团购等级、预定使用等级、排队使用等级、外卖等级。

  3. 行为标签:点外卖时间段、使用频次、平均点餐用时、访问路径。

  4. 内容分析:基于用户平时浏览的内容进行统计,包括餐饮口味、优惠敏感度等。

当你有了“用户消费行为分析”的标签之后,你就可以更好地理解业务了。

比如一个经常买沙拉的人,一般很少吃夜宵。同样,一个经常吃夜宵的人,吃小龙虾的概率可能远高于其他人。这些结果都是通过数据挖掘中的关联分析得出的。

有了这些数据,我们就可以预测用户的行为。

比如一个用户购买了“月子餐”后,更有可能购买婴儿水,同样婴儿相关的产品比如婴儿湿巾等的购买概率也会增大。

具体在业务层上,我们都可以基于标签产生哪些业务价值呢?

锻炼自己的抽象能力,将繁杂的事务简单化

上面我们讲到的“用户消费行为标签”都是基于一般情况考虑的,除此之外,用户的行为也会随着营销的节奏产生异常值,比如双十一的时候,如果商家都在促销就会产生突发的大量订单。因此在做用户画像的时候,还要考虑到异常值的处理。

总之,数据量是庞大的,会存在各种各样的使用情况。光是分析EB级别的大数据,我们就要花很长的时间。

我们的最终目的不是处理这些数据,而是理解、使用这些数据挖掘的结果。对数据的标签化能让我们快速理解一个用户,一个商品,乃至一个视频内容的特征,从而方便我们去理解和使用数据。

对数据的标签化其实考验的是我们的抽象能力,在日常工作中,我们也要锻炼自己的抽象能力,它可以让我们很快地将一个繁杂的事物简单化,不仅方便理解,还有益后续的使用。

我们今天讲了用户画像的流程,其中很重要的一个步骤就是给用户打标签,那么你不妨想想,如果给羊肉串连锁店进行用户画像分析,都可以从哪些角度进行标签化?

最后,我们从现实生活中出发,打开你的手机,翻翻看你的微信通讯录,分析下你的朋友圈,都有哪些用户画像?如果你来给它设计标签,都有哪些种类需要统计呢。为了方便后续使用,你是如何将他们归类分组的?