注 册

三胜产业研究中心 研究报告 可研报告 商业计划书 关于我们 联系我们

全国咨询热线:400-096-0053

三胜咨询 - 中国领先的投资咨询机构

·了解三胜的实力 ·丰富成功案例

三胜观察 | 名家观点 | 项目中心 | 产业政策 | 展会峰会 | 市场策略 | 理财消费 | 创业投资 | 三胜文库

企业排名 | 案例分析 | 军事视界 | 房产观澜 | 科技前沿 | 汽车沙龙 | 社会娱乐 | 健康养生 | 图片聚焦

基于大数据时代的用户画像构建(理论篇)

2016-7-5 10:38:00  中国产业信息研究网  http://www.china1baogao.com/

核心提示:简而言之,用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而来的高度精炼的特征标识。

 

  简而言之,用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而来的高度精炼的特征标识。

  举例来说,如果你经常购买一些玩偶玩具,那么电商网站即可根据玩具购买的情况替你打上标签“有孩子”,甚至还可以判断出你孩子大概的年龄,贴上“有5-10岁的孩子”这样更为具体的标签,而这些所有给你贴的标签统在一次,就成了你的用户画像,因此,也可以说用户画像就是判断一个人是什么样的人。

  除去“标签化”,用户画像还具有的特点是“低交叉率”,当两组画像除了权重较小的标签外其余标签几乎一致,那就可以将二者合并,弱化低权重标签的差异。

  ◎用户画像的作用

  罗振宇在《时间的朋友》跨年演讲上举了这样一个例子:当一个坏商家掌握了你的购买数据,他就可以根据你平常购买商品的偏好来决定是给你发正品还是假货以提高利润。且不说是否存在这情况,但这也说明了利用用户画像可以做到“精准销售”,当然了,这是极其错误的用法。

  其作用大体不离以下几个方面:

  1.精准营销,分析产品潜在用户,针对特定群体利用短信邮件等方式进行营销;

  2.用户统计,比如中国大学购买书籍人数 TOP10,全国分城市奶爸指数;

  3.数据挖掘,构建智能推荐系统,利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌,利用聚类算法分析,喜欢红酒的人年龄段分布情况;

  4.进行效果评估,完善产品运营,提升服务质量,其实这也就相当于市场调研、用户调研,迅速下定位服务群体,提供高水平的服务;

  5.对服务或产品进行私人定制,即个性化的服务某类群体甚至每一位用户(个人认为这是目前的发展趋势,未来的消费主流)。比如,某公司想推出一款面向5-10岁儿童的玩具,通过用户画像进行分析,发现形象=“喜羊羊”、价格区间=“中等”的偏好比重最大,那么就给新产品提供类非常客观有效的决策依据。

  6.业务经营分析以及竞争分析,影响企业发展战略

  ◎构建流程

  ◎数据收集

  数据收集大致分为网络行为数据、服务内行为数据、用户内容偏好数据、用户交易数据这四类:

  ?网络行为数据:活跃人数、页面浏览量、访问时长、激活率、外部触点、社交数据等

  ?服务内行为数据:浏览路径、页面停留时间、访问深度、唯一页面浏览次数等

  ?用户内容便好数据:浏览/收藏内容、评论内容、互动内容、生活形态偏好、品牌偏好等

  ?用户交易数据(交易类服务):贡献率、客单价、连带率、回头率、流失率等当然,收集到的数据不会是100%准确的,都具有不确定性,这就需要在后面的阶段中建模来再判断,比如某用户在性别一栏填的男,但通过其行为偏好可判断其性别为“女”的概率为80%。

  还得一提的是,储存用户行为数据时最好同时储存下发生该行为的场景,以便更好地进行数据分析。

  ◎行为建模

  该阶段是对上阶段收集到数据的处理,进行行为建模,以抽象出用户的标签,这个阶段注重的应是大概率事件,通过数学算法模型尽可能地排除用户的偶然行为。

  这时也要用到机器学习,对用户的行为、偏好进行猜测,好比一个 y=kx+b 的算法,X 代表已知信息,Y 是用户偏好,通过不断的精确k和b来精确Y。

  在这个阶段,需要用到很多模型来给用户贴标签。

  ?用户汽车模型

  根据用户对“汽车”话题的关注或购买相关产品的情况来判断用户是否有车、是否准备买车

  ?用户忠诚度模型

  通过判断+聚类算法判断用户的忠诚度

  ?身高体型模型

  根据用户购买服装鞋帽等用品判断

  ?文艺青年模型

  根据用户发言、评论等行为判断用户是否为文艺青年

  ?用户价值模型

  判断用户对于网站的价值,对于提高用户留存率非常有用(电商网站一般使用RFM 实现)还有消费能力、违约概率、流失概率等等诸多模型。

  ◎用户画像基本成型

  该阶段可以说是二阶段的一个深入,要把用户的基本属性(年龄、性别、地域)、购买能力、行为特征、兴趣爱好、心理特征、社交网络大致地标签化。

  为什么说是基本成型?因为用户画像永远也无法100%地描述一个人,只能做到不断地去逼近一个人,因此,用户画像既应根据变化的基础数据不断修正,又要根据已知数据来抽象出新的标签使用户画像越来越立体。

  关于“标签化”,一般采用多级标签、多级分类,比如第一级标签是基本信息(姓名、性别),第二级是消费习惯、用户行为;第一级分类有人口属性,人口属性又有基本信息、地理位置等二级分类,地理位置又分工作地址和家庭地址的三级分类。

  ◎数据可视化分析

  这是把用户画像真正利用起来的一步,在此步骤中一般是针对群体的分析,比如可以根据用户价值来细分出核心用户、评估某一群体的潜在价值空间,以作出针对性的运营。如图:

  ◎后记:

  这里只写了用户画像的构建流程和一些原理,下次有时间我会写篇关于大数据平台的实践文章,并说一下一些行为模型的算法原理,有兴趣的朋友可以关注下。

 

 

返回网站首页>>

责任编辑:S355

免责声明:

1、本网转载文章目的在于传递更多信息,我们不对其准确性、完整性、及时性、有效性和适用性等作任何的陈述和保证。本文仅代表作者本人观点,并不代表本网赞同其观点和对其真实性负责。

2、中国产业信息研究网一贯高度重视知识产权保护并遵守中国各项知识产权法律。如涉及作品内容、版权和其它问题,请马上与本网联系更正或删除,可在线反馈、可电邮(link@china1baogao.com)、可电话(0755-28749841)。

健康中国,体检行业酝酿千亿商机

专业健康体检是朝阳产业,未来将保持25%的速度增长:目前欧美等发达国家的健康体检已经发展的比较成熟,国内起步较...[详细]

外贸高压之下的华丽蜕变

中国加入世贸组织15年的进出口增速是新中国成立以来最快的,也是同期世界上最快的。目前我国已经是世界第一大贸易国...[详细]

政策红利不断,变压器行业乘风而上

西部大开发,西电东送是继城网、农网改造之后,在三峡工程建设中掀起的输变电设备需求高峰,其中HVDC工程增多,7...[详细]

电影“IP+”构建文化娱乐新生态圈

文化娱乐内容持续IP化:纵观2015年,整个泛娱乐领域内最热的主题即是“IP”。IP是英文“Intellect...[详细]

手机游戏市场潜力巨大 游戏体验越来

电脑游戏仍然具有明显优势,但是已经逐渐停止增长,而手机游戏却刚开始腾飞。2015年移动游戏市场规模超过400亿...[详细]

精准医疗时代,基因测序带来的千亿大产

新一代基因测序可以高效地构建大样本量的基因组数据库,结合个体的基因组数据库,结合个体临床数据进行解读可以实现基...[详细]

全国统一服务热线:400-096-0053(7*24小时) 客户服务专线:0755-25151558 83970506 82202306 82209009 83970558 传真:0755-28749841

可行性研究报告、商业计划书:0755-25151558 市场调研、营销策划:0755-82202306 IPO咨询专线:0755-82209009 客服邮箱:server@china1baogao.com

在线咨询QQ:1559444945 951110560 媒体合作、广告合作:0755-83970586 网站合作QQ:307333508 招聘邮箱:hr@china1baogao.com

Copyright © 2004-2016 www.China1baogao.Com All Rights Reserved. 版权所有 中国产业信息研究网 三胜咨询TM 旗下网站 粤ICP备13026489号-3