设为首页收藏本站

EPS数据狗论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1938|回复: 2

大嘴巴漫谈数据挖掘:差异运营聚用户,因子分析打前站

  [复制链接]

270

主题

1万

金钱

1万

积分

资深用户

发表于 2016-11-14 13:49:37 | 显示全部楼层 |阅读模式

在产品成熟时期,产品的用户群规模和营收业绩稳定增长,提高用户忠诚,增强用户体验是这个时期的重要举措,准确及时地了解用户对产品的反馈,并以此制定针对性的改善方案,提供差异化的业务运营。

此处具体涉及用户细分和用户体验两个部分。用户细分即是将特征相似的用户归到同一个组,并对各个群进行特征刻画及分析。用户体验则是要量化现实的产品质量与用户期望之间的差距。


首先要对原始行为变量进行因子分析,将获取的公共因子作为细分变量,然后借助合适的聚类方法按照数据对象间的相似性进行分组归类,且使得组内对象相似程度较高,组间对象相似程度较低,有了细分群结果便可据此开展差异化的业务运营。


用户细分时,一般要求选取的变量对用户行为具有一定的影响,同时不能存在高度相关性,且变量的取值具有明显差异。选择用户细分的变量也不是越多越好,因为如果其中包含没有明显差异的变量,相当于放大了某些变量的实际作用,反而有可能使得用户细分结果产生偏差。

提取的样本数据包含最近登录次数、ARPU值、购买次数等变量,从经验初步判断,变量间或许存在一定的相关性,因此会首先利用因子分析产生综合变量,并将其作为后续的聚类变量。


因子分析是一种多变量化简技术,在尽可能损失少部分信息的情况下,利用降维的思想,将众多具有一定相关性的原始变量归纳为少数几个具有代表意义的公共因子,通常,公共因子能够高度概括原始变量中的信息。整个因子分析过程主要分为四个步骤,其中最为关键的是构造出公共因子并能够给出准确的业务含义。


公共因子能够解释原始变量信息的百分比称为方差贡献,正常情况下要求选取的公共因子累积方差贡献大于80%,这也是判断模型有效性的标准之一,而因子个数则是由特征值和累积贡献率共同确定。此处除了方差贡献外,还需满足特征值大于1,如果特征值小于1,说明其对应的公共因子的贡献率还不如引入一个原始变量。由此原则,如上所示,应提取前两个公共因子。


原始变量和公共因子之间的相关程度由因子载荷矩阵中的载荷值来反映,其绝对值在0到1之间,越接近1,说明二者的相关性也就越强。如上所示,可以看出因子1的两个变量ARPU值和在网时长的因子载荷系数均高于0.9。因此,变量ARPU值和在网时长归纳为因子1,变量登录次数、购买次数及最近间隔时长综合成因子2。


确定好公共因子及与原始变量间的关系后,如果还不能准确判断出其所代表的业务含义,就需进行因子旋转重新生成因子载荷矩阵。在这里,ARPU值和在网时长这两个变量在业务层面代表用户贡献或价值,因此命名为“价值贡献”因子。同理,因子2命名为“使用频度”因子。

需要注意的是,变量的选取并不仅限于以上五个变量,产品经理如果认为增加变量能够提高模型的解释程度,可以让数据分析师补充相关变量,接着再运行分析,最后从结果判断模型是否表现更好,通过不断迭代调整,直至达到最优效果。

大嘴巴漫谈,有货,有形,有味!

作者:易向军
来源:数据分析网


245

主题

5866

金钱

9410

积分

高级用户

发表于 2016-11-18 11:18:51 | 显示全部楼层
回复

使用道具 举报

43

主题

1749

金钱

3964

积分

中级用户

发表于 2017-7-13 14:41:24 | 显示全部楼层
:victory:
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

客服中心
关闭
在线时间:
周一~周五
8:30-17:30
QQ群:
653541906
联系电话:
010-85786021-8017
在线咨询
客服中心

意见反馈|网站地图|手机版|小黑屋|EPS数据狗论坛 ( 京ICP备09019565号-3 )   

Powered by BFIT! X3.4

© 2008-2028 BFIT Inc.

快速回复 返回顶部 返回列表