移动用户细分案例 - CPDA中国数据分析学习网
当前位置 > 首页 > 行业案例 > 移动用户细分案例

移动用户细分案例

来源:CPDA中国数据分析学习网 | 时间:2018-02-07 | 作者:数据分析学习网

移动公司想结合用户通话行为,推荐相应套餐,或者结合用户现有套餐优化用户套餐,提供个性化套餐,从而对客户进行精准营销,增加客户粘性。为此,移动公司收集了下列数据,移动公司收集到的数据包含下列字段:

变量名称 变量标签
Customer_ID 用户编号
Peak_mins 工作日上班时间电话时长
OffPeak_mins 工作日下班时间电话时长
Weekend_mins 周末电话时长
International_mins 国际电话时长
Total_mins 总通话时长
average_mins 平均每次通话时长

(具体数据可在数据资源中下载)

我们可以选取聚类方法对客户进行细分,这里选取k-means聚类方法进行分析。k-means聚类要求,纳入的聚类变量一般为数值型变量,而且聚类变量之间不应该有较强的线性相关关系,如果变量间存在较高的线性关系且能够相互替代,那么计算距离时,这些变量会对距离重复贡献,一定程度上影响到聚类结果。

对数据进行预处理,数据无缺失值,异常值分析显示异常值较多,结合实际情况认为有可能是特殊人群,所以在此不作处理。通过查看相关系数矩阵看到peak_mins和total_mins相关性很高,所以只选取其中一个,然后构造一个新的变量peak_mins/total_mins,由于新构造的变量取值与其他变量取值范围相差较大,因此,在聚类分析时,选择标准化处理之后的数据进行聚类(datahoop可以在分析时默认进行标准化处理);

对数据进行聚类分析,选取变量为:peak_mins/total_mins,offpeak_mins,weekend_mins,international_mins,total_mins,average_mins,聚类个数为5。

平均轮廓系数为0.246左右,虽然轮廓系数并没有接近1,但也是合理的。在实际聚类过程中并不是每次聚类都会达到较高的轮廓系数,轮廓系数不高说明类之间区分性不是特别明显,但并不代表类之间没有区分。

根据聚类结果分析每一类客户在现有变量上的特征,这里选取平均值作为参考依据。得到聚类分析描述结果为:

类别 Peak_mins OffPeak_mins Weekend_mins International_mins Total_mins average_mins
4 815.9999999 294.1333334 33.4999999 238.85278 1143.63333 13.8985
1 1717.28 384.7100001 50.3211111 515.18282 2152.31111 3.56217
0 815.4375 437.5312501 62.7977272 280.90458 1315.76648 3.29366
2 1149.907936 166.593651 54.0984128 298.54868 1370.6 3.16081
3 50.1710058 40.20975068 18.3036928 14.222838 108.684449 2.43237 

对类进行特征分析:

1类:总通话时间(Total_mins)最长,上班通话通话时间(Peak_mins)最长,国际通话(International_mins)最长,命名为高端商用客户;

0类:下班通话时间(OffPeak_mins)最长,周末通话时间(Weekend_mins)最长,上班和国际通话时间居中,命名为中端日常客户;

2类:上班通话通话时间(Peak_mins) 和国际通话(International_mins)仅次于第1类,周末通话时间(Weekend_mins)居中,总通话时间(Total_mins)较长,命名为中端商用客户;

4类:平均每次通话(average_mins)时长最长,命名为长聊客户;

3类:各项通话时间均很低,命名不常使用客户。

综上,根据以上客户细分的结果和特征分析,移动产品开发部门有针对性的开发设计套餐品类,满足不同类型客户的实际需求。比如:高端用户推荐各项指标偏高,套餐费用也偏高的套餐;中端用户和中高端用户可以较高端用户偏低一点进行套餐推荐,常聊用户可以推荐符合常聊特点的套餐,比如通话次数优惠类套餐,低端用户可以推荐资费便宜的套餐。从而增加客户黏性,提高客户满意度,最终提高客户的生命周期价值。