当前位置:首页 > 企业顾客满意度 > 正文
阅读量: 2,052

基于数据挖掘的大学生网络用户行为与偏好分析

2017年10月26日 | 作者: adminlin | 分类: 企业顾客满意度 | 

  以问卷调查的方式收集数据,采用数据挖掘的方法深度分析数据,研究在校大学生网络使用现状。严格遵循数据挖掘的步骤,对问卷数据进行预处理,通过数据挖掘平台,进行关联规则及聚类分析,得出不同用户组特征,从而挖掘出用户的上网行为模式和潜在上网规律,对网络运营商的科学运营模式提出合理的建议。

  大学生对网络使用的需求日渐增多,目前的网络质量却未达到令人满意的程度。此次研究可以让网络运营商适当改善网络,有利于网络的长足发展,实现网络运营商与校园网用户间的双赢。我们将使用数据挖掘中聚类和关联规则分析技术,深度研究分析数据,探究校园内网络用户行为现状以及偏好成因,为运营商的网络经营策略提供建议。同时也提高消费者使用网络的满意度。对于网管中心,全面掌握了校园内网络的使用状况及其发生的因素后,能对于校内的网络更有效地规范与控制,从而建立校内网络更有效的管理机制。


  一、数据挖掘


  (一)基本概念。数据挖掘是指从大量的数据中发现并抽取隐含的、未知的、有潜在应用价值的知识过程。数据挖掘的目的是为决策者提供有效的决策支持。[1]其流程依次为:数据采集、数据预处理、数据清洗、数据规约、模型建立、可视化分析。


  (二)WEKA。WEKA是一个数据挖掘实验平台,集成了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理、分类、回归、聚类、关联规则以及在新的交互式界面上的可视化等。本项目采用WEKA平台进行数据挖掘,主要运用其中的聚类和关联规则分析。


  (三)聚类分析。聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。[2]此次聚类分析选用的是K-means聚类分析方法,在Filter树中SimpleKMeans算法,并将numCluster值设为4,其余均为默认值。[3]表示将所给的属性按照一定的规则分为4类,分别表示四类不同特征的用户群体。


  (四)关联规则分析。关联规则是形如A==>B的蕴涵式,A和B分别称为关联规则的先导(LHS)和后继(RHS)。


  关联规则分析则是采用分箱离散化处理,在Filter树中Discretize算法,设阈值为0.9,默认选择前10条规则。关联规则的结果形如“A==>B

conf:(C)”,其中“A==>B”表示情况A发生且情况B发生,“conf:(C)”称为置信度(Confidence
level),其中C为百分比数值,置信度表示事件已包含A的情况下,包含B的百分比,关联规则分析得出的结果是根据置信度由高到低排列的规则。


  二、群体特征分析


  (一)聚类分析

  第一类用户占比最少,该类用户上网地点为宿舍,月生活费1548元,月上网资费66元,选择使用电信宽带,日上网时间较其他分类较多,高达10h,上网目的主要集中于看视频、社交聊天,偏娱乐方向。对这类学生深入调查可知该类用户对于网络依赖性较高,对网速要求较低。第二类用户占比最高,为三分之一,上网地点为宿舍,月生活费1319元,月上网资费70元,在所有分类中上网资费占生活费比重最高。选择电信宽带,日上网时间为4h,上网目的涵盖了除玩游戏之外的所有选项,可见该类用户上网目的较综合,几乎每个指标都与总体水平相当。第三、四类用户上网资费占生活费比重、上网目的两指标水平相当。而网络类型与上网时间不同。第三类校园无线网用户上网时间为6h,第四类电信宽带用户上网时间为4h。进一步调查可知,第三类用户与其他分类不同在于宿舍区覆盖校园无线网,价格相较其他网络稍便宜,所以该类上网资费也较低。总体分析,上网地点为宿舍、网络类型为电信宽带,上网目的为“看视频”同时“不玩游戏”,这几点几乎是所有用户的共性。这由本校女多男少特性造成,女生偏爱看视频、不玩游戏,视频可集中下载而非时刻在线,用户使用网络时间较短,视频播放多为手机播放,由此运营商可以调整套餐安排,推出相较低网速、短时长、低价位的无线网络套餐;针对少量游戏用户,有线套餐则要做到高网速、长时长、高稳定性。


  2、运营商类型与使用问题的聚类分析


    第二类用户所占比例最大,约为样本总量的一半,几乎所有指标都与总体水平一致,只比总体的选择多出一项问题选择:电信宽带无法使用无线网。因为现在的学生主要的上网工具是手机、ipad而非电脑,无法使用无线网会使很大一部分用户觉得不便捷。


  第一、三、四类用户比例都很平均,第一类用户出现的问题是:电信宽带网络无响应,而第三类用户同样表示移动CMCC也出现同样问题,由此可见两类网络的技术都不完善,仍需努力提高技术水平,提升硬件质量。第四类用户反映的情况较其他三类明显增多,可能是因为该类用户对于网络的体验要求较高,或由于地理位置、天气等因素以致上述问题出现较频繁。


  (二)关联规则分析


  1、总体属性关联分析:


  对整体属性关联规则分析,便于我们对问卷中所有问题的关联性有整体认知。从表3初步可看出属性间的关联性主要出现在上网目的、使用网络类型及使用网络会出现的问题这三者间。


  从第一条可以看出,当用户注重因素偏向于网络稳定时,用户不太能忍受网络稳定性带来的问题;从第二、三、四、八条可以看出,当用户上网主要为了玩游戏等对网速要求较高的活动时,网速并不能很好地满足用户需求;从第五、九条可以看出,在上网时间、上网目的及性别间也有不太明显的联系,女生若日上网时间限制于4h,则上网目的不太可能是玩游戏;从第六、七条可以看出,若上网地点在宿舍,用户较倾向上网看视频,且选择网络类型偏向于电信宽带。


 
  基于以上对全体属性的关联分析,初步看出校园网络用户上网以看视频、玩游戏等休闲娱乐目的为主,网速的要求一般。同时可看出大多数校园网络用户对网络的要求偏向网络的高稳定性。因此我们认为,校园网络运营商可以着手维护其网络的稳定性,在宣传时,更加突出强调其在网络稳定方面的优越性,而非单一地强调网速问题。


  2、网络类型与上网目的关联分析:


  根据整体关联分析,我们得到了更可能有关联性的属性,单独对网络类型及上网目的进行关联规则分析。从表4初步可看出,不仅网络类型与上网目的间有所关联,上网目的彼此间也有所联系。


  从第一、二、三、四、五、八、九条可看出,用户上网目的不局限于某一种或几种特定的行为,用户更愿意根据自己的需求随意选择,而非被网络的网速、网络稳定性等因素局限。从第六、七、十条可以看出,当网络类型为校园无线网或移动CMCC时,用户都不会选择玩游戏这种对网速要求较高的活动,从这点可看出校园网及移动CMCC并不能满足用户需求。


  基于以上对上网目的及网络类型的关联分析,我们可初步看出用户对学校内无线网络的网速不满意。因此我们认为,校园网络运营商应着手提高网速。同时运营商也可以试着向学生推出网速较快的无线网,更好地满足用户的需求。


  3、网络类型、上网时间与上网目的的关联分析:


  我们选择对网络类型、每日上网时间、上网目的关联规则分析。从第一、二、四条看出,当用户上网每日上网时间在4h左右时,其上网目的倾向浏览网页及社交聊天,不太可能上网看视频及打游戏;从第三条看出,当用户上网时间在6h时,用户上网时间较充裕,因此此时上网目的并不受上网时间限制;从第五条看出,网络类型为校园无线网、上网时间为4h,用户会受网速与时间的双重限制,此时用户不太可能选择玩游戏,这与受调查人群多为女生也有关。


  基于以上对网络类型、每日上网时间、上网目的的关联分析,我们初步看出用户的上网时间对其上网目的有一定的影响,进而会影响用户的网络选择。因此,校园网络运营商可以初步了解学生上网的基本情况,再针对其用户需求进行宣传。


  三、结论


  本文主要通过对约300份问卷筛选、数据预处理后,利用数据挖掘中聚类与关联规则分析,对在校大学生网络选择与使用的情况进行深度分析,得出相关结论,提出相关的意见与建议。同时丰富了电信运营商产业市场发展现状与市场竞争的相关理论体系,填补了关于大学校园内网络使用现状及未来发展策略研究的空白,对在校大学生选择电信宽带类型、电信运营商了解自身优缺点并改善软硬件条件以吸引更广泛客户群具有一定的实践指导价值。


  通过以上分析,提出以下结论:1、目前的电信运营商套餐划分有些粗糙,不能紧密贴合在校大学生网络行为特点。运营商应详细地调查校园用户的行为,制定出分类更详细、更贴近学生需求的套餐;2、学生在选择网络时较关注的因素是网速,在使用过程中用户体验最差的是网络稳定性问题。电信运营商在技术上及套餐宣传时应当依据此点做出相应措施;


  对于移动CMCC反馈的普遍问题是网速问题,对于电信宽带反馈的普遍问题是无法使用无线网路问题。前者应当改善技术问题,后者则应当适当调整自身运营策略,相应用户的需求,这样才能留住客源。



想获取更多信息,或者咨询相关业务可以关注我们的微信公众平台:SMR_gz

或者扫描下面二维码


微信平台二维码-50.jpg

好文章就要一起分享!

更多