ImageVerifierCode 换一换
格式:DOC , 页数:5 ,大小:34KB ,
资源ID:1366170      下载积分:1 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-1366170.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(logistic回归方法及在客户流失分析中的应用.doc)为本站会员(wj)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

logistic回归方法及在客户流失分析中的应用.doc

1、Logistic回归方法及在客户流失分析中的应用1 Logistic回归方法1.1 Logistic回归方法概述Logistic回归是一种描述多种独立变量与因变量(只有两种结果)之间关系的模型逼近法,其主要目的是为了进行分类,同时预估事件发生的概率。它可以考察多个属性变量在识别将要流失客户方面的集成贡献。应用Logistic回归方法可以深入理解客户流失的原因,分析哪些因数对于客户流失有影响,从而得到如何处理客户流失的线索。1.2 Logit变换在客户流失分析问题中,给定一个客户,我们可以设客户选择方案Y=1表示客户正常使用,Y=0表示客户流失;P表示客户选择某一方案的概率,那么一定有0P1。由

2、于Y取值离散,因此很难用线性模型描述概率P与自变量的关系,另外如果P接近两个极端值,此时一般方法难以较好地反映P的微小变化。为此在构建P与自变量关系的模型时,变换一下思路,不直接研究P,而是研究P的一个严格单调函数G(p),并要求G(p)在P接近两端值时对其微小变化很敏感。于是Logit变换被提出来:Logit(p)=ln() 其中当p从01变化时,Logit(p)从-+,这个变化范围在模型数据处理上带来了很大的方便,解决了上述面临的难题。1.3 Logistic回归模型 若用X=(X1,X2,X3,X4,X5,Xn)表示可以在用户消费数据库中得到的描述性变量,那么我们建立的逻辑回归模型的数学

3、表达式为:Logit(P)=ln()=+1X1+2X2+3X3+nXn =+ (1)其中:P(Y=1丨X)+P(Y=0丨X)=1式(1)中,Xi是自变量,代表参与逻辑回归分析的各种描述性字段;i是逻辑回归后各个自变量的系数,表示:当因数Xi每改变一个测量单位是所引起的对数的自然改变量;代表截距。Logistic回归模型的建立不是一个简单的过程,它的基本流程简要说明如下:(一)定义变量。强大的数据库资源是进行建模的坚实基础,在众多自变量中尽量选择对因变量产生影响作用的变量,将没有影响或影响较小的变量排除在模型之外,对这些变量进行定义并收集足够的数据资料。(二)数据预处理。采用统计软件,选取合适的

4、自变量筛选方法,筛选出对因变量产生影响的关键变量,得出符合模型需要的变量系数、最大似然估计值和显著性等数据。(三)根据得出的一系列数据建立模型。(四)将模型推广到整个客户市场,分析客户流失状况,实旋结果评价与分析。Logistic回归方法作为数据挖掘工具中的一种,可以将观察所得的分类结果和与分类结果有关的变量指标结合起来,发现它们之间的某种关系,这种关系的可靠程度往往取决于观察分类的精确度和有关变量指标集合的充分程度。Logistic回归采用观察分类结果作为输入相当于在建模过程中包含输入性系统误差,因此对新样本的分类必然会以准确率为代价产生一些错误分类。尽管如此Logistic回归方法仍然不失

5、为一种有效的辅助分类工具。在具体应用时,不可能在分类上做到尽善尽美,但是应该尽量使误差最小。在对Logistic回归方法进行简要了解之后。结合实际情况建立Logistic回归模型对客户进行流失预测并分析导致其流失的关键变量。2 Logistic回归方法的应用下面以通信公司为例,介绍Logistic回归方法在客户流失分析中的实际运用。2.1定义变量根据变量的定义,将客户流失状况作为因变量,其他变量作为自变量。 客户流失:客户是否从公司流失,:客户流失,:正常使用。 年龄(单位:岁):数值型变量。 性别:男,:女。 所在地区:客户所在的地区,:市区,:市郊。 教育程度:高中及以下;:大专,:本科及

6、以上。 通话时长(单位:分钟):平均每个客户每月的通话时间。 主叫比例:主叫比例主叫次数(被叫次数主叫次数)。 短信条数(单位:条):用户收发短信的总条数。 基本月租(单位元):指不同品牌用户每月向通信公司缴纳的固定月租费。 投诉次数(单位:次):数值型变量。 入网时长(单位:月):客户入网的时间长度。 GPRS费用(单位:元):用户由于使用GPRS数据业务而产生的通信费用,该业务按照使用数据流量计费。 (单位:元)费用:用户由于使用数据业务而产生的通信费用,该业务按照使用数据流量计费。2.2 数据预处理使用SPSS11.5统计软件(Logistic Regression)对数据进行预处理。由

7、于自变量很多,并且不一定都是有效的自变量。所以在建模是需要引入对因变量有影响作用的变量,将没有影响或者影响不明显的变量排除在模型之外。因此,可以采取假设检验为基于最大似然估计值的向前逐步回归法。2.3 建立Logistic回归模型及分析在回归模型的建立过程中,根据虚拟的客户数据,共筛选出四个变量,包括投诉次数、入网时长、费用、话费额。得到分类函数:F=2.578-0.512*投诉次数-0.131*费用0.326*入网时长+0.008*话费额其中,F表示为所估计的客户流失与正常使用的比数比;X1为投诉次数;X23为费用;X3为入网时长;X4为话费额;i(-0.512,、-0.131、-0.326、+0.008)表示因素Xi改变一个测量单位时所引起的对数的自然改变量;2.578表示截距。由上式可知,4个变量中与有正相关关系的是入网时长和话费额,成负相关的变量有投诉次数、费用,个变量的重要性程度划分依次为投诉次数费用入网时长话费额。以上的线性分类函数,也就是建立起来的一个简单的初步模拟客户流失情况的回归模型。

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2