数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc

上传人:wj 文档编号:3389795 上传时间:2023-05-01 格式:DOC 页数:68 大小:608.50KB
下载 相关 举报
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第1页
第1页 / 共68页
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第2页
第2页 / 共68页
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第3页
第3页 / 共68页
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第4页
第4页 / 共68页
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第5页
第5页 / 共68页
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第6页
第6页 / 共68页
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第7页
第7页 / 共68页
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第8页
第8页 / 共68页
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第9页
第9页 / 共68页
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第10页
第10页 / 共68页
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第11页
第11页 / 共68页
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第12页
第12页 / 共68页
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第13页
第13页 / 共68页
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第14页
第14页 / 共68页
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第15页
第15页 / 共68页
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第16页
第16页 / 共68页
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第17页
第17页 / 共68页
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第18页
第18页 / 共68页
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第19页
第19页 / 共68页
数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc_第20页
第20页 / 共68页
亲,该文档总共68页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc

《数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc》由会员分享,可在线阅读,更多相关《数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc(68页珍藏版)》请在冰点文库上搜索。

数据挖掘技术在贸易公司客户流失预测中的应用研究(周鑫1203)Word文档格式.doc

在国外很多的行业己经具有成功的应用。

例如,贸易行业的应用领域主要有客户关系管理,客户欺诈分析,客户流失分析,客户消费模式分析,市场推广分析等。

在国内随着对数据挖掘技术的重视,数据挖掘技术的应用研究也越来越广,其中对贸易行业的客户流失分析就是一大热点。

客户流失分析是通过对以往流失客户的历史数据进行分析,找出可能流失客户的特征,及时采取相应的措施,减少客户流失的发生。

这对企业降低运营成本,提高经营业绩有着极为重要的意义。

本文首先阐述了数据挖掘的定义、功能以及流程,分析了CRM的内涵以及体系框架,并指出了贸易公司客户流失的原因以及实现客户流失预测对贸易公司的必要性,在此基础上将贸易公司客户流失原因归类分析,拟出贸易公司客户流失KPI及相应对策。

其次,重点设计了贸易公司的客户流失预测模型。

针对常用的决策树分类挖掘算法进行分析,指出了存在的问题,提出了基于加权属性和预剪枝策略的决策树分类挖掘的改进算法。

该算法能够更好的解决贸易行业数据挖掘中大数据量,效率高的要求。

同时基于决策树挖掘改进算法,对客户流失预测模型的架构进行了总体的设计,对客户相关的数据进行了收集、集成,根据拟定的KPI进行数据重组。

并在明确客户流失预测模型构建思想的前提下,给出了基于决策树挖掘改进算法的客户流失预测模型详细的建立过程。

接着,针对具体的贸易公司,将本文建立的客户流失预测模型进行应用,详细分析了模型应用过程中所涉及到数据清洗、数据转换以及通过决策树分类挖掘改进算法建立的客户流失预测模型。

最后,本文对预测模型的结果进行评估与分析,给出了针对性的对策建议,有效地改善客户流失现象,同时证明了决策树分类改进算法的有效性和实用性。

关键词:

数据挖掘;

客户流失预测;

贸易公司;

决策树

ABSTRACT

Withdataminingtechnologydevelopment,theimportanceofdatamininghasbeenrecognizedRealizedbymoreandmorepeople

moreandmorepeople,itisknownItisknownthatapproachingthedatumtobuildamathematicalmodeltodiscoverthelatentbusinessrules.

tousethedatathroughtheestablishmentofmathematicalmodelofthemethodtofindhiddenbusinessrules.Manyindustriesinforeignthe

countrieshashave

havebeenthesuccessfulcases.

beenasuccessfulapplication.Forexample,theinsuranceindustryapplicationsaremainlycustomerrelationshipmanagement,customerfraudanalysis,customerchurnlapsed

analysis,customerconsumptionpatterns,analysis,marketinganalysis.Inthecountrywiththeimportanceofdatamining,dataminingtechniquesappliedresearchareincreasinglybroad,inwhichtheinsuranceindustry,customerchurnlapsed

analysisisahottopic.Customerchurn;

lapsed

analysisisthelossofcustomersthroughthepast,historicaldataanalysistoidentifythecharacteristicsoftheusermaysurrenderpromptlytakeappropriatemeasurestoreducecustomerchurnlapse

happening.Thisenterprisesenterprise

toreducereduce

operationalcostsandimprovebusinessperformancehasextremelyimportantsignificance.

Thispaperbeginsbydescribingthedefinitionofdatamining,functionandprocesses,analysisofthecontentaswellastheCRMsystemframework,andpointsoutthereasonsforthelossofinsurancecompanyclientsandtheachievementofcustomerchurnlapsed

predictionoftheneedforinsurancecompanies,insurancecompanieswillbeonthisbasis,classifythereasonsforcustomerchurnlapsed

analysistobeinsurancecompanieslosecustomersKPIandthecorrespondingcountermeasures.Second,thefocusonthedesignoftheinsurancecompany'

scustomerchurnpredictionmodels.DecisiontreeDecisionmakingtree

forclassificationminingalgorithmscommonlyusedintheanalysis,pointingouttheexistenceoftheissue,basedontheweightedattributesandpre-pruningstrategyforimproveddecisiontreeclassificationalgorithmformining.Thealgorithmcanbeabettersolutiontotheinsuranceindustryindatamininglargedatavolumeandhighefficiencyrequirements.AtthesametimeimprovedalgorithmbasedondecisionDecisionmakingtree

treeminingonchurnpredictionmodelsintheframeworkoftheoveralldesignofthecustomer-relateddatacollection,integration,undertheproposedrestructuringofKPIdata.Andaclearcustomerchurnpredictionmodelbuiltunderthepremiseofthoughtisgiventoimprovethealgorithmbasedondecisiontreeminingcustomerchurnpredictionmodelbuildingprocessindetail.Then,specificcommerciallifeinsurancecompany,willthissetupcustomerchurnpredictionmodelapplication,adetailedanalysisofthemodelapplicationprocessinvolvedinthedatacleansing,dataconversionaswellasthroughimproveddecisiontreeclassificationalgorithmforminingcustomerchurnpredictionmodelestablished.

Finally,predictionmodelstoassesstheresultsandanalysisaregivenspecificpolicyproposals,effectivelyimprovecustomerturnover,isalsoshownthatdecisiontree

classificationalgorithmtoimprovetheeffectivenessandpracticality.

Keywords:

datamining;

customerchurnprediction;

insurance;

decisiontree

目录

1绪论 1

1.1研究背景及意义 1

1.1.1研究背景 1

1.1.2研究意义 2

2研究意义 2

1.2国内外研究现状 3

1.2.1数据挖掘的研究现状 3

1.2.2挖掘技术在客户流失预测的研究现状 5

1.3论文研究内容及方法 6

1.4论文的组织结构 7

2研究的理论基础 8

2.1数据挖掘理论概述 8

2.1.1数据挖掘技术概括 8

2.1.2数据挖掘的功能 9

2.1.3数据挖掘的流程 12

2.1.4数据挖掘的主要工具 13

2.2CRM理论 14

2.2.1CRM的内涵 14

2.2.2CRM的体系框架及核心技术 15

2.2.3贸易公司CRM介绍 18

2.3本章小结 19

3贸易公司客户流失预测模型的设计 20

3.1贸易公司的客户流失预测 20

3.1.1贸易公司客户流失的原因剖析 20

3.1.2客户流失预测对贸易公司的必要性 23

3.1.3客户流失预测的关键指标 24

3.1.4数据挖掘在贸易市场中的应用 26

3.2决策树挖掘算法的分析与改进 29

3.2.1决策树挖掘算法的描述 29

3.2.2决策树挖掘算法的不足 30

3.2.3决策树挖掘算法的改进思想 31

3.2.4决策树挖掘改进算法的描述 31

3.3客户流失预测模型的总体架构 32

3.4客户相关数据的准备 34

3.4.1贸易公司业务分析 34

3.4.2数据的收集 34

3.4.3数据的集成 36

3.5客户流失预测模型的构建 38

3.5.1贸易行业客户流失管理模型 38

3.5.2客户流失预测模型的构建思想 41

3.5.3基于决策树的贸易客户流失建模分析 43

3.6本章小结 45

4贸易公司客户流失预测模型的应用分析 46

4.1案例背景及挖掘工具介绍 46

4.1.1案例背景 46

4.1.2挖掘工具介绍 46

4.2客户流失预测模型的应用过程 48

4.2.1客户流失预测数据清洗 48

4.2.2客户流失预测数据转换 49

4.2.3决策树改进算法建立预测模型 50

4.3决策树改进算法建立预测模型的效果评估 52

4.4贸易客户流失预测的对策建议 53

4.4.1贸易客户流失控制策略制订的基本原则 53

4.4.2控制贸易客户流失的具体举措 54

4.5本章小结 55

5总结与展望 56

绪论

1绪论

1.1研究背景及意义

1.1.1研究背景

伴随着改革开放的三十多年,我国贸易业自1978年来,发展形势一片大好。

以年均将近29.6%左右的速度迅猛发展,取得了世人瞩目的成绩。

到2005年中国年贸易成交额已达4927亿万元人民币,世界排名第11位,比2000年上升了5位。

中国贸易市场已成为亚洲第二大贸易市场,仅次于日本,同时也是全球增长速度最快的贸易市场之一。

2005年末,我国贸易业的交易总量同比增长27.03%,大概是“九五”期末的4.63倍,截止到2007年11月份,我国各类贸易公司数量与2005年末相比同比增长52.6%,贸易额同比增长24.4%,国内贸易市场显示出蓬勃而持久的成长力。

与此同时,国内贸易市场中外资贸易公司的进入加大了贸易行业竞争力度。

另外在中国贸易的发展过程中,对外贸易的比重逐年加大。

外资贸易公司数量在加入了WTO之后,有了明显的增加,与目前相比,几乎占了中国贸易公司的总数百分之二十。

截至2004年,外资贸易公司的贸易额增幅是全国平均水平的1倍多。

外资贸易公司凭借多年探索的管理模式,在国内的竞争中处于优势地位。

在我国贸易业,不同的公司提供的产品种类、贸易方式各不相同,并且分类繁多,按对象可以分为内需贸易,对外贸易等。

按产品可以分为实物贸易,信息贸易,文化贸易等。

因此数据统计较为困难。

本文所探讨的贸易或贸易公司主要基于实体贸易的基础之上而讨论的。

传统贸易公司的起步基本以国内地区间贸易为主,随着贸易行业,贸易公司的发展以及行业内公司架构的改变,很多贸易公司都在它们的业务中增加了跨区域经意,对外贸易等交易手段,甚至提供信息交易等交易方式。

而当前的贸易行业竞争已经到了白日化,既有内部的又有外部的。

对贸易公司来说,来自它们内部的挑战是如何更好地利用它们最大的资本——数据。

面对外部的市场竞争,各大贸易公司正在寻找一种最有效的方法,通过维护与客户的关系,创造客户价值来保留和竞争优质客户。

客户流失预测,就是使用数据挖掘的方法,整合客户历史的海量数据,通过对客户基本状态属性与历史行为属性等数据进行深入分析,提炼出已流失客户在流失前具有的特征,建立流失模型,预测出将在近期流失的客户。

从上世纪90年代后国外的贸易公司为顺应贸易业务和信息技术相融合的大趋势,斥巨资将过去分散的、功能较弱的、以业务自动化处理为主的单一计算机系统,改造为功能强大的集中式的计算机应用系统。

国内的贸易公司目前已经在探索集中式管理的模式,已经拥有比较完善的计算机通信网络,贸易公司主机和服务器的处理容量也在不断增加,这就为数据大集中的实现提供了有力的物质基础。

贸易业务数据大集中后,通过数据挖掘技术,可以有效地控制贸易交易的信用风险,能够形成以客户管理为框架的成本控制体系,从而实现贸易公司经营资源的优化配置等等功能。

更为重要的是,数据仓库可以为各级贸易公司经营决策提供强大的可信赖的支持,减少决策的盲目性。

有了集中的数据仓库后,贸易业务多元化,服务功能综合化、全能化,完成从分业经营到混业经营的转化,贸易网络化的发展将改变传统的单一经营模式,实现贸易业务综合化经营。

总而言之,正是由于以上贸易的信息化,才使得贸易公司应用数据挖掘技术成为可能。

本文就是在这样的背景下,提出了基于数据挖掘的贸易公司客户流失预测的研究课题。

1.1.2研究意义

2研究意义

首先,争取新客户的成本显然要比保持老客户要昂贵得多,加之新老客户消费额的差距,一个新客户的消费额是无法和一个老客户的消费相比的,从客户盈利性角度考虑就非常不经济。

如果按照“大进大出”的漏斗模式来经营的贸易类企业,在如此竟争越来越激烈激烈的买方市场就会举步艰难。

根据调查机构的数据显示,“用户保持率”增加5%,就有望为运营商带来85%的利润增长,发展一位新客户的成本是挽留一个老客户的4倍;

客户忠诚度下降5%,则企业利润下降25%;

向新客户推销产品的成功率是15%,然而,向老客户推销产品的成功率是55%。

这些数据表明:

如何防范老客户流失必须要引起高度重视。

因此进行客户流失分析是极为重要的。

其次,根据二八原理和企业数据分析,在贸易类企业的客户中,公司80%的利润源于20%的客户,如果想要增加企业利润,很大程度上是如何留住这20%客户并在一定程度上增加这些客户的数量。

客户流失分析的意义在于,是企业管理者能清晰认识到这20%的客户是谁,流失的根本原因是什么,只有企业认识到这一点,才能针对原因制定合理的策略保留客户。

综上所述,通过有效的客户流失管理手段降低客户流失,不仅能从现有客户中获取更多收益,减少销售成本,而且能为企业流得口碑。

更重要的是,对贸易类企业来讲,基于贸易服务和交易产品的特点,贸易类企业只要保持住了现有客户,维持了和客户之间的交易关系,这种交易关系已经毫无疑问地转化成持续交易或是间接消费的形式与品牌口碑。

研究客户流失可以帮助企业更清楚地认识自己的客户是谁,客户的需求是什么,从而迅速、准确地预测和满足客户的需求,增加客户对企业的依赖度,将客户牢牢地吸引在自己的客户群里。

1.2国内外研究现状

1.2.1数据挖掘的研究现状

数据挖掘(DataMining,简称DM),又称数据库中的知识发现(KnowledgeDiscoveryinDatabase,简称:

KDD),是指从大型数据库或数据仓库中提取隐含的、未知的、特殊的及有潜在应用价值的信息或模式,它是数据库研究中的一个很有应用价值的新领域,融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术[5]。

数据挖掘技术可以使很多机构发现分析人员发现不了的隐含的关系、模式、出人意料但有价值的事实、趋势、例外和异常等,从而对各自的行业有了更深的了解。

这表明,虽然数据挖掘是一门新兴学科,但它有着巨大的潜在价值。

目前,国外数据挖掘的发展趋势其研究方面主要有:

对知识发现方法的研究进一步发展,如注重对Bayes方法以及Boosting方法的研究和提高,传统的统计学回归法在KDD中的应用,KDD与数据库的紧密结合。

在应用方面包括:

KDD商业软件工具不断产生和完善,注重建立解决问题的整体系统,而不是孤立的过程[6]。

用户主要集中在大型银行、保险公司、电信公司和销售业。

国外很多计算机公司非常重视数据挖掘的开发应用,IBM和微软都成立了相应的研究中心进行这方面的工作。

许多著名的计算机公司开始尝试着KDD软件的开发,比较典型的如SAS公司的EnterpriseMiner,IBM公司的IntelligentMiner,SGI公司的setMiner,SPSS公司的Clementine等[7]。

以下简要地介绍国外有关数据挖掘技术在贸易业中应用的成功案例没有必要介绍这些产品,和提纲提到的不符,倒是可以大概介绍一下CRM的逻辑模块,以及DM在某个模块上的应用。

而且下边的抄袭嫌疑很大,如被软件过滤出来,通过的可能性就非常小了。

Reuteres是世界著名的金融贸易信息服务公司,其利用的数据大都是外部的数据,这样数据的质量就是公司生存的关键所在,必须从数据中检测出错误的成分。

Reuteres用SPSS的数据挖掘工具SPSS/Clementine,建立数据挖掘模型,极大地提高了错误的检测,保证了信息的正确和权威性。

美国的菲尔曼贸易公司运用企业数据挖掘系统对付欺诈行为和代位追偿进行分析,应用这个系统的结果是:

该解决方案通过提高菲尔曼基金公司的财务和经营报告能力所节约的成本和所增加的收入,累计每年为公司的底线增加2-3千万美元;

AXAOYAK利用数据挖掘技术提高市场份额,提高了销售利润,并且对理赔客户进行欺诈识别,降低赔付风险;

美国的ALLSTATEFINANCIAL贸易公司利用数据挖掘技术对不同客户的消费特征进行分析,制定以客户为中心的营销策略;

法国的GROUPAMA贸易公司利用数据挖掘技术对客户行为和客户价值进行分析,提供销售决策支持;

CHUBB&

SON贸易公司应用数据挖掘技术对客户价值进行分析,制定BTB销售策略和交叉销售;

COFACE贸易公司和Fireman'

sFund贸易公司利用数据挖掘技术对客户进行风险评估,为制定费率及其理赔策略提供依据;

澳大利亚的BlueCrossandBlueShieldofFlorida贸易公司、AllianzElementar贸易公司和SPANISHINSURER贸易公司利用数据挖掘工具对客户忠诚度、客户细分和客户保持进行分析,以减少客户流失。

TurboCRM公司是专业从事CRM研发和服务的国际公司,其产品TurboCRM具备灵活的应用模式。

中国最大的B2B贸易公司世界贸易网采用了TurboCRM。

其中的TurboDSS包含了市场分析、客户特征分析等,可以从客户——产品——客户特征——产品特征等多种条件下进行数据分析,从而为公司发展提供科学、量化的数据支持。

美国艾克国际科技有限公司(AkuP)的产品是全球市场中,为数不多能同时涵盖网络商务与客户互动的前端及后端分析的完整功能的。

后端提供的客户行为追踪,客户服务及客户行销的数据挖掘功能,让企业能够做到一对一行销的目标。

与国外相比,国内对KDD的研究稍晚,目前进行的大多数研究项目是由政府资助进行的,如国家自然科学基金、863计划、“九五”计划等。

1993年国家自然科学基金开始对数据挖掘研究进行支持。

国内从事数据挖掘研究的人员主要在大学,也有部分在研究所或公司。

所涉及的研究领域很多,一般集中于学习算法的研究,数据挖掘的实际应用以及有关数据挖掘理论方面的研究。

到目前为止,国内还没有成熟的数据挖掘产品,或者说真正意义上大规模、有计划、有步骤地把数据挖掘运用到实际的贸易经营决策中的几乎是空白。

其中,北京系统工程研究所对模糊方法在知识发现中的应用进行了较深人的研究,北京大学也在开展对数据立方体代数的研究,华中理工大学、复旦大学、浙江大学、中国科技大学、中科院数学研究所、吉林大学等单位开展了对关联规则开采算法的优化和改造;

南京大学、四川联合大学和上海交通大学等单位探讨、研究了非结构化数据的知识发现以及Web数据挖掘。

吉根林、田金兰用决策树和关联规则方法对贸易交易及客户满意度等信息数据库进行风险分析,从而找出交易人满意度降低的特征,得出一些实用的提高客户整体满意度和控制投资风险的规则。

随着研究的深入,学者们探讨了应用各类数据挖掘方法建立客户流

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2