数据挖掘技术在CRM中的应用张喆.docx
《数据挖掘技术在CRM中的应用张喆.docx》由会员分享,可在线阅读,更多相关《数据挖掘技术在CRM中的应用张喆.docx(19页珍藏版)》请在冰点文库上搜索。
![数据挖掘技术在CRM中的应用张喆.docx](https://file1.bingdoc.com/fileroot1/2023-5/9/039f7d85-fab5-440a-bc44-8de99fc2ae42/039f7d85-fab5-440a-bc44-8de99fc2ae421.gif)
数据挖掘技术在CRM中的应用张喆
数据挖掘技术在CRM中的应用
张吉吉1,常桂然2,黄小原1
(1.东北大学工商管理学院,辽宁沈阳 110004;
2.东北大学信息科学与工程学院,辽宁沈阳 110004)
数据挖掘、专家系统和人工智能、呼叫中心等。
CRM的焦点是自动化并改善与销售、市场营销、客
户服务和支持等领域的与客户关系有关的商业流
程。
它的目标是缩减销售周期和销售成本、增加收
入、寻找扩展业务所需的新市场和渠道以及提高客
户的价格、满意度、盈利性和忠诚度[22]。
图1描述
了CRM的体系结构。
图1 CRM的体系结构
从体系结构角度看,整个CRM架构可以分为
三个关键部分:
(1)操作层次的CRM:
用于自动地集
成商业过程,包括对销售、营销和客户服务三部分业
务流程的信息化,客户接触点、渠道、前后端的集
成[36];
(2)分析层次的CRM:
用于操作层次CRM和
客户互动产生的信息的分析处理,通过基于数据仓
库的数据挖掘产生商业智能以支持企业战略战术的
决策[32],包括:
客户服务支持[11]、客户市场细分、客
户变动分析、交互和垂直销售分析、新客户模型、客
户接触最优化[4]、广告分析[15]、信用风险得分、客户
生命周期价值模型等[35];(3)客户互动:
关注客户接
触点的交互,即与客户进行沟通所需要的手段(如呼
叫中心、网络、电话、Email等)的集成和自动化处理。
3 CRM中数据挖掘的系统结构
3.1 系统结构
对于数据挖掘(DataMining),一种比较公认的
定义是W.J.Frawley,G.Piatetsky-Shapiro等人提
出的:
数据挖掘就是从大型数据库的数据中提取人
们感兴趣的知识。
这些知识是隐含的、事先未知的
潜在有用信息,提取的知识表示概念(concepts)、规
则(rules)、规律(regularities)、模式(patterns)等形
式。
这种定义把数据挖掘的对象定义为数据库。
而
更广义的说法是:
数据挖掘意味着在一些事实或观
察数据的集合中寻找模式的决策支持过程。
数据挖
掘的对象不仅是数据库,也可以是文件系统,或其他
任何组织在一起的数据集合[25]。
数据挖掘是知识
发现的过程。
数据仓库(DataWarehouse)已经成为现代数据
挖掘的有效平台,并努力实现紧密耦合。
按照“数据
仓库之父”WilliamH.Inmon的描述,数据仓库是一
个面向主题的(subject-oriented)、集成的(integrat-
ed)、时变的(time-variant)、非易失的(nonvolatile)
数据集合,支持管理部门的决策过程[13]。
CRM中的数据挖掘就是利用数据挖掘理论和
技术创建描述和预测客户行为的模型,以实现企业
有效的客户关系管理。
今天的技术可以使挖掘过程
自动化,把数据挖掘与数据仓库紧密集成,并使用可
视化和知识表示技术,向商业用户提供挖掘的知
识[2]。
图2描述了CRM中数据挖掘的系统结构。
·54·中国管理科学 2003年
图2 CRM中数据挖掘系统结构
在系统结构中,底层为数据源,包括联系历史、
交易历史、客户数据库、产品数据库及其他外部数
据,通过ETL工具提取数据形成数据仓库和数据集
市,以形成面向全局的数据视图,从而形成整个系统
的数据基础;在此基础上,通过OLAP和OLAM服
务器支持数据分析处理包括查询/报表、OLAP/EIS
分析和数据挖掘分析;将分析结果用于操作型CRM
和客户互动渠道以实现企业客户关系管理中的商业
智能和决策支持。
3.2 基本过程
在CRM中数据挖掘过程由于看待问题角度不
同有两种描述:
以技术为中心的数据挖掘过程和以
商业为中心的数据挖掘过程。
以技术为中心的观点
认为主要精力应该用于保证数据的处理和运转以及
不断的试验和改进数据挖掘技术上。
而以商业为中
心的观点认为重点是商业问题的定义、投资回服率
和对数据的理解上[2]。
图3和图4分别描述了以技
术为中心的数据挖掘过程和以商业为中心的数据挖
掘过程。
图3 以技术为中心的数据挖掘过程
以技术为中心的数据挖掘过程主要描述从技术
角度进行数据清理、集成、选择、变换等数据处理,使
用智能方法提取数据模式,依据兴趣度度量,识别有
价值模式,最后使用可视化和知识表示技术,向用户
提供挖掘的知识。
以商业为中心的数据挖掘过程主要描述从业务
·55·第1期 张 等:
数据挖掘技术在CRM中的应用
图4 以商业为中心的数据挖掘过程
问题角度进行数据定义和投资回报率(ROI)定义,
在此基础上进行数据挖掘描述/预测模式的应用,并
预测ROI,根据结果选择配置挖掘模式并测试实际
ROI。
4 CRM中数据挖掘的应用研究领域
4.1 CRM中应用的数据挖掘技术
在CRM中数据挖掘技术都有着广泛的应
用[5],主要体现在:
(1)概念/类描述。
概念描述以
简洁汇总的形式描述给定的任务相关数据集,提供
数据价值的一般特性,一般应用于CRM中的描述
式数据挖掘。
概念或类描述由特征比和比较或区分
组成,有两种一般方法:
基于数据立方体OLAP的
方法和面向属性归纳的方法。
(2)关联分析。
关联
分析发现关联规则,广泛用于购物蓝、商务管理和决
策分析,是商业分析中应用最为广泛的一种数据挖
掘方法和模式。
(3)分类和预测分析。
分类和预测
是CRM中数据分析的两种重要形式,可以用于提
取描述重要数据类的模型或预测未来的数据趋势。
主要方法包括:
决策树/判定树、贝叶斯法、BP神经
网络算法、遗传算法、粗糙集、模糊集等。
(4)聚类分
析。
属于无指导学习。
对象根据最大化类内的相似
性、最小化类内的相似性的原则进行聚类或分组。
聚类分析在CRM中有广泛的应用,它可以用作独
立的数据挖掘工具来获得对数据分布的了解,也可
以作为其他数据挖掘算法的预处理步骤。
主要方法
包括:
划分方法、层次方法、基于密度的方法、基于网
格的方法、基于模型的方法等。
(5)孤立点分析。
对
于欺诈探测、定制市场及其它CRM任务是非常有
用的。
基于计算机的孤立点挖掘方法包括统计学方
法、基于距离的方法和基于偏差的方法。
(6)演变分
析。
用于CRM中的趋势分析、相似性搜索、与时间
有关的序列模式挖掘和周期模式挖掘。
(7)复杂类
型的数据挖掘。
是数据挖掘技术的当前一个重要的
研究领域,极大提升了CRM数据分析能力的深度
和广度,主要包括:
多媒体数据挖掘、文本挖掘和
Web挖掘等。
4.2 从客户生命周期角度分析数据挖掘技术的应
用
在对CRM的广泛理解中,最简单的含义就是:
管理所有与客户的交互行为。
在实践中,这需要在
客户关系的各个阶段使用与客户相关的信息来预测
与客户的交互行为。
客户关系的各个阶段定义为客
户生命周期。
客户生命周期包括三个阶段:
获得客
户;提高客户的价值;保持效益客户。
如果将数据挖
掘结合在CRM中或者作为一个独立的应用程序来
实施,数据挖掘可以在每一个阶段都提高企业的收
益[8]。
(1)通过数据挖掘获取新客户:
在CRM中的第
一步是识别潜在客户然后将他们转变成真正的客
户,数据挖掘可以辅助进行客户细分,识别潜在客
户[33]。
(2)提高客户价值:
①数据挖掘支持客户盈利能
力分析,预测客户盈利能力变动以增强客户盈利能
力;②支持客户购买行为模式分析,进行客户细分,
从而提供更具针对性的个性化服务[1];③有效进行
交叉营销,向现有的客户提供新的产品和服务,实现
购买推荐和升级销售[18]。
(3)客户保持:
包括客户忠诚度分析和客户流失
警示分析。
通过数据挖掘,对客户历史交易行为的
分析,警示客户异常行为,并提出相应的对策建议。
4.3 从行业角度分析数据挖掘技术的应用
CRM中数据挖掘应用的深度和广度针对行业
的不同而有所不同,特别是针对与客户交流频繁、客
户支持要求高的行业,如银行、证券、保险、电信、税
务、零售、旅游、航空、医疗保健等。
下面例举零售
业、电信业、金融业CRM中数据挖掘的应用[10]。
(1)零售业CRM中的数据挖掘:
零售业CRM
是数据挖掘的主要应用领域,特别是由于日益增长
的Web或电子商务方式的兴起[9]。
零售数据挖掘
可有助于识别客户购买行为,发现客户购买模式和
趋势,改进服务质量,取得更好的客户保持力和满意
度,提高货品销量比率,设计更好的货品运输与分销
策略,减少商业成本[30]。
例如:
①使用多特征数据
立方体进行销售、客户、产品、时间和地区的多维分
·56·中国管理科学 2003年
摘 要:
客户关系管理(CRM)是数据挖掘技术的重要应用领域,也正是因为具有数据挖掘技术的支持才使CRM具
有越来越广泛的市场价值和研究价值。
本篇论文综述了面向CRM的数据挖掘应用的总体研究情况。
包括面向
CRM数据挖掘的体系结构;从客户生命周期的角度和行业应用角度分析了CRM中数据挖掘的应用状况;最后结
合当前数据挖掘技术的发展指出了CRM中数据挖掘应用的进一步发展趋势以及我国在该领域的研究方向。
关键词:
数据挖掘;客户关系管理(CRM);知识发现;决策支持;电子商务
中图分类号:
TP391 文献标识码:
A
收稿日期:
2002-05-27;修订日期:
2002-12-08
基金项目:
辽宁省自然科学基金资助项目(9910200208)
作者简介:
张吉吉(1973-),女(汉族),辽宁锦州人,东北大学博
士研究生,研究方向:
数据挖掘与CRM.
1 引言
GartnerGroup的一次高级技术调查将数据挖
掘和人工智能列为“未来三到五年内将对工业产生
深远影响的五大关键技术”之首,并且还将并行处理
体系和数据挖掘列为未来五年内投资焦点的十大新
兴技术前两位。
根据Gartner的HPC研究表明,
“随着数据捕获、传输和存储技术的快速发展,用户
将更多地需要采用新技术来挖掘市场价值,采用更
为广阔的并行处理系统来创建新的商业增长点。
”数
据挖掘技术将在未来的数据计算中扮演越来越重要
的角色[7]。
CRM是数据挖掘重要的应用领域,包括客户获
取、客户保持、客户价值提升等客户关系管理的各个
方面。
也正是有了数据挖掘技术的支持,才使CRM
的理念和目标得以实现,满足现代电子商务时代的
需求和挑战[14]。
而CRM是电子商务活动的核心
部分。
对CRM的重视是现代市场营销理念和商业
运作方式转变的结果,并具有广泛的市场价值和研
究价值。
根据2002年4月IDC的最新研究报告,
全球CRM业务2006年将超过450亿美元,年平均
增长率达到18.6%。
与此同时,GartnerGroup也预
测全球CRM业务2006年将达到470亿美元,而
2002年将达到253亿美元[16]。
目前,面向CRM的数据挖掘应用研究是数据
挖掘应用领域研究的一个重要课题。
研究涉及应用
功能、应用方法、算法、模型、数据处理、系统设计和
开发等方面。
本篇论文综述了面向CRM的数据挖掘应用的
总体研究情况。
首先描述了面向CRM数据挖掘的
体系结构;然后从客户生命周期的角度和行业应用
角度分析了CRM中数据挖掘的应用和研究状况;
最后结合当前数据挖掘技术的发展,指出了CRM
中数据挖掘应用的进一步发展趋势以及我国在该领
域的研究方向。
2 CRM体系结构
客户关系管理(CustomerRelationshipManage-
ment,CRM)起源于80年代初提出的接触管理
(ContactManagement),即专门收集整理客户与公
司联系的所有信息。
到90年代初期则演变成为包
括电话服务中心与支援资料分析的客户服务(Cus-
tomerCare)。
经历了近二十年的不断发展,客户关
系管理不断演变发展,逐渐形成了一套管理理论体
系和应用技术体系。
CRM的概念最早由Gartner
Group提出,即认为为企业提供全方位的管理视角,
赋予企业更完善的客户交流能力,最大化客户的收
益率[32]。
CRM是一种以客户为中心的市场营销理念和
策略,它以信息技术为手段,对业务功能进行重新设
计,并对工作流程进行重组。
它集合了现代信息技
术包括:
Internet和电子商务、多媒体技术、数据仓
②使用多维分析和关联分析进行促销活动的有
效性分析;③序列模式挖掘可用于客户忠诚分析;④
利用关联分析挖掘关联信息进行购买推荐和商品参
照[20]。
(2)电信业CRM中的数据挖掘:
电信业已经迅
速地从单纯的提供市话服务演变为提供综合电信服
务。
电信网、因特网和各种其他方式的通信和计算
的融合是目前的大势所趋。
利用数据挖掘技术可帮
助理解商业行为、确定电信模式、捕捉盗用行为、更
好的利用资源和提高服务质量。
例如:
①电信数据
的多维分析有助于识别和比较数据通信情况、系统
负载、资源使用、用户组行为、利润等;②通过多维分
析、聚类分析和孤立点分析进行盗用模式分析和异
常模式识别;③通过多维关联和序列模式分析进行
电信服务组合和个性化服务;④电信数据分析中可
视化工具的使用。
(3)金融业CRM中的数据挖掘:
大部分银行和
金融机构都提供丰富多样的储蓄服务、信用服务、投
资服务。
还提供保险服务和股票投资服务。
在银行
和金融机构中产生的金融数据通常相对比较完整、
可靠,这大大方便了系统化的数据分析和数据挖掘。
以下给出几种典型的应用情况:
①为多维数据分析
和数据挖掘设计和构造数据仓库;②特征选择和属
性相关性计算有助于贷款偿还预测和客户信用政策
分析;③分类和聚类的方法可用于客户群体的识别
和目标市场的分析[6];④通过数据可视化、链接分
析、分类、聚类分析、孤立点分析、序列分析等分析工
具帮助进行洗黑钱和其他金融犯罪的侦破。
5 CRM中数据挖掘应用研究的发展方向
数据挖掘技术在CRM中的应用研究是当前的
研究热点。
目前CRM中进行有效的数据挖掘面临
的主要技术问题包括:
(1)挖掘方法和用户交互问
题:
①挖掘的知识类型[21];②多个抽象层的交互知
识挖掘[27];③领域知识的使用[23];④数据挖掘查询
语言[12];⑤数据挖掘结果的表示和可视化[19];⑥处
理噪声和不完全数据;⑦模式评估-兴趣度问题。
(2)性能问题:
①数据挖掘算法的有效性和可伸缩
性;②并行[31]、分布式[28]和增量[24]挖掘算法。
(3)
关于数据库类型的多样性问题:
①关系的和复杂的
数据类型的处理[9];②由异种数据库[29]和全球信息
系统挖掘信息如Web挖掘[3]。
其他问题包括数据
挖掘的应用开发和它们的社会影响。
这些问题是数
据挖掘技术未来发展的主要需求,同时给数据挖掘
也提出了许多挑战性的课题。
目前面对我国企业发展的特殊轨迹,国内在该
领域的研究和应用明显落后于国外。
面对我国的
CRM的认知程度和应用层次以及国情的需要,数据
挖掘技术在CRM中的应用研究方向建议应主要面
向如下方面:
(1)应用的探索:
电子商务已经成为现代商务的
主流因素,同时ASP(应用服务提供商)是现代信息
服务的重要方式,因此基于电子商务环境下和ASP
模式下CRM数据挖掘的特定应用具有重要的研究
价值[2];
(2)应用目标的转变:
随着企业的战略目标的转
变,CRM中的数据挖掘的应用目标重点应从增加企
业收入转移到节约企业成本[16];
(3)应用的对象:
从企业规模来看,中小型企业
是企业类型中的主体,针对中小型企业的CRM应
用相应的数据挖掘技术提升决策支持的智能化水平
对中国企业具有特别的意义;
(4)数据挖掘与数据库系统、数据仓库系统和
Web数据库系统集成:
这将保证数据挖掘的高质
量,提高数据挖掘的性能和效率,从而改善CRM决
策支持的有效性[34];
(5)CRM中复杂数据类型挖掘:
由于CRM应
用深度和广度的有力延伸,针对复杂数据类型的现
存数据分析技术与数据挖掘方法的集成研究变得越
来越重要[26];
(6)Web挖掘:
Web是当前CRM的主要应用平
台,包括Web内容挖掘、Web日志挖掘和Internet
上的数据挖掘服务等内容是重要的研究领域[17];
(7)CRM中的隐私保护与信息安全:
这是数据
挖掘技术要面对的一个重要问题,需要进一步开发
有关方法以确保客户的隐私权和信息安全[7]。
6 结束语
数据挖掘技术在电子商务时代CRM中有着广
泛而深入的应用,这一研究领域体现着越来越大的
研究价值。
随着数据挖掘技术的进一步发展和深
化,必然会带给CRM更为广泛的应用前景和市场
价值。
这种价值对增强我国企业的核心竞争力将会
发挥越来越大的作用。
参考文献:
[1]Adomavicius,G.,A.Tuzhilin.Expert-drivenvalidationof
rule-basedusermodelsinpersonalizationapplications[J].
·57·第1期 张 等:
数据挖掘技术在CRM中的应用
ataMiningandKnowledgeDiscovery,2001,5(1-2):
33
-58.
[2]Berson,A.,S.Smith,K.Thearling.Buildingdatamining
applicationsforCRM[M].NewYork:
McGraw-Hill,
1999,125-175.
[3]Bapna,R.,P.Goes,A.Gupta.Comparativeanalysisofmulti
-itemonlineauctions:
evidencefromthelaboratory[J].
DecisionSupportSystems,2001,32
(2):
135-153.
[4]Bhattacherjee,A.Anempiricalanalysisoftheantecedents
ofelectroniccommerceservicecontinuance[J].Decision
SupportSystems,2001,32
(2):
201-214.
[5]Bose,I.,R.K.Mahapatra.Businessdatamining-ama-
chinelearningperspective[J].Information&Manage-
ment,2001,39(3):
211-225.
[6]Dhar,V.,D.Chou,F.Provost.Discoveringinterestingpat-
ternsforinvestmentdecisionmakingwithGLOWER
[xcirc]-ageneticlearneroverlaidwithentropyreduction
[J].DataMiningandKnowledgeDiscovery,2000,4(4):
251-280.
[7]DMReview.DataMiningLeadTechnologiesTowardU-
biquitousComputingandPrivacyLoss[Z].http:
//www.
2002,5.
[8]Edelstein,H.Buildingprofitablecustomerrelationshipwith
datamining[R].TwoCrowsCorporation,2001,10:
1-
12.
[9]Gangopadhyay,A.Animage-basedsystemforelectronic
retailing[J].DecisionSupportSystems,2001,32
(2):
107-
116.
[10]Han,J.W.,M.Kamber.Datamining:
conceptsandtech-
niques[M].SanFrancisco:
MorganKaufmann,2000.451-
481.
[11]Hui,S.C.,G.Jha.Dataminingforcustomerservicesup-
port[J].Information&Management,2000,38
(1):
1-13.
[12]Imielinski,T.,A.Virmani.MSQL:
aquerylanguagefor
databasemining[J].DataMiningandKnowledgeDiscov-
ery,1999,3(4):
373-408.
[13]Inmon,W.H.Buildingthedatawarehouse(2nd)[M].
NewYork:
Johnwiley&Sons,1996.20-114.
[14]Kannan,P.K.,H.R.Rao.Introductiontothespecialis-
sue:
decisionsupportissuesincustomerrelationshipman-
agementandinteractivemarketingfore-commerce[J].
DecisionSupportSystems,2001,32
(2):
83-84.
[15]Karuga,G.G.,A.M.Khraban,K.S.Nair,D.O.Rice.Ad-
Palette:
analgorithmforcustomizingonlineadvertisements
onthefly[J].DecisionSupportSystems,2001,32
(2):
85-
106.
[16]K.D.Nuggets.IDCprojectsgrowthinCRMServices
Market;Datamonitorfinds44%CRMfailurerate[Z].
2002,4.
[17]Kosala,R.,H.Blockeel.Webminingresearch:
asurvey
[J].SIGKDDExplorations.2000,2
(1):
1-15.
[18]Lawrence,R.D.,S.G.Almasi,V.Kotlyar,S.M.Viveros,
S.S.Duri.Personalizationofsupermarketproductrecom-
mendations[J].DataMiningandKnowledgeDiscovery,
2001,5(1-2):
11-32.
[19]Lee,J.Y.,M.Podlaseck,E.Schonberg,R.Hoch.Visual-
izationandanalysisofclickstreamdataofonlinestoresfor
understandingWebmerchandising[J].DataMi