基于评论大数据的手机产品改进Word下载.docx

资源描述

基于评论大数据的手机产品改进Word下载.docx

《基于评论大数据的手机产品改进Word下载.docx》由会员分享，可在线阅读，更多相关《基于评论大数据的手机产品改进Word下载.docx（17页珍藏版）》请在冰点文库上搜索。

基于评论大数据的手机产品改进Word下载.docx

通过计算发现，当K=18时，各产品属性间的相似度最低，由此获得了18个属性词集合。

在初步获得的分类结果中，有多个属性词集合主要包括形容词、副词和动词等，它们不能代表产品属性，需要去除，最终得到15个属性词集合。

通过咨询专业手机设计人员的意见，并结合华为与苹果等知名企业官网对手机属性的分类标准，确定了15个属性词集合所代表的产品属性。

各个产品属性对应的属性词数量如表1所示。

表1各产品属性中的属性词个数

本文的评论有用性分析主要关注产品的描述，即描述产品的属性词和代表用户情感的情感词。

如果一条评论为有用评论，则其必定包含用户关注的产品属性（以属性词表现）和用户对该产品属性表现情况的情感倾向（以情感词表现），属性词已由前文产品属性获取的步骤中获得。

知网（HowNet）是著名机器翻译专家董振东先生花费数十年时间建立的一个以汉语和英语词语所代表的概念为描述对象，以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库，其从建立到现在已被很多学者用于中文文本研究，知网（HowNet）中的情感词词库（下载地址：

http:

//www.keenage.com/download/sentiment.rar）也是目前最知名的中文情感词词库之一，本文将前文得到的属性词和知网（HowNet）情感词词库中的情感词作为评判评论有用性的依据。

如果一个评论同时具有属性词和情感词，则认为该评论为有用评论，判断规则为

（1）

式中：

pi为第i个评论是否为有效评论的判断值，取值为0和1，pi=1则第i个评论为有用评论，pi=0则第i个评论为无用评论；

为第i个评论是否具有产品属性词的判断值，取值为0和1，第i个评论具有产品属性词则

否则

为第i个评论是否具有情感词的判断值，取值为0和1，第i个评论具有情感词则

基于式

（1），对所有评论进行评论有用性分析，最终获得808426条有用评论。

3手机评价指标体系的建立与指标分析

3.1手机评价指标体系的建立

每个有效评论中都包含属性词，根据属性词所在的产品属性将评论分为15类。

借助文本情感分析工具AipNlp计算单个评论表达正面情感的概率q，第N个产品属性中第i个评论的正面情感概率记为qNi，qNi∈[0,1]。

为了更清晰地表达用户的情感倾向，通过式

（2）将评论的正面情感概率qNi转换为用户情感值QNi，QNi∈[-1,1]，其数值越大，情感越积极，用户的满意度越高。

QNi=（qNi-0.5）×

2。

（2）

为了了解用户对第N个产品属性的满意度，计算描述第N个产品属性所有评论的情感值均值，记为PN，

（3）

QNi为第N个产品属性中第i个评论的情感值；

tN为描述第N个产品属性的评论的个数。

VN为QNi的方差，

（4）

其值越大说明用户群体对该产品属性满意度的差异越大。

评论中出现了对产品属性的评价，即用户对该产品属性的关注。

记用户对第N个产品属性的关注程度为TN，

（5）

tN为第N个产品属性的评论个数；

n为总的有用评论数。

TN值越大用户的关注度越高。

用户对产品总的评价度

为了使H最大，单个产品属性的评价度PN×

TN需要达到最大值1×

TN（PN的最大值为1），因此单个产品属性评价度的可提升空间为（1-PN）×

TN。

因为企业资源有限，能让企业利益最大化的决策才是最优决策，所以优先选择评价度可提升空间高的几个产品属性进行改进。

将产品属性评价度的可提升空间作为产品属性亟需改进的程度SN，

SN=（1-PN）×

（6）

由此建立15（15个产品属性）×

4（4个产品属性评价指标）的手机评价指标体系。

3.2总体手机评价指标得分分析

为了解市场上手机产品的总体情况，通过式（3）～式（6）分析总体手机的评论数据，计算各个产品属性的满意度PN、用户关注度TN、情感值方差VN和每个产品属性亟需改进的程度SN，得到总体手机评价指标得分，如表2所示。

表2总体手机评价指标得分结果

在得到总体手机评价指标得分后，通过分析手机各个属性的满意度PN和用户关注度TN，发现用户对外观、价格和处理器的满意度最高，对数据连接、包装清单和音频视频的满意度最低；

对系统和外观的关注度最高，对包装清单、尺寸重量和数据连接的关注度最低。

原因可能是外观和系统是用户每天接触最多的两个产品属性，其对用户的使用体验影响最大。

分析还发现，用户的满意度越低，情感值的方差VN越大，这表明用户的满意度越低，对该产品属性的情感分歧越大。

由此分析，并不是所有现有手机产品在满意度低的产品属性上都做得不好。

分析各产品属性的亟需改进程度SN，发现总体手机亟需改进的属性为系统，其次是外观和服务。

3.3高端、中端和低端手机评价指标得分分析

将手机按价格分为高端、中端和低端3种类型，价格在2500元以上的手机为高端手机，价格在1500元～2500元的手机为中端手机，价格在1500元以下的手机为低端手机[22]。

将评论数据按照高、中、低手机类别进行划分，得到高端手机评论294472条，中端手机评论261153条，低端手机评论252801条。

为了解市场上高端、中端和低端3种手机的具体情况，通过式（3）～式（6）计算各类手机的评价指标得分，结果如表3～表5所示。

通过指标得分分析发现，高端手机用户对外观、存储和处理器的满意程度最高，对数据连接、包装清单和音频视频的满意度最低；

对系统和外观的关注度最高，对包装清单、尺寸重量和存储的关注度最低。

在系统、服务和外观方面，SN值较大，表明系统、服务和外观需要改进的迫切程度较高。

表3高端手机评价指标得分结果

续表3

表4中端手机评价指标得分结果

表5低端手机评价指标得分结果

中端手机用户对外观、价格和处理器的满意程度最高，对数据连接、包装清单和音频视频的满意度最低；

对系统和外观的关注度最高，对存储、感应器和数据连接的关注度最低。

在系统、外观和服务方面，SN值较大，可知中端手机急需改进的产品属性为系统、外观和服务。

低端手机用户对外观、价格和感应器的满意程度最高，对包装清单、数据连接和音频视频的满意度最低；

对系统、外观和价格的关注度最高，对感应器、包装清单和尺寸重量的关注度最低。

在系统、价格和外观方面，SN值较大，表明系统、价格和外观急需改进。

另外，对比3类手机用户对各个手机产品属性的满意度，发现在大部分产品属性上，高中端手机用户的满意度较低，低端手机用户的满意度较高，这可能与不同消费水平用户的心理预期有关。

对比3类手机用户对各个手机产品属性的关注度，发现不同购买力的用户对大部分产品属性的关注度基本一致，但低端用户更关注手机的价格，高端用户更关注手机的系统，产生这种现象可能由手机对于不同消费群体存在意义的不同造成。

对比3类手机各产品属性的亟需改进程度发现，大多数高端和中端手机产品属性的亟需改进程度明显高于低端手机，尤其在系统和服务方面，说明低端手机相比较高端和中端手机更符合消费者预期，高端和中端手机各属性改进的迫切程度更大，尤其在系统和服务方面。

3.4单款手机评价指标得分分析

为研究具体型号的手机，对前文销售排名前60的手机一一进行分析。

限于篇幅，在此以苹果公司iPhoneX型号的手机作为分析案例。

iPhoneX作为苹果公司iPhone十周年纪念产品，其全面屏设计、创新的交互方式、独有的面部解锁等特性为手机发展指引了一个方向。

计算用户对iPhoneX各产品属性的满意度PN、用户关注度TN、情感值方差VN和每个产品属性亟需改进程度SN，得到iPhoneX评价指标得分结果，如表6所示。

由表可见，iPhoneX用户对尺寸重量、价格和外观的满意度最高，对音频视频和包装清单的满意度最低；

对系统和服务的关注度最高，对存储和包装清单的关注度最低。

分析各产品属性的亟需改进程度SN可知，现阶段iPhoneX亟需改进的属性为系统，其次为服务和外观。

表6iPhoneX评价指标得分结果

4产品改进策略分析

在确定手机改进方向后，为了解具体的产品属性改进细节，采用AipNlp模块中的文本观点抽取模块对手机相关属性的负向在线评论进行观点抽取，分析得出用户不满意的点。

负向评论观点抽取的具体分析步骤如下：

（1）提取待改进产品属性的相关评论在获得手机亟需改进的产品属性后，按照亟需改进的产品属性中的属性词筛选出描述这些产品属性的在线评论。

（2）负向评论筛选为减少干扰，准确分析用户不满意的点，筛选出情感值QNi<

0的负向情感评论。

（3）负向评论观点挖掘借助AipNlp模块中的评论观点抽取模块对这些在线评论进行观点抽取，并对抽取后的观点进行删选处理。

以iPhoneX手机为例，通过评论情感分析可知其需改进的产品属性为系统、服务和外观，利用AipNlp中的观点分析模块对iPhoneX手机的系统、服务和外观的负向评论进行观点抽取，数据处理结果如表7所示。

表7负向评论观点挖掘结果

结合观点挖掘结果及相应的评论发现，iPhoneX用户对系统不满意的点主要为系统易崩溃、不稳定、出bug、开机慢和易死机，发热严重，反应慢、不灵敏、运行游戏时卡顿、发热严重、功能少、App下载速度慢、软件兼容性差等。

对服务不满意的点主要为客服服务态度差、不专业和用户事件处理速度慢，物流发货速度慢、运输速度慢和快递员服务态度差，售后的服务差、处理速度慢和步骤繁琐等问题上，特别是客服方面的问题占据了用户负向观点的大半。

对外观不满意的点主要为“刘海”造型不舒服，外形丑、不好看，机身尺寸小，机身配色单一、无个性，可供选择的颜色少，做工一般、有瑕疵等。

在找到iPhoneX手机各个亟需改进属性的用户不满意的点后，基于专家意见提出具体的改进策略。

iPhoneX手机的具体改进策略如下：

（1）增强系统的良好体验提高系统的稳定性、流畅度和对各个App版本的兼容性，优化系统的运行速度和反应速度，加快手机的开机速度，增加系统中人性化的功能，优化温控系统以控制机身温度；

强化系统在游戏环境下的体验，有针对地优化手机游戏的性能，优化大众游戏的运行效率，提高游戏的流畅性；

增加AppStore国内服务器的建设，加快App的更新下载速度。

（2）增强客服服务的专业性改善客服的服务态度，加快用户事件处理速度，简化客服服务的流程，增加客服的人员数量；

提高物流配送服务的水平，加快产品的发货速度和运输速度，改善快递员配送时的服务态度；

提升售后服务的专业性，改善售后服务人员的服务态度，加快售后问题的处理速度，简化售后问题处理流程的步骤。

（3）增强手机产品的个性丰富产品的颜色，为追求个性的用户提供丰富的选择；

提高手机造型设计的水准，设计出符合当下消费者审美的手机外观，减小或消除“刘海”屏等；

增加手机尺寸型号，给消费者多种选择；

提升产品的做工，提高代工厂的生产质量，减少手机瑕疵。

其他具体型号手机均可以该方法快速找到用户不满意的点，并据此做出相应的改进策略。

5验证实验

本文提出的产品设计改进研究方法，主要通过建立评价指标体系对产品各个属性进行逐一评价来找到亟需改进的方向，因此该方法的有效性主要与评价指标体系的准确性和评论数据的真实性相关。

在线评论的差评率是用户评价产品优劣的重要指标，其为产品差评占总体评论的比例。

验证实验通过爬虫程序爬取手机产品在线评论的差评率，基于主成分分析（PrincipalComponentAnalysis，PCA）和多元线性回归分析方法，搭建本文手机评价指标与手机在线评论差评率之间的多元线性回归模型。

如果该多元线性回归模型能够通过手机评价指标准确预测产品在线评论的差评率，则能从侧面证明手机评价指标体系的准确性，进而验证本文方法的有效性。

5.1主成分分析

PCA是一种通过分析相关系数矩阵各变量间的关系，将相近的变量汇总，将原先繁杂的变量转化为为数不多的综合指标的降维分析方法[23]。

根据60种手机各产品属性的亟需改进程度S建立相关系数矩阵G，然后通过爬虫程序获取60种手机的在线评论差评率，据此建立系数矩阵W：

（7）

（8）

SMN为销量排名第M个手机第N个产品属性的亟需改进程度，M=1，2，…，60，N=1，2，…，15；

CM为销量排名第M个手机的在线评论差评率。

记各手机第N个产品属性的亟需改进程度形成的矩阵为BN，

（9）

采用皮尔逊积矩相关系数测量手机各产品属性的亟需改进程度BN与各手机在线评论差评率W的相关性，然后通过显著性检验验证两组数据具有相关性事件的合理性。

若皮尔逊积矩相关系数值大于0.3，则认为两组数据间具有明显相关性[24]。

借助社会科学统计软件包（StatisticalPackagefortheSocialSciences,SPSS）分析各系数间的皮尔逊积矩相关系数和显著性概率值P，结果如表8所示。

由表可见，亟需改进程度与评论差评率明显相关的有电池、服务、价格、耐用性、屏幕、数据连接和系统7个产品属性。

表8各产品属性的亟需改进程度与评论差评率的皮尔逊积矩相关系数及显著性概率值

为研究7个产品属性亟需改进程度间的相关性，减少线性回归分析的复杂性，利用SPSS对剩余7个产品属性的亟需改进程度进行主成分分析。

通过巴特利特检验和KMO（Kaiser-Meyer-Olkin）检验验证PCA。

巴特利特检验的显著性P=0.000，小于0.001，证明数据可以进行主成分分析。

KMO取样适切性量数为0.827，大于0.8，证明此次主成分分析具有较好的实用性。

PCA结果如表9所示。

表9各成分的特征值和方差贡献率及累积方差贡献率

第一和第二主成分的特征值均大于1，方差贡献率大，其累积方差贡献达到76.889%。

分析两个主成分的因子载荷矩阵（如表10）发现，第一主成分主要代表系统、数据连接、服务、电池、屏幕、耐用性，第二主成分主要代表价格，符合现目前消费者追求的性价比中的性能和价格，因此选用前两个主成分代表7个产品属性亟需改进程度的分布情况。

根据因子载荷系数a与各主成分的特征值λ间的关系

为各主成分的特征向量）计算两个主成分特征向量u1和u2，如表11所示。

主成分的求解公式为：

表11主成分特征向量

表10因子载荷矩阵

（10）

（11）

KM1，KM2为销量排名第M个手机的第一主成分值和第二主成分值；

为销量排名第M个手机第N′个产品属性的亟需改进程度，M=1，2，…，60，N′=1，2，…，7。

续表10

5.2多元线性回归分析

使用多元线性回归分析方法，研究第一主成分值和第二主成分值与手机评论差评率的关系。

计算第一主成分值和第二主成分值，结果如表12所示。

表12主成分值和评论差评率

随机抽取表12中2/3的数据作为训练集数据，其余1/3的数据作为验证集数据。

将评论差评率作为因变量，主成分值作为自变量，利用SPSS对训练数据进行多元线性回归分析，得到手机产品差评率多元线性回归方程

（12）

为销量排名第M个手机的在线评论差评率的预测值；

KM1，KM2为销量排名第M个手机的第一主成分值和第二主成分值。

对多元线性回归方程进行拟合优度检验，回归方程与训练集数据的拟合优度R2=0.537，说明所得多元线性回归方程与训练集数据的吻合度较好，证明该模型有较好的数据拟合作用。

对多元线性回归方程进行整体回归效应显著性检验，P=0.017，小于0.05，证明该多元线性回归方程具有较好的统计学意义。

5.3多元线性回归模型验证

通过式（12）计算验证集中20款手机的差评率预测值，差评率的预测值和实际值及两者的误差比例如表13所示。

表13差评率的预测值和实际值及两者的误差比例

可以看出，手机在线评论差评率的预测值和实际值差别较小，平均误差为9.9%，说明基于手机评价指标建立的多元线性回归方程哪个较好地预测手机用户在线评论的差评率，从而证明手机评价指标体系的准确性，进而验证了本文方法的有效性。

6结束语

日益激烈的市场竞争环境和不断变化的用户需求使得产品设计更新速度加快、周期缩短，如何快速找到产品改进策略是目前产品设计更新的重点。

本文基于手机评论大数据，结合文本挖掘和情感分析，建立手机评价指标体系来快速获得用户反馈。

通过分析总体手机和各类手机评论数据，了解市场上手机的具体情况；

通过分析具体型号的手机评论数据（本文以iPhoneX为例），根据手机评价指标得分找到手机的具体改进方向，并结合观点挖掘到用户不满意的点，进而确定对应的改进策略。

由于京东的在线评论反扒机制限制了用户在线评论的爬取数量，导致评论数据仍不够大。

下一步工作将在扩大评论数据的基础上，研究产品属性指标与产品销量排名等的关系模型，从而预测销售数据。

展开阅读全文