中国电影产业票房影响因素探究.docx

上传人:b****2 文档编号:482533 上传时间:2023-04-29 格式:DOCX 页数:13 大小:30.63KB
下载 相关 举报
中国电影产业票房影响因素探究.docx_第1页
第1页 / 共13页
中国电影产业票房影响因素探究.docx_第2页
第2页 / 共13页
中国电影产业票房影响因素探究.docx_第3页
第3页 / 共13页
中国电影产业票房影响因素探究.docx_第4页
第4页 / 共13页
中国电影产业票房影响因素探究.docx_第5页
第5页 / 共13页
中国电影产业票房影响因素探究.docx_第6页
第6页 / 共13页
中国电影产业票房影响因素探究.docx_第7页
第7页 / 共13页
中国电影产业票房影响因素探究.docx_第8页
第8页 / 共13页
中国电影产业票房影响因素探究.docx_第9页
第9页 / 共13页
中国电影产业票房影响因素探究.docx_第10页
第10页 / 共13页
中国电影产业票房影响因素探究.docx_第11页
第11页 / 共13页
中国电影产业票房影响因素探究.docx_第12页
第12页 / 共13页
中国电影产业票房影响因素探究.docx_第13页
第13页 / 共13页
亲,该文档总共13页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

中国电影产业票房影响因素探究.docx

《中国电影产业票房影响因素探究.docx》由会员分享,可在线阅读,更多相关《中国电影产业票房影响因素探究.docx(13页珍藏版)》请在冰点文库上搜索。

中国电影产业票房影响因素探究.docx

中国电影产业票房影响因素探究

中国电影产业票房影响因素探究!

 

 

————————————————————————————————作者:

————————————————————————————————日期:

 

一、引言

自2002年国家把发展文化产业作为一项国策以来,中国文化产业的快速成长在拉动国民经济发展、促进文化繁荣、带动社会进步和应对国际竞争等方面发挥着越来越重要的作用,对于全球化文化背景下维护国家文化安全和应对国际文化市场挑战具有关键性的作用。

在中国的文化产业结构中,影视产业一直是中坚力量,占据着近半壁江山。

回顾近几年我国电影产业发展历程,可发现国产电影一直在保持着螺旋式上升的趋势。

我国电影产业已经连续十几年保持增长态势,并且在2009年实现华丽蜕变,成为在金融危机中逆势上扬的典型代表,全年共有11部电影票房过亿。

然而在2010年国产电影不敌国外大片,上映比例走到低谷。

到了2012年,国产电影发展迎来转折点,并以此为分界,国产片产出量从稳步增长变为减量减速,从数量竞争正式开始进入票房竞争阶段。

到了2015年,在消费的带动下,中国电影产业规模达到了1000亿元,全年上映电影449部,票房达到438.74亿元,其中国产电影的票房占到总额的62%,平均每部国产片的票房达到8138.6万元。

中国逐渐由电影大国向电影强国转变。

作为电影产业链的最后一环,院线上映是衡量影片投资与回报的基本因素电影。

由于其较大的商业性质,票房总收入是衡量一部电影是否成功最直观的度量标准。

虽然在好莱坞等电影产业发达地区,票房收入只占电影总体收入一部分,银幕上的突出成绩并一定代表电影自身的成功[],但对于中国这一还在发展中的电影产业而言,影片的票房成绩仍然是最重要的因素。

二、文献综述

关于电影票房的研究方面,国内外可以分为三类,第一类是基于西方传媒经济学理论对电影产业和票房之间关系的探讨,第二类对电影票房的预测,第三类则是影响因素的分析。

西方相比较我国电影产业发展较早,因此对票房研究也相对更加成熟以及具有前瞻性,其中影响因素方面大量运用了实证模型进行分析。

具体来看,主要有以下一些成果。

BarryLitman(1989)开启了西方电影票房研究的先河,最先建立电影票房影响因素的研究模型,由于当时票房数据较难获得,因此在其模型中,以1981-1986年电影租金收入作为因变量,将具体影响因素分为创意、发行/上映以及电影营销三大方面,通过层次回归分析得到导演以、明星以及续集有着显著的正向影响,科幻片能正面影响而剧情片则产生负向影响[]。

在这之后,部分西方学者继续按照Litman的研究模型进行相应改进延续其的研究思路,还有一部分学者则开始对电影票房具体影响因素进行分类研究。

主要集中在明星影响力以及口碑等方面,研究结论也有着一定分歧,其中Ravid(1999)发现明星影响力对票房并没有显著作用[],而Levin和Heath(1999)通过对测试者发现观众对知名演员出演的电影有着很强的好感,电影评论家也会因此减轻对其批评[]。

Elberse(2007)则用超过1200组明星阵容在好莱坞股票交易市场模拟与票房的关系发现能够显著增加票房收入[]。

06年之后随着Twitter等社交网络的崛起,对于网络口碑的研究开始增多,McKenzie(2009)发现口碑的效价会显著影响数量并进一步对票房产生显著作用。

Henning(2014)等人进行了Twitter效应的测试,得到用户的口碑评价会对其他潜在观众的接受度产生负面偏向。

我国学者方面,对电影票房的研究起步较晚,前些阶段主要是从艺术理论角度对单独某部电影的定性案例分析上面。

直到2009年我国逐渐开始进行定量实证研究,其中比较具有代表性的有汪旭辉和王军(2015)通过分析网络口碑对票房内在机制,结果表明网络口碑数量显著正向影响首周票房,效价存在显著负向影响。

侯勇和王铁男(2014)则发现前作电影票房和口碑都可以产生品牌溢出效应影响续作。

王铮(2013)通过设立不同临界值进行logistic回归表明票价、续集、明星和导演有着显著影响,并且发现明星和导演影响力存在着“挤出效应”[]。

聂鸿迪(2015)则通过OLS回归分析得出盗版和剧情类电影有负面影响,并通过神经网络进行预测发现误差相比多元回归较小。

综合来看,目前国内的研究较多还是停留在定性分析以及对某一单方面因素的分析,而多方面的影响因素探讨的文献数量较少,并且大多为基于传统Litman模型进行影响因素的选择,并未结合中国特有市场环境进行考虑。

另一方面,较多仍然采用普通OLS回归分析法,但正如王铮(2013)所述,可能会存在偏态性会使得结果不稳健,然而logit模型虽然消除了极值偏态影响,但是容易使得信息利用量减少。

三、研究设计

(一)研究变量选取

本文中我们随机选取2015-2016年共90部国产电影,将票房数据作为被解释变量,单位为万元,票房数据通过艺恩网查询得到。

解释变量具体可分为如下几类:

1.主创阵容(Director、Actor)

主创阵容具体可分为编剧、制片人、导演以及演员,由于我国较西方制度间的差异,创作中心基本以导演为主,而编剧制片人等身居幕后往往不为人所熟知。

因此本文重点选取导演作为创作阵容中的研究变量。

国内外关于导演影响力度量方式不尽相同,如Litman和Kohl(1989)将导演四年间的执导影片是否获得奥斯卡奖或提名作为虚拟变量衡量,Hennig-Thruau等(2006)以执导的最近三部影片的平均票房度量[],还有的直接使用《好莱坞报道》中的导演指数。

本文在参考前些基础之上,根据导演所获五大华语奖项及提名数量并结合时光网上导演受欢迎度评分,从低到高划分1-5五个等级,并且考虑到目前一小部分的新锐跨界导演原有的粉丝基础进行相应调整。

主演的明星方面,国外学者通常使用《综艺》以及《好莱坞报道》中的数据,我国学者中在研究中由于没有这方面权威性排名,故与导演影响力衡量方法相类似[]。

笔者认为,随着网媒、电视综艺等快速崛起,跨界现象愈发明显,获取明星效应的渠道逐渐扩大,继续以过往例如奖项数量等方法难免有失偏颇,所以本文根据奖项、提名数量并结合2015年明星微博粉丝数排名综合衡量,同样划分为1-5五个等级。

2.票价(Price)

2012年广电总局发布的电影票“限折令”不得低于电影院挂牌价的70%曾一石激起千层浪引发不小的争论,同样,一些例如冯小刚的知名导演也曾在两会上联提案实施“最高限价”。

电影院在票价制定方面往往采用针对不同客户需求及影片属性的弹性定价策略,经济学中一般称之为“价格歧视”。

为了探究票价对票房具体影响程度,本文选取猫眼儿网的每部电影全国平均票价信息作为变量。

3.网络口碑(WOM)

传统口碑在研究领域的重要性通过前文的文献综述中已经提到,如今随着互联网的普及,一些专业的电影口碑评分已经较为成熟化,其给予了观看过电影的关注一个交流、抒发自己观影感受的平台。

主要通过三个度量指标:

数量、效价以及离散程度。

其中效价即对电影的评价,Liu(2006)认为其可以影响公众的感知并进一步对公众的观影决策行为产生作用,有着重要的地位[]。

因此,本文通过对每一部电影时光网及豆瓣网基于满分为10分的口碑评价得分取其平均值作为研究变量。

4.技术效果(Tech)

过往的研究中学者普遍较少考虑到电影的技术效果这一影响因素。

当今,随着技术水平及观众观影体验需求的提高,电影的播放制式也有着很大的改变,具体可分为普通的2D(35mm胶片变形银幕)、IMAX(巨形超大银幕)、3D(立体)及三者两两结合的类型。

本文将技术水平从低到高排序,将普通2D设为1,含有IMAX的非3D电影设为2,含有3D技术的设定为数值3。

5.IP(知识产权)(Sequel)

近年来,IP可以说是影视圈内较火爆的名词,一个运营十分成功的IP可以从一种媒介转化到另一种媒介而产生一种极大的关注度,是一种宝贵的无形资产。

在电影领域中IP主要可以分为畅销小说改编电影例如《盗墓笔记》、系列电影的续集如近期的《大话西游3》、对过去经典电影的翻拍如由杨幂和鹿晗主演的《我是证人》,就是对韩国经典电影《盲证》的翻拍。

本文定义其为虚拟变量,当电影为IP电影时用1表示,反之为0,是否是翻拍改编等信息通过XX百科查询所得。

6.档期(Schedule)

档期是一部电影从上映到最后下映的时间间隔,过往研究表明档期作为一种时间纵向市场也往往会对票房产生影响。

目前而言,档期与节假日有着比较大的关联,观影活动会比其他时间集中。

我国电影最热门的档期可以划分为暑期档、国庆档、五一以及贺岁档,为此,我们选取与电影从上映到下映平均一个月时间与上述档期重合天数作为档期的研究变量。

7.营销热度(Want)

电影在上映前的营销手段也是十分重要的一环,具体可包括出品方的宣传以及基于其所引发的话题规模效应引起公众对电影的兴趣。

过往研究中,较多使用消费者的搜索量作为研究,如Hand和Judge(2012)利用公众对电影的谷歌趋势的搜索数据作为度量[],王炼(2014)等通过利用数据抓取软件对电影上映前后XX搜索引擎数据构建搜索指标[]。

由于对搜索引擎过去一段时间搜索量实现起来较为困难,本文则出于数据以获取角度考虑选取猫眼电影网中每部电影的“想看指数”,其数值为每部电影从宣布档期到上映前一天时间段公众想看意愿的具体人次。

8.电影题材

每个人会对电影不同类型产生不同的偏好,进而影响制片方在制作前对电影题材的考虑。

由于我国电影发展还不是十分成熟,相比较西方好莱坞类似于互联网电影资料库(IMDB)十多种明确的分类方式,我国国产电影则较为集中。

本文根据所选取的样本,按照其最主要的题材类型总共分为喜剧片(Comedy)、爱情片(Romance)、动作片(Action)、惊悚片(Horror)以及魔幻片(Magic),分别设定为虚拟变量,是赋值1,否则赋值为0,有关电影类型均通过时光网、豆瓣网以及猫眼网等查询所得。

(二)计量模型

基于回归的最小二乘法分析是目前学术界使用最多的方法,如前文中所述的Litman(1998)、Sochay(1994)等均以票房作为连续变量进行OLS影响因素研究。

所以参考其首先建立多元线性回归模型进行OLS估计,模型如下:

(1)

其中,对票房总收入以及想看指数均作了自然对数处理以控制可能的异方差问题。

传统的线性回归一般都采用上述OLS来估计参数,其刻画的是因变量的条件均值的边际效益或者弹性大小。

另外其要求变量同时满足随机性、独立性等一系列严格规定,如果数据出现扰动项非正态分布以及异方差等情况,结果可能表现出不稳健性。

而由Koenker和Bassett(1978)所提出的分位数回归(QuantileRegression)则能够全方面描述因变量条件分布中不同分位点上的解释变量对其的影响,且其估计方法与OLS相比对离群值更加稳健,也不要求严格满足正态分布假设[]。

本文中,经过样本的统计发现前20%样本影片的票房合计占到了所有电影总票房的76.84%,因此从条件分布上来看具有较高的偏态性,OLS回归可能因极值影响不稳健且无法刻画全貌。

因此,本文随后进一步采用分位数回归分析票房从低到高的不同分位数下解释变量对因变量可能存在的不同回归系数估计量。

首先,分位数的定义为对于一个随机连续变量y,其小于第τ分位数即y≤y(τ)概率为τ:

(2)

假设由n个解释变量组成的矩阵X线性表示y的条件分位数,基本模型为:

(3)

式3中,xi=(x1i,x2i,…,xni)’为解释向量,β(τ)=(β1,β2,…,βni)’是τ分位数下的系数向量。

分位数回归通常采用加权最小绝对离差和法(WLAD)求解目标函数最小值进行参数估计,展开式即:

(4)

本文由此设定如下分位数回归模型:

其中,τ∈(0,1)代表了所在的分位点,本文中我们选取0.2,、0.4、0.6以及0.8这四个分位点分别对票房影响效应进行考察。

四、实证分析

模型

(1)的参数估计显示,导演及演员的影响力均在1%的水平上显著,二者能够明显增加影片的票房收入大小,并且可以看到演员的影响力大小还要略高于导演的影响力(β2=0.243,β3=0.393)。

导演作为我国目前以导演为中心的的影片制作传统,相比西方制片人为核心制度,其在拍摄,演员任用等方面都有着超越创意范畴的无可撼动的职能和权力[]。

我国目前经过统计进入五亿元票房俱乐部的导演总数为18位,其中既包括例如冯小刚、张艺谋、管虎等大牌知名导演,也包括一些跨界例如董成鹏、陈思诚等新锐导演,大牌知名导演在获奖及提名数量上具有绝对的优势,多年的执导经验可以为影片的质量提供较为有力的保障;而新锐跨界导演则更多是通过原先例如演员、作家、主持人等身份自带强大的粉丝效应,并进一步传播到其所执导的影片关注度之上。

明星影响满足默认的独立信号(default-independentsignal)的特点,Kirmani和Rao(2000)认为默认独立信号便是指无论最后成品是否履行信号所指示的内容,生产者都需要支出额外前期费用的信号[]。

明星对票房影片也主要体现在两方面:

一是获得多次奖项提名的知名演员,其精湛的演技可以提升影片质量,二是演员通过其他方面例如综艺节目、特征魅力等所获得的高人气吸引力。

因此明星强大号召力通过提高消费者对影片的认知以及接受程度,可以较大程度降低影片投资风险[],在一些大制作的影片中,一线明星已然成为高票房保障的必备。

网络口碑总体在5%水平上显著正向影响票房高低。

以豆瓣、时光电影评分为代表的网络口碑成为消费者对包括电影质量、认同接受程度等综合评价的一种量化度量方式,反映出大部分受众群体会参考他人意见对是否观看电影作出相应的抉择。

由于电影的体验性、无形性以及信息的不对称性,消费者很难在观看前甄别其质量水平[],此时往往会通过向专业的口碑网站寻求真实观众评价信息来降低这种感知风险,评分的高低总体上能够显著影响观众的观影决策进而再影响至票房。

技术效果通过5%的显著性水平检验产生较大的正向影响。

我国自2010年引入IMAX巨幕电影技术以来,其高底片分辨率和成像度给予了观众更加清晰宏大的观影体验,以《阿凡达》为代表的国外3D电影在中国市场引发空前的观影热潮再造了电影的艺术形态,也进一步加强了观众由单纯观看电影向体验电影的转变巨大需求。

因此高的技术效果能够迎合观众需求吸引其进影院观看,同时其所对应的票价相比普通2D平均高出10-15元左右,也自然能够提高票房的收入。

想看指数在1%统计水平上显著正向影响票房。

这表明消费者互联网搜索量以及对应片方在影片上映前的宣传能力能够显著提升影片票房。

影片上映前有着诸多不确定性信号,随着新媒体以及互联网的普及,制片方通过在微博和发布会上制造相关热门话题进行推广及公众讨论可以一定程度上消除部分不确定性信号。

从市场营销角度来看,这种网络营销掺杂着部分病毒营销的方式具有纵深性、多维性及交互性,尤其是以互联网为平台的用户自我人际传播运用人为信息节点,分享为特质,快速对受众进行全视角、立体式的宣传覆盖[],吸引其走进电影院实现这种被“吊胃口”式的预期释放。

续集翻拍等IP相比较没有这方面的影片在5%显著性水平上明显能够增加票房收入。

过往研究表明,续集翻拍等受着品牌溢出效应(BrandSpilloverEffect)的影响,产业经济学中通常所定义的溢出效应与“外部性”这一概念相类似,其指一个经济组织在相关领域中的自我行为决策会对外部另一部分人的利益产生损益的情况,而这种损失或者收益都不是相关生产或者消费者等经济主体所获得或者承担的,而是一种附带影响从而推动其他方面的发展[]。

学术界通常用品牌延伸理论及信号理论对其进行解释,Wernerfelt(1988)运用推演博弈模型,认为一些品牌相应延伸产品可以产生信号作用,Moorthy(2012)也在溢出效应的研究基础之上进行改进证实了这一观点[]。

本文认为电影系列作为一种品牌及延伸品,观众会对有着高知名度的母产品可能会存在的相同故事背景、人物等产生某种记忆从而对子产品拥有相似感知性进而发生态度和印象转移到子产品电影之上,这与Sood,Dreze(2006)等人观点相类似[]。

从信号理论上看,续集翻拍电影有着IP等更多的信号可以供观众进行判断,从而减少影片内容等疑虑大大增加影片被选中的概率。

虽然电影上映之后有着口碑网等影评信号,但多数观众为了防止被剧透不会仔细阅读具体内容,因此原有的IP等仍然是最重要的确定性信号源。

在模型2中,在加入电影题材类型的虚拟变量的同时,我们还特地引入了Sequel和Romance以及Tech和Action的交叉项,来分别考察是否为续集翻拍等IP对爱情片影响票房的效应以及动作片对技术效果水平影响电影票房效应。

需要说明的是,在回归中引入交叉项可能会导致模型多重共线性方面的问题,虽然经过膨胀因子检验四者中最大的VIF值为6.26<10,但为了稳健起见,本文仍对上述变量进行中心化(Centering)处理消除共线性。

结果显示,加入题材之后,原先因子的显著性程度基本没有变化,喜剧、魔幻、爱情、动作类型题材对票房都有着较为显著的正向影响,其中喜剧的影响程度最大。

经过上表来看,喜剧可以说是我国电影数量最多的一种题材类型,占到了全样本中接近45%的比例。

在中国传统文化中,“美好”一直是一种自我追求和精神寄托,喜剧片则承载了这方面较多的元素,其次大多数喜剧都是在贺岁档等喜庆的节假日期间上映,对于大多数希望放松压力人来说可以带来轻松愉悦的感受,更深层次的原因还有喜剧“时代变迁”、“与时俱进”的紧跟社会潮流并引发人思考的体现[],所以一些质量较好的喜剧例如《夏洛特烦恼》等总能以小博大较易取得不错票房成绩。

与此相反,我们也可以看到惊悚片则对票房产生了显著负面影响,由于政策、受众群体等各方面原因,惊悚片难以冲破天花板限制只能不断压缩制作成本,并且目前国内这方面题材难以蹭明星热度,剧情又大多老套多为古宅、地窖等,粗制滥造的质量水平自然难以吸引观众群体。

表2交互项均分别在5%和1%显著,这意味着动作片能够显著加强技术效果对影片票房的影响。

拥有IP或者翻拍等影片中,爱情的题材类型对其票房提升能力较强。

首先对于动作片提升技术效果影响力的情况来看,究其原因,可能在于动作片较为丰富吸引人眼球的动作激斗场景可以通过IMAX和3D技术来使得其效应得以扩大,观众们会更加倾向于这种更为强烈的视觉冲击而去选择观看。

IP翻拍等对爱情片的影响,则同样是受到了前文所述的“品牌溢出效应”。

大多数情况下,青春爱情片的主要IP为一些著名作家相应的畅销小说或者如今发展极快的网络文学作品,这些作品在尤其是年轻人这一高消费的群体中受欢迎程度较高,例如郭敬明的《小时代》、近期爆红的顾漫的网络小说《微微一笑很倾城》等,均有着极强的“正向溢出效应”,符合前文所述的品牌延伸理论机制:

有过使用经验的消费者会对原品牌有着特殊印象态度[],这种态度也扩散到了改编的电影等延伸作品中。

(三)进一步分析

1.基于分位数回归的分析

表2中模型(3)的分位数回归可以很好帮助我们了解不同票房分为点解释变量不同的边际影响效应。

根据上表的参数估计结果,绘制各解释变量的效应变化图如下所示:

图1-2各因素边际效应曲线

票价和档期的边际效应总体影响程度都较小,其中票价仅在0.2的分位点上表现出10%的显著性。

原因可能在于冷门电影有着比较固定的一类特殊的小众群体,其并不会受票价高低影响,增加票价可以较明显提升票房收入。

与热门档期重合天数则均不能对各临界点票房大小带来显著影响,根据艺恩咨询的统计,我国电影放映量在各假期黄金档分布较其他档期表现出高密集性,是否是在黄金档期间上映已不再是公众观影抉择的主要依据。

网络口碑对票房的边际效应随着分位点逐渐缓慢降低。

其原因可能在于冷门电影较小成本限制使其容易成为类似于惊悚片为代表的低水准化,此时电影质量高低进而影响到口碑评分大小,在观众决策过程中表现出更大的权重,这种现象证实了Bakos(1997)的观点:

网络口碑的推进可以帮助消费者找到符合他们偏好的非热门产品[]。

直至到最热门的20%电影,口碑评分表现出不显著性,通过样本可以发现我国卖座电影中经常出现高票房低口碑的现象,如《澳门风云3》、《恶棍天使》为代表的在口碑评分中均只有4.3分超低评价的影片,却斩获了6亿以上的超高票房。

针对这一现象,袁爱清(2013)从受众心理机制方面提出动态模型,认为当今电影市场以还没有掌握评判电影主流话语权的年轻人作为主要受众群体,其缺乏对电影辨识度。

因此对于他们而言,口碑重点在于是否极端能否引起规模性的舆论争议,从而引发其特有的猎奇心理带动票房增长。

技术效果在0.2-0.6分位点上为边际效应递增阶段,而在0.6-0.8上显著递减。

票房较低的电影确实可以通过提升放映技术提升票房,但对于卖座电影来说,较多均已实现IMAX或者3D技术的播放,提升空间有限。

想看指数经过对数化处理之后可以表示对影片票房的弹性大小。

可以看到,在0.2-0.6分位点上较为稳定且呈现小幅下降态势,平均每增加1%,票房显著增加0.47%左右。

到了0.8分位点处,弹性及显著性出现大幅降低。

对于卖座电影而言,其本身上映前通过大规模宣传或者其自身的品牌效应已经聚集了大量的社会关注度,进一步想看的期望对票房弹性已经减弱,而对于相对较低票房区的电影却是富于弹性,在影片上映前的营销手段可以明显提升票房。

续集翻拍的边际效应在0.2-0.4分位点平稳之后出现了10%以上水平的显著上升。

这也印证了前文的品牌溢出效应机制,原先较高票房电影的续集以及相应热门IP品牌的电影延伸在卖座电影中有着较强的显著性影响,在冷门电影中这种现象则不明显。

另外,电影的题材分类上来看,除了惊悚片在0.2-0.4分位点有着显著负向影响,其余类型都产生较明显的正向影响,与前文分析的结论相吻合。

2.影响因素的重要性程度分析

神经网络(NeuralNetworks)是目前广泛运用的一种模拟计算系统,可以通过对历史数据的学习进行相应的非线性特质预测,在市场营销领域有着很强的应用性,而基于神经网络的自变量敏感性分析可以衡量的其重要性程度即输入变量对模型输出的影响度大小。

本文采取最常用的多层感知器(MultilayerPerceptron),其采用前馈结构,使用误差反向传播BP算法,将数据从一个方向进入通过输入节点等最后映射到输出的数据集之上。

其拓扑结构组成主要包括一个输入层、一个或多个隐含层、一个输出层,同层神经元之间没有连接,相邻层之间的节点进行两两连接,前一层节点输出信号逐层进入后一层。

根据前文OLS回归结果所得到的显著性自变量共11个作为神经网络的输入神经元,电影票房作为唯一的输出层神经元,按照变量类型分类选取5个作为协变量,其余6个作为因子。

隐含层数的选择方面,Lippman(1989)指出两个隐藏层可以足够表达任何的输出函数,且第二隐藏层的节点数应为输出层的2倍,高维输入时第一隐藏层最佳数量为第二层的三倍。

由于本文中共有11个输入神经元属于高维输入,因此最终确定第一隐含层6个神经元,第二隐含层2个神经元。

为了更准确进行估计,建立一个partition计算变量产生bernoulli分布数据,选取70%作为训练集,30%作为检验集,通过BP不断调整网络连接的权值提高准确率,降低误差平方和以达到输出期望值范围内终止学习。

图3神经网络结构图

输出层的激活函数选择Sigmoid即S型函数,由于其单增以及反函数单增、连续光滑等性质,经常被用作神经网络的阈值函数,具体表达式为:

(6)

由于是是0-1值域内函数,所以需要对训练数据进行归一化处理。

最终结果显示模型汇总得到训练的平方误差和为0.481,预测值的散点图近似为一条直线,残差散点图较均匀的分布在0轴两侧,总体来看,模型的拟合效果较好。

直接观察自变量的重要性数值大小及标准化后

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 工程科技 > 能源化工

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2