电影票房影响因素分析.docx
《电影票房影响因素分析.docx》由会员分享,可在线阅读,更多相关《电影票房影响因素分析.docx(12页珍藏版)》请在冰豆网上搜索。
电影票房影响因素分析
电影票房影响因素分析
—以中国内地票房数据为例
【摘要】本文通过计量经济学上统计分析方法的应用,并结合2007-2009年的中国内地电影票房数据,对影响电影票房的因素进行了一系列的分析和检验,最终推出电影票房影响因素分析模型,并在此基础上对即将上映的电影进行了票房的预测,以验证模型的实际有用性的大小,在影响电影票房的因素选择上面,由于自身资源的有限,有些因素没有放到模型里面,这可能会导致最终模型跟实际的存在一些偏差,对此,期待各位的指正。
【关键字】电影票房、影响因素、模型检验、票房预测
Factorsaffectingthefilmboxoffice
—BasedontheDataoftheChinesemainlandboxoffice
Abstract:
Inthispaper,withtheapplicationofstatisticalanalysisineconometrics,combinedwiththedataofChinesemainland2007-2009filmboxoffice,Iwilldoaseriesofanalyzesandtestingonfactorsaffectingthefilms,thenlaunchtheboxofficeinfluencingfactorsmodel,andpredicttheboxofficeoftheupcomingmoviewiththismodel.Soastoverifytheactualusefulnessofthemodel,duetothelimitedresource,somefactorsarenotincludedinthemodel,leadingtosomedeviationsbetweenthismodelandtheactualone,so,gratefullywelcomeyourcorrections.
Keywords:
filmboxofficeinfluencingfactorsmodeltestingBoxofficepredictions
一、课题背景、选题原因及课题意义分析2
课题背景2
选择本课题的原因2
课题的目的和意义2
二、影响因素分析和解释变量的甄选2
影响因素分析2
解释变量的甄选3
三、数据来源和收集4
数据来源4
数据收集整理4
四、模型的构建5
五、回归分析和模型的检验、修正5
1)回归分析5
2)多重共线性的检验—方差膨胀因子VIF6
3)遗漏变量7
4)不相关变量7
5)序列相关检验—德宾-沃森d检验8
6)异方差检验—怀特检验(Whitetest)9
六、模型的运用和票房预测《波斯王子·时之刃》10
七、总结11
八、参考资料12
一、课题背景、选题原因及课题意义分析
课题背景
1、随着现代化建设的发展,中国城乡居民收入水平显着提高,精神、文化生活伴随着物质生活水平的提高也日益成为广大城乡消费者追求的目标,以往只有少数人才可以看到的影视作品现在已经成为大宗消费品,遍布各大中小城市,成为人们精神生活的寄托以及茶余饭后的谈资,电影作品已经成为一种潮流文化的象征,日益丰富着我们日常的生活。
2、需求拉动生产,影视作品的数量每年都以惊人的速度增长,影视业的竞争也因此日益增大,制片公司要想生存下去,票房是关键,一部电影的失败就可以葬送一间公司,于是,了解票房的影响因素,通晓市场的偏好,生产大众喜欢的影片,努力为一部电影上市造势,已经成为制片公司的当务之急。
选择本课题的原因
1、影视是一个跟我们的生活息息相关的话题,对它进行深入的研究有助于我们更好地了解生活,另外,影视作品也是我日常生活中比较关注的领域,选择自己喜欢的领域进行研究,有助于在研究过程中保持热情,把项目做得更好;
2、目前学术界里做这个课题的学者很少,这样的话我研究起来会相对自由很多,具有更高的灵活性,毕竟没有来自权威的压力,而且,之前的学者做过的研究,在周密性方面还比较欠缺,课题还有很大的发展空间,于是结合两点,最后选择本课题。
课题的目的和意义
通过研究,找出影响电影票房的因素到底有哪些,并进一步找出它们与电影票房的内在统计关系,为影视公司推出一部电影时的决策提供一些参考,同时可以锻炼自己的分析思考能力以及动手能力,而且,弄清楚哪些因素对票房影响很大而又不能真实反映电影质量,将来自己做决策决定要不要看一部电影的时侯也可以有意识地规避这些因素,从而使决策更有效,不至于花钱花时间去看一部没有价值的的电影了。
二、影响因素分析和解释变量的甄选
影响因素分析
影响电影票房的因素很多,比如说影片自身的质量、影片的排档期、导演、演员的知名度、上映期间的社会环境、天气、海报、预告片质量、放映的场数、票价、是否为续集、进口的还是本国生产的,故事情节、投资、同期竞争影片数量、还有是不是3D的等等。
影响因素很多,不大可能全部放进来研究,下面筛选出几个个人认为相对来说比较重要的用作进一步的研究。
解释变量的甄选
1、预告片评分(G)。
这应该是一个很重要的影响因素,因为观众选择是否去观看一部电影之前,总会上网了解一下这部电影的大体结构、场面、情节等到底是怎么的,在这里,预告片的质量起了很关键的作用,预告片做得漂亮,有吸引力,到时去观看的观众就多,反之则少,而这直接影响到最后票房的大小,所以在此将预告片的评分作为一个解释变量;
2、海报画面效果(H)。
除了预告片之外,观众的决策还经常会受到贴在大街小巷的电影海报的影响,海报画面做得精致,有感染力,到影片上映时跑去观看的人就多,电影票房也就高了,于是也将它作为一个解释变量放到模型里面;
3、与首映的时间差(S)。
由于在中国内地上映的电影有很大一部分是从外国进口来的,而电影在两地上映的时间通常都是不同步的,于是就会产生一个上映时间差的问题,或许在过去,有没有时间差都不会影响外国电影的票房,但是现在乃信息时代,互联网技术发达,一部电影从首映那一刻开始,不用多长时间就可以从网上下载来看了,于是在这个过程中就会流失掉一部分买票去看电影的观众,因而降低了电影票房,而且由于电影信息自身的时效性,如果一部电影发布信息之后长久都不上映,观众的热情就会慢慢丧失掉了,等到电影真的上映的时候,观众早就将它忘了,于是电影票房也就大打折扣,所以,这个上映的时间差也应该作为一个解释变量放到模型里面;
4、观众对导演的评分(D)。
虽然至今仍然不清楚导演对影片票房的成功作用到底有多大,但是如果没有导演,一部电影最终也不会出现在观众的面前,票房高的电影初步认为趋向于是由总体评分比较高的导演拍出来的,所以导演也应该是一个重要的影响票房的因素,也放到模型中进行检验。
5、观众对主演的评分(Z)。
主观上认为观众是否选择去看一部电影的时候会考虑这部电影是不是由着名演员主演的,是的话就去看,不是的话就不去,但到底这种影响是不是真的很明显,暂时不大清楚,不过本人认为它应该算是一个重要的变量,起码我自己看电影的时候首先看的是有没有我喜欢的演员参演,有的话就会选择去看,因此也将它加入到模型的检验里面;
6、续集(X)。
绝大多数情况下,只有好的电影才会拍续集,这就给观众传达一个信息,上一部电影拍得不错,这部电影的质量应该也不错,值得去看,于是,一部电影是不是续集也就成了一个很重要的票房影响因素,在这里续集用虚拟变量表示,1表示该电影是续集来的,0则表示不是续集;
除此之外,可能还有很多的影响因素,不过由于自己掌握到的信息有限,所以暂且使用以上六个作为解释变量来进行模型的设定。
三、数据来源和收集
数据来源
1、电影票房数据。
在这个模型中,应变量是在中国内地上映的电影的票房(B)其中07年电影33部,08年电影51部,09年电影22部,总共106个样本。
数据来源于以下的外国网站,这是一个专门进行票房统计的网站,数据比国内的网站要准确很多。
电影票房数据来源
2、预告片评分(G)、海报画面效果评分(H)、导演评分(D)、主演评分(Z)。
的数据来自于时光网上网民的评分()。
3、与首映的时间差(S)。
数据同样来自于时光网,结合影片首映和在中国内地上映的时间,整理得出时间差s,亦即延缓上映的时间。
4、影片是否为续集(X)的信息大部分来自于时光网
5、此外,收集数据过程中还参考了以下网站:
IMDB:
未来影视网:
中国影视库:
数据收集整理
四、模型的构建
根据之前的分析以及收集到的数据,我初步建立如下的线性方程形式:
B=β0+β1G+β2H+β3S+β4D+β5Z+β6X+ε
B:
电影票房(百万美元)
G:
预告片的评分(十分制)
H:
海报评分(十分制)
S:
与首映的时间差,即延缓上映时间
D:
观众对导演的评分(十分制)
Z:
观众对主演的评分(十分制)
X:
续集(虚拟变量,1表示续集,0表示不是续集)
五、回归分析和模型的检验、修正
1)回归分析
使用SPSS对收集到的数据进行回归分析和F检验、t检验,结果如下
结合上表,我们初步得出方程如下:
F检验的f值为,取5%的显着性水平,可以发现回归系数在总体上的检验是显着的。
模型调整的判定系数为,拟合度不算很高,但总体上还不是很差。
在5%的显着性水平上对方程
(1)的系数进行假设检验,得出如下结论:
通过上表发现,观众对导演以及演员的评分的系数的t检验不显着,而且β5还有非预期的符号,这个检验结果可能是由于遗漏变量、不相关变量或多重共线性造成的。
下面我们将对此进行检验。
2)多重共线性的检验—方差膨胀因子VIF
通过SPSS计算各个变量的VIF后发现它们的取值都较小,小于严重多重共线性的指标VIF>5,所以本人认为模型中不存在显着的多重共线性。
3)遗漏变量
方程中自变量的数目已经很多,而且其他的变量的数据获取很困难,就算拿到了也可能存在极大的误差,所以在这里不考虑遗漏变量的影响,虽然这样会降低方程的准确性,但是在信息有限的情况下,这未尝不是一种选择方法。
4)不相关变量
方程中的观众对导演、演员的评分可能都是不相关变量。
下面用模型设定的四个准则进行检验。
1、理论:
将观众对导演、主演的评分从模型中剔除掉是合理的:
评分高的导演拍出的电影票房通常都比较高,但是也有很多的败笔;而且还有很多票房高的电影不是评分高的导演拍出来的(收集数据过程中发现的规律),这样一来,对导演评分的意义就不大了。
对于演员,现在几乎每一部电影(不管成败)都有明星参加演出,他们获得的总体评分都很高,几乎没什么差异,于是这个变量在模型设定中也就没有意义了,何况,不同人的喜好不同,如果自己不喜欢一个人,哪怕他的评分再高,自己还是不会去看他拍的电影,另外就是,经过了二三十年的发展之后,娱乐圈里面可谓明星如云,但到底谁才是真正的明星,这个不好说,结合以上分析,将导演、演员评分踢掉理论上是合理的;
2、t检验:
可能的不相关变量的t值分别是-和,对于,在任何的显着性水平上都是不显着的,而对于-,在我们正常使用的显着性水平内也是不显着的,而且排除他们后其他变量的t值都变得显着了,于是排除他们;
3、调整的R方:
排除变量后,调整的R方增大了(虽然只是增大一点),表示现在的
方程比之前的拟合得更好了,被排除的变量多多少少是不相关的;
4、偏误:
分别排除或者同时排除掉观众对