IMDb互联网电影资料库Word文档下载推荐.docx
《IMDb互联网电影资料库Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《IMDb互联网电影资料库Word文档下载推荐.docx(29页珍藏版)》请在冰豆网上搜索。
网络信息服务
公司性质:
线上电影、电视和电子游戏数据库
持有者:
亚马逊公司
创始者:
柯尔·
尼德罕
提供信息
IMDb上有丰富的电影作品信息,包括影片演员、导演,剧情,影评这类的基本信息,也有更深层的内容,比如影片相关的琐事花絮,片中出现的漏洞,影片音轨,屏幕的高宽比,影片的不同版本等等。
演员,导演,作者和其他工作人员都在数据库中有自己的条目,其中列出他们参加过的影片,通常还有他们的传记。
用户还可以在akas.imdb.com找到那些在不同语言不同国家发行时使用了不同片名的电影。
其他资源
IMDb不只是电影和电子游戏的数据库,还提供每日更新的电影电视新闻,以及为不同电影活动比如奥斯卡奖推出特别报道。
IMDb的论坛也十分活跃,除每个数据库条目都有留言板之外,还有关于多种多样的主题的各种综合讨论版。
IMDb扩展出来的姐妹站IMDbPro为专业人士提供额外的信息,如电影业界人士的联系方式,电影活动日期表等等。
IMDbPro不是专门为普通大众设计服务的,内容也不是免费的。
使用方法
任何人只要有电子信箱并使用接受Cookie的Web浏览器就可以在IMDb上建立帐户,提交信息和对参加各种主题的投票。
针对自动化查询的需求,数据库的大部分都能以压缩的文本文件格式下载,并用提供的工具解压(通常在命令行进行)。
发展历史
1989年时,ColNeedham和其他人在Usenet新闻组rec.arts.movies电影和交换信息。
他们创作了一个常见问题解答列表(FAQ),包含演员,导演和已经去世的电影制作者的传记。
在1990年末,他们的FAQ已经收录了将近10,000部电影和电视剧。
在1990年10月17日,Needham发布了一套UNIX的Shell脚本,该脚本可以搜索这4个FAQ,IMDb也由此诞生,不过那时的名字是rec.arts.movies电影数据库。
到了1993年,数据库已经扩展到包括琐事花絮,传记,影片情节等内容,还带有一个集中的电子邮件界面,用于搜索该数据库。
当年晚些时候,IMDb被移到了万维网上(当时还处在婴儿期的网络)。
数据库被放置在威尔士加的夫大学的计算机科学系的服务器]上。
最初的网页界面作者是RobHartill。
在1994年,扩展了的电子邮件界面开始接受自动数据提交,人们不必再给指定的维护人员发信而间接提供新内容了。
这些年里,数据库在连接着世界各地镜像的网络上靠捐赠的带宽运行。
在1995年,这个项目发展到了如此之大,对ColNeedham和其他的志愿者来说,依靠捐款和他们的空闲时间来维护它的运行已经明显不太可能了。
1996年,成立商业公司的决定被作出,IMDb在英国注册成为互联网电影数据库公司。
维护数据库的人们成为其股东,依靠广告,许可证和合作获得利润。
这种状态持续到1998年。
数据库每时每刻都在成长,再一次到达了关键的时刻;
利润被用在设备上,股东们很难接受辛苦劳动却只能得到很少收入的事实。
一些大公司出价试图收购数据库,然而IMDb的股东们不肯轻易将其出售给无法保证继续免费提供其信息的其他企业。
就在这时,亚马逊的杰夫·
贝索斯出现了。
达成的交易是,IMDb得到了为股东们提供应有收入的资金,而Amazon.com可以在出售其DVD和录像带时使用IMDb的信息资源。
IMDb的功能继续不断扩展,2002年新增了针对娱乐界专业人士的IMDbPro,提供多样的服务,包括电影制作和票房详细资料,以及电影公司目录。
订阅的价格是每月$12.95,或每年$99.95(2005年4月5日价格)。
评分方式
以《魔戒1:
护戒使者》具体分析。
图1为魔戒1的所有评分者的分数的一个条状统计图。
图1
从中我们可以看到各个分数段的大致比例,比如这儿就可以发现,超过一半的人是打满分的。
图下面有两个分值,一个是算术平均值(arithmeticmean),一个是中值(median)。
算术平均值大概就是平均数,中值是统计学中的中间数值,该值和比它大及比它小的数值是等差的。
而最后我们查到的分数却既不是算术平均值,也不是中值。
IMDB的分数的计算方法应该不是就做一下平均就ok了,在它的网页上也提到了它的计算方法是保密的。
不过imdbtop250用的是贝叶斯统计的算法得出的加权分(WeightedRank-WR),公式如下:
weightedrank(WR)=(v÷
(v+m))×
R+(m÷
C 其中:
R=averageforthemovie(mean)=(Rating)(是用普通的方法计算出的骄?
郑?
br>
v=numberofvotesforthemovie=(votes)(投票人数,需要注意的是,只有经常投票者才会被计算在内,这个下面详细解释) m=minimumvotesrequiredtobelistedinthetop250(currently1250)(进入imdbtop250需要的最小票数,只有三两个人投票的电影就算得满分也没用的) C=themeanvoteacrossthewholereport(currently6.9)(目前所有电影的平均得分) 另外重点来了,根据这个注释:
note:
forthistop250,onlyvotesfromregularvotersareconsidered. 只有'
regularvoters'
的投票才会被计算在IMDBtop250之内,这就是IMDB防御因为某种电影的fans拉票而影响top250结果,把top250尽量限制在资深影迷投票范围内的主要方法。
regularvoter的标准不详,估计至少是“投票电影超过xxx部以上”这样的水平,搞不好还会加上投票的时间分布,为支持自己的心爱电影一天内给N百部电影投票估计也不行。
因此,细心的人可以注意到,列入IMDBtop250的电影,其主页面上的分数与250列表中的分数是不同的。
以魔戒1为例,它在自己的页面中的分数是8.8,而列表中是8.7。
一般250表中的得分都会低于自己页面中的得分,越是娱乐片差距越大。
这大概是因为regularvoter对于电影的要求通常较高的关系。
) 而IMDB的过人之处不仅仅在于这儿,它除了给出分数,还给了一个更详细的投票人的列表(图2) 这个chart根据年龄、性别、国别等不同的情况,列出了不同的分数chart。
而且你点击每个选项,上面(就是图一)都会出现一个不同的chart。
这个其实是比较有用的。
比如你在要选择动画片的时候,就应该点选一下小于18岁,或者30-44岁这个选项看看他们的评分,因为他们才是这部电影的最大观众群,其他人的分数都是仅供参考的。
碟报员或者我们在选择影片的时候,可以不仅仅看个总得分,多花一点时间,看看影片各个年龄段的得分会更有帮助的。
有些影片我们觉得不好看,但是分数很高,你也可以参照一下,“ususers”和“non-ususers”这部分的数据,如果美国投票用户远远大于海外用户,那说明此片的确是有相当重的美国文化底蕴的,不觉得好看也是正常。
相反的,如果我们觉得不错,但是IMDB的分数很低,这也许是老美的评分人数多,打的分低,就把总分给拉下来了。
从魔戒1的得分截图可以发现这部影片的确是各个年龄阶段都很喜欢,分数都打的很高的。
250强影片
250佳片是IMDb很受欢迎的特色,里面列出了注册用户投票选出的有史以来最佳250部电影。
只有供影院播出的影片可以参加评选,而短片,纪录片,连续短剧和电视电影不在其列。
用户在从"
1"
(最低)到"
10"
(最高)的范围内对影片评分。
得分经过数学公式(登在列表末尾)的过滤而生成最后的评定。
为了保护结果不受恶意投票的影响,数据库使用了数据过滤机制以及最小投票数量限制(目前为1250票),以得到“真实的贝叶斯概率结果”。
并且,只有“经常投票的用户”的投票被记入结果,为保护公平性,成为该类用户的条件是保密的。
该榜因其综合广泛性以及不时的令人吃惊而受到瞩目。
上榜的电影中有老电影比如大都会(Metropolis,1927年),也有新电影如盗梦空间(Inception,2010年)。
有流行影片比如得到超过32万次投票的魔戒首部曲:
魔戒现身(TheFellowshipoftheRing,2001年),也有少有人问津的影片如不到1万张投票的小私家侦探(SherlockJr.1924年)。
排行榜包括了各种不同类型的电影如黑色影片双重保险(DoubleIndemnity,1944年);
科幻片银翼杀手(BladeRunner,1983年);
音乐片雨中曲(Singin'
intheRain,1952年);
西部片黄金三镖客(Ilbuono,ilbrutto,ilcattivo.1966年);
动画片机器人总动员(WALL·
E,2008年)等等。
榜上还有一些影片是本身并未大受好评但却在专注的影迷群体中有广泛的追随者的比如死亡幻觉(DonnieDarko,2001年)。
迄今为止肖申克的救赎(台湾译名为"
刺激1995"
)、教父、教父2为排名前三的电影,也是榜上仅有的评分超过9.0的影片。
这些条件是否能提供一个公正没有偏见的排行榜是有争议的。
比如,新近上映的影片总是容易从一见钟情的影迷那里得到较高的评分,而这与成功影片应该经得起反复观赏的观念是不相符的。
因此,有时新上映的影片冲进250最佳影片榜,甚至前100名,但随着更多观众的评分和重复观看后的评分而退出榜外的情景就十分常见了。
另外一种对该榜的主要批评则是它反映的只是影片的受欢迎程度,并不体现对影片历史和艺术的客观知识。
但实际上,在评论家年度评选和历史影片评选中名列前茅的影片通常在最佳250部影片中通常也都排名很高,让人不禁怀疑影评人与观众的观点是否真有那么不同。
在IMDb上还有最差的100部影片榜,用基本相同的方法投票产生。
IMDBTop250电影列表(2012年04月30日更新)
IMDBTop250电影列表文字版
名次
得分
年代
电影名称
票数
1.
9.2
1994
肖申克的救赎/刺激1995(台)/月黑高飞(港)
748,732
2.
1972
教父
558,518
3.
9.0
1974
教父:
II/教父续集/教父2
352,435
4.
8.9
低俗小说/黑色追缉令(台)/危险人物(港)
589,410
5.
1966
黄金三镖客/黄昏三镖客(台)/独行侠决斗地狱门(港)/善恶丑
233,531
6.
1957
十二怒汉
183,776