电影评分关联因素分析报告2222.docx

上传人:b****5 文档编号:28591048 上传时间:2023-07-19 格式:DOCX 页数:12 大小:440.62KB
下载 相关 举报
电影评分关联因素分析报告2222.docx_第1页
第1页 / 共12页
电影评分关联因素分析报告2222.docx_第2页
第2页 / 共12页
电影评分关联因素分析报告2222.docx_第3页
第3页 / 共12页
电影评分关联因素分析报告2222.docx_第4页
第4页 / 共12页
电影评分关联因素分析报告2222.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

电影评分关联因素分析报告2222.docx

《电影评分关联因素分析报告2222.docx》由会员分享,可在线阅读,更多相关《电影评分关联因素分析报告2222.docx(12页珍藏版)》请在冰豆网上搜索。

电影评分关联因素分析报告2222.docx

电影评分关联因素分析报告2222

电影评分关联因素分析

——《商业智能方法与应用》课程报告

一.问题分析

电影是现代艺术中很重要的一个元素,同时也牵连很大的经济元素,除此之外,电影也是我们大学生活中很重要的娱乐方式。

所以我们也就选择了电影作为我们研究性学习的题目,我们这次的研究性学习主要研究电影评分的影响因素,研究中观影的评价和评分我们主要锁定在豆瓣网,这样也就增加了研究的针对性。

二.数据来源

MetaSeeker分为MetaStudio和DataScraper两个工具包,只能在火狐浏览器里在线使用.

1)首先在MetaStudio里解析网页结构

2、在地址栏输入要解析的网址

结果为:

 

3、在工作台输入你定义的主题和要抓取的信息属性

 

4、通过点击网页电影名的位置获取结点,并把此节点的文本内容映射到电影名里

 

5、同理可以获得导演、主演、类型和评分的信息

 

6、通过定位后页作为线索继续抓取数据

 

7、在输出信息里可以看到抓取的信息

 

2)通过DataScraper提取数据

1、数据情况

 

2、在本机里就可以得到提取的数据文件

 

3、整理数据文件

三.使用工具

数据挖掘工具的使用:

WEKA、KNIME、Splunk、SPSSClementine等。

四.思路方法

1、整理后发现导演和主演都太过分散,没有意义,所以对影片类型进行分析。

2、得到这样的布尔矩阵形式

3、在spss里利用apriori算法建立这样的模型进行关联分析

4、把不属于T/F格式的字段过滤掉

5、得到干净数据矩阵

6、生成结果——剧情类电影会更受欢迎

五.结果分析

网状图也清晰地表明了剧情类电影更受好评。

六.小组成员

胡雨灿

肖钰田

乔梓

 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 法律资料

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1