数据预处理实验1.docx

上传人:b****6 文档编号:3289853 上传时间:2022-11-21 格式:DOCX 页数:5 大小:15.82KB
下载 相关 举报
数据预处理实验1.docx_第1页
第1页 / 共5页
数据预处理实验1.docx_第2页
第2页 / 共5页
数据预处理实验1.docx_第3页
第3页 / 共5页
数据预处理实验1.docx_第4页
第4页 / 共5页
数据预处理实验1.docx_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

数据预处理实验1.docx

《数据预处理实验1.docx》由会员分享,可在线阅读,更多相关《数据预处理实验1.docx(5页珍藏版)》请在冰豆网上搜索。

数据预处理实验1.docx

数据预处理实验1

 

重庆交通大学信息科学与工程学院

 

实验报告

 

班级:

曙光1701班

 

姓名学号:

 

实验项目名称:

数据导入与预处理实验一

 

实验项目性质:

验证性、设计性

 

实验所属课程:

《数据导入与预处理》

 

实验室(中心):

语音楼八楼

 

指导教师:

 

实验完成时间:

2019年11月1日

 

一.实验目的

 

1.了解和掌握数据库的恢复,数据库数据的变换,数据的统计以及可视化;掌握Json数据集的API下载方法,数据提取,以及导入其他数据结构的方法。

 

2.了解和掌握不同数据格式之间的转换方法;掌握用计算机编程语

 

言实现数据的格式转换以及数据信息的提取。

 

二.实验要求

 

1.安装Mysql数据库,以及mysqlworkbench客户端,

 

2.下载对公众开放的安然(Enron)公司的电子邮件数据集。

下载地址:

 

3.在mysql中恢复Enron数据库。

 

4.数据统计每一天和每一周发邮件的数量,并用可视化软件实现可视化。

 

5.采用iTunesAPI做个小实验,利用关键词来生成JSON数据结果集。

 

iTunes是由Apple公司提供的一个音乐服务,任何人都可以利用

 

iTunes服务来查找歌曲、艺术家和专辑。

在查找的时候需要把搜索关

 

键词添加到iTunesAPIURL的后面。

URL中,=后面的是搜索关键词,

 

是一个乐队的名字,theGrowlers。

注意:

URL中用+代替空格字符,

 

URL不允许包含空格字符。

 

iTunesAPI会根据提供的关键词从音乐库中返回50个结果。

整个结果集形成一个JSON文件,每一条音乐信息中的元素,以名字-值的格式存放在JSON文件中。

 

TheGrowlers

 

AppleiTunes的开发文档:

 

6.使用一种熟悉的语言,编写程序,将下载下来的theGrowlers的

 

所有音乐的歌名提取出来,并可视化显示。

 

三、需求分析

 

1.提取出安然公司数据集中的每天的阅读量和每周的阅读量,并画出趋势图

 

2.提取出iTunes中的trackname数据

 

四、实验过程

 

1.安装好Mysql和MysqlWorkbench

 

2.建立一个新的数据库:

 

3.打开cmd,进入MySQL:

 

查看数据库:

 

4.下载好安然公司的数据集

 

5.选用enron数据库,在Mysql中导入安然公司的数据集到数据

 

 

6.在MysqlWorkbench中查看已经创建好的数据库

 

7.用SQL语言查找每天的订阅量(1999年到2017年)

 

8.并导入excel画图

 

excel文件如下:

 

再用TableauPublic2019.2,绘制图形,如下图所示:

 

9.用sql语言查找每周的订阅量

 

10.并导入excel画图

 

11.下载iTunes数据集,下载结果为文本文件

 

12.以文本文件格式打开,如下图:

 

将后缀名改为.Json:

 

13.用python将json格式文件中的Trackname提取出来

 

14.打开jupyter,编写代码

 

15.结果如下

 

五、总结

 

通过此次实验,了解和掌握数据库的恢复、数据库数据的变换、数

 

据的统计以及可视化;掌握Json数据集的API下载方法,数据提取,

 

以及导入其他数据结构的方法;还有就是了解和掌握不同数据格式之

 

间的转换方法;掌握用计算机编程语言实现数据的格式转换以及数据

 

信息的提取。

了解了mysql的安装以及一些基本的sql操作。

例如数

 

据库的创建、基本的查询功能,数据库sql文件的导入等。

同时对于

 

可视化软件Tableau也更加熟悉了,能够根据查询结果绘制散点图,

 

折现图,更好的将数据规律展现出来。

这在很大程度上提升了自己的

 

独立解决问题能力。

此次实验使我获益良多。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1